Authors | سیدمحمد رضوی,علی میری,اسماعیل میری |
---|---|
Journal | رایانش نرم و فناوری اطلاعات-Journal of Soft Computing and Information Technology |
Page number | ۶۰-۷۲ |
Serial number | ۱۰ |
Volume number | ۳ |
Paper Type | Full Paper |
Published At | ۲۰۲۱ |
Journal Grade | Scientific - research |
Journal Type | Typographic |
Journal Country | Iran, Islamic Republic Of |
Journal Index | isc |
Abstract
در این مقاله روشی شورایی برای بازشناسی زیرکلمات تایپی فارسی ارائه میشود. ابتدا فضای جستجو با استفاده از چند ویژگی ساده به تعداد خیلی کم از زیرکلمات محدود میشود. سپس با ترکیب شش طبقهبند پایه با روش رای گیری وزندار زیرکلمه بازشناسی میشود. یک طبقهبند پایه همان محدود کننده فضای جستجو است. چهار طبقهبند پایه از روش نزدیکترین همسایگی و به ترتیب با ویژگیهای مکان مشخصه، ناحیهبندی، تعداد تقاطع عمودی متن و زمینه و DCT استفاده میکنند. در یک طبقهبند دیگر با استفاده از حاصل ضرب تصاویر نرمالیزه زیرکلمه ورودی و زیرکلمات محدود شده آموزشی یک میزان شباهت برای هر زیرکلمه آموزشی بدست میآید و با آن بازشناسی را انجام میدهد. سپس زیرکلمه نهایی در یک فرایند رای گیری وزندار که وزنهای بهینه آن توسط الگوریتم هوشمند بدست میآیند از بین این گزینهها انتخاب میگردد. این روش برای قلم لوتوس آزمایش شده و نرخ بازشناسی 98.34% برای دادههای آزمون بدست آمده است.
tags: بازشناسی، تایپی، شورایی، زیرکلمات، رایگیری، فارسی.