نویسندگان | سیدمحمد رضوی,علی میری,اسماعیل میری |
---|---|
نشریه | رایانش نرم و فناوری اطلاعات-Journal of Soft Computing and Information Technology |
شماره صفحات | ۶۰-۷۲ |
شماره سریال | ۱۰ |
شماره مجلد | ۳ |
نوع مقاله | Full Paper |
تاریخ انتشار | ۲۰۲۱ |
رتبه نشریه | علمی - پژوهشی |
نوع نشریه | چاپی |
کشور محل چاپ | ایران |
نمایه نشریه | isc |
چکیده مقاله
در این مقاله روشی شورایی برای بازشناسی زیرکلمات تایپی فارسی ارائه میشود. ابتدا فضای جستجو با استفاده از چند ویژگی ساده به تعداد خیلی کم از زیرکلمات محدود میشود. سپس با ترکیب شش طبقهبند پایه با روش رای گیری وزندار زیرکلمه بازشناسی میشود. یک طبقهبند پایه همان محدود کننده فضای جستجو است. چهار طبقهبند پایه از روش نزدیکترین همسایگی و به ترتیب با ویژگیهای مکان مشخصه، ناحیهبندی، تعداد تقاطع عمودی متن و زمینه و DCT استفاده میکنند. در یک طبقهبند دیگر با استفاده از حاصل ضرب تصاویر نرمالیزه زیرکلمه ورودی و زیرکلمات محدود شده آموزشی یک میزان شباهت برای هر زیرکلمه آموزشی بدست میآید و با آن بازشناسی را انجام میدهد. سپس زیرکلمه نهایی در یک فرایند رای گیری وزندار که وزنهای بهینه آن توسط الگوریتم هوشمند بدست میآیند از بین این گزینهها انتخاب میگردد. این روش برای قلم لوتوس آزمایش شده و نرخ بازشناسی 98.34% برای دادههای آزمون بدست آمده است.
tags: بازشناسی، تایپی، شورایی، زیرکلمات، رایگیری، فارسی.