کاهش فضای جستجو در بازشناسی زیرواژگان تایپی فارسی با استفاده از موقعیت نقاط و علائم

نویسندگانسیدمحمد رضوی,اسماعیل میری,ناصر مهرشاد
نشریهپردازش علائم و داده ها
شماره صفحات۱۰۱-۱۱۶
شماره سریال۱۶
شماره مجلد۳
نوع مقالهFull Paper
تاریخ انتشار۲۰۲۰
رتبه نشریهعلمی - پژوهشی
نوع نشریهچاپی
کشور محل چاپایران
نمایه نشریهisc

چکیده مقاله

در این مقاله با استفاده از روشی ساده، اما کارا سعی شده دامنه جستجوی زیرواژگان به‌شدّت کاهش یابد. در گام آموزش، داده‌های آموزشی بر‌اساس موقعیت علائم گروه‌بندی می‌شوند، در گروه‌هایی که تعداد عناصر بیش از ده زیرواژه است، برای کاهش فضای جستجو با توجه به تعداد عناصر گروه، با استخراج ویژگی‌های ساده‌ای از پروفایل‌های افقی و عمودی خوشه‌بندی صورت می‌گیرد. در مرحله بازشناسی در نخستین مرحله با تعیین نسبت پهنا به ارتفاع زیرواژه (با علائم و بی‌علائم) و کد موقعیت نقاط و علائم، دامنه جستجو به زیرواژگانی با این کد موقعیت که در محدوده‌ای از نسبت‌های یاد‌شده باشند، محدود می‌‌شود؛ در‌صورتی‌که تعداد زیرواژگان محدود‌شده در این مرحله کمتر از ده باشد، این محدوده پذیرفته و در غیر این‌صورت در مرحله بعد با استخراج ویژگی‌های ساده‌ای از پروفایل‌های افقی و عمودی فضای جستجو به تعدادی از نزدیکترین خوشه‌ها به این زیرواژه که شرط نسبت پهنا به ارتفاع را نیز ارضا کنند محدود می‌‌شود. با اعمال روش پیشنهادی این مقاله فضای جستجو تا حد قابل قبولی کاهش یافته است.

لینک ثابت مقاله

tags: بازشناسی، زیرواژگان تایپی فارسی، کاهش فضای جستجو، موقعیت نقاط و علائم