رویکرد نوین undersampling مبتنی بر چگالی برای متعادل سازی مجموعه داده های نامتعادل

نویسندگانحمید سعادت فر,سیما میابادی
همایشسومین کنفرانس ملی پژوهش‌های نوین در مهندسی و علوم کاربردی
تاریخ برگزاری همایش۲۰۲۱-۰۹-۰۶
محل برگزاری همایشبروجرد
شماره صفحات۰-۰
نوع ارائهسخنرانی
سطح همایشداخلی

چکیده مقاله

چکیده: در این مقاله یک الگوریتم با رویکرد undersampling برای مجموعه داده های نامتعادل ارائه شده است. مجموعه ای را نامتعادل گویند که تعداد نمونه های یک کلاس (کلاس اقلیت) نسبت به سایر کلاس ها (کلاس اکثریت) خیلی کمتر باشد. کلاس اقلیت، کلاس مورد علاقه برای یادگیری می باشد. راه حل های سطح داده که به دو رویکرد کلی oversampling و undersampling تقسیم می شوند، از راه های مقابله با عدم تعادل می باشند. الگوریتم پیشنهادی داده های موجود در مناطق پرچگال را با تبدیل به داده هایی جدید با تعداد کمتر، سبب کاهش داده در کلاس اکثریت و رسیدن به تعادل دلخواه می شود. برای ارزیابی پیشنهاد ارائه شده، الگوریتم پیشنهادی و 6 روش مشهور را بر روی 10 مجموعه داده با حجم و نرخ عدم تعادل متفاوت اجرا و توسط طبقه بند KNN ارزیابی می شوند. معیار ارزیابی مورد بررسی، sensitivy می باشد. الگوریتم پیشنهادی به نسبت دیگر الگوریتم ها نتایج چشمگیری در این معیار ارزیابی داشته است .

لینک ثابت مقاله

کلید واژه ها: مجموعه داده نامتعادل ، undersampling ، چگالی.