دسته‏ بندی داده‏ های نامتوازن ریزآرایه DNA مبتنی بر یادگیری گروهی و الگوریتم بهینه ‏سازی ازدحام ذرات دودویی
Paper ID : 1088-ICTCK (R2)
Authors:
1داود شریعت پناه *, 2مهرداد جلالی, 2جواد مهدوی
1دانشجو
2کمیته علمی
Abstract:
امروزه دسته‌بندی داده‌های ریزآرایه DNA در زمینه تشخیص مؤثر و پیش‌بینی درمان انواع بیماری‌های زیستی ازجمله انواع سرطان‌ بسیار پرکاربرد است. یکی از ویژگی‏های داده‏های ریزآرایه DNA توزیع نامتوازن تعداد نمونه‏ها در کلاس‏ها است. این عدم توازن به‌شدت عملکرد پیش‌بینی کلاس اقلیت را تحت تأثیر قرار می‌دهد و موجب ارزیابی نادرست عملکرد دسته‌بندی می‌شود.
در این مقاله، جهت مواجهه با مشکل عدم توازن داده‌های ریزآرایه، یک روش یادگیری گروهی مبتنی بر ترکیب روش Bagging و الگوریتم بهینه‌سازی ازدحام ذرات دودویی ارائه‌شده است. در روش ارائه‌شده ابتدا با استفاده از یک روش انتخاب ویژگی سریع و کارآمد تحت عنوان mRMR ویژگی‌های زائد و افزونه را حذف می‌کنیم. سپس، با به‌کارگیری الگوریتم بهینه‌سازی ازدحام ذرات دودویی، زیرمجموعه‌های نمونه بهینه را از کلاس اکثریت انتخاب می‌کنیم و از آن‌ها جهت تولید دسته‌بند‌های پایه متنوع و دقیق در روش Bagging بهره می‌بریم. همچنین جهت اجتناب از مشکل وزن دهی اهداف در مسأله بهینه‌سازی چندهدفه، با استفاده از یک چهارچوب تصمیم‌گیری فازی، تعریف منعطف‌تری از اهداف را در روش نمونه‌برداری ارائه می‌کنیم.
نتایج به‌دست‌آمده از آزمایش‌هایی که روی چهار دیتاست نامتوازن ریزآرایه DNA انجام‌شده است نشان می‌دهد که روش ارائه‌شده در معیارهای Accuracy، F-measure و G-mean عملکرد بهتری را نسبت به روش‌های پایه از خود نشان می‌دهد.
Keywords:
بهینه‌سازی ازدحام ذرات دودویی، توزیع کلاس نامتوازن، ریزآرایه DNA، یادگیری گروهی
Status : Paper Accepted