تحصيلات تکميلي

نام و نام خانوادگي : مهدي حسين زاده اقدم

دانشکده : فني و مهندسي

استاد راهنما : دکتر ناصر قاسم آقائي

تاريخ دفاع : 26/6/87

رشته و گرايش : کامپيوتر-هوش مصنوعي

استاد مشاور : -

ارائه روشي مبتني بر هوش ازدحامي براي انتخاب ويژگي

چکيده

مسأله انتخاب ويژگي ناشي از زيادي نويز و ويژگي­هاي نامربوط و اضافي در مجموعه داده­ها است، به وسيله حذف اين ويژگي­ها از مجموعه داده­ها کارائي مدل­هاي يادگيري به طور چشم­گيري افزايش پيدا مي­كند. هدف از انتخاب ويژگي پيدا کردن کوچک­ترين زيرمجموعه از ويژگي­هاي ورودي با بيشترين خاصيت پيش­گويانه است. مسأله انتخاب ويژگي در خيلي از مسائل يادگيري ماشين، شناسايي الگو و پردازش سيگنال وجود دارد. برخلاف روش­هاي كاهش ابعاد، روش­هاي انتخاب ويژگي معناي اصلي ويژگي­ها را بعد از كاهش حفظ مي­كنند. اين روش­ها در پايگاه داده­هايي كه شامل تعداد بسيار زيادي از ويژگي­ها هستند و پردازش را مشکل مي­كنند، كاربرد زيادي دارند. يك نمونه از کاربرد انتخاب ويژگي در پردازش متن و طبقه­بندي متن است. روش­هاي انتخاب ويژگي همچنين در پايگاه داده­هاي كوچك و معمولي نيز استفاده مي­شوند، براساس اين روش­ها اکثراً آن ويژگي­هايي انتخاب مي­شوند كه حاوي بيشترين اطلاعات مفيد هستند.

مسأله انتخاب يک زيرمجموعه­ي بهينه از يک مجموعه داراي پيچيدگي زماني نمايي است، به همين دليل روش­هاي کلاسيک انتخاب ويژگي داراي مشکل زمان اجرا هستند، اين روش­ها اکثراً در پيدا کردن راه­حل­هاي بهينه ناموفق هستند. از طرف ديگر، جستجوي کامل براي پيدا کردن راه­حل­هاي بهينه حتي در مجموعه داده­هايي که تعداد ويژگي­ها زياد نيستند، غير ممکن است. بيشتر کاربردهاي انتخاب ويژگي خواستار محاسباتي ممکن با هدف به دست آوردن راه­حل­هاي بهينه يا نيمه­بهينه هستند. براي حل اين مشکل، ما در اين پايان نامه از الگوريتم­هاي هوش ازدحامي براي انتخاب ويژگي استفاده کرده­ايم.

در اين پايان نامه دو روش جديد بر مبناي الگوريتم­هاي کلوني مورچه­ها و بهينه­سازي ازدحام ذرات براي حل مسأله انتخاب ويژگي ارائه شده است. در اين روش­ها کارائي طبقه­بندي کننده و طول زيرمجموعه­هاي انتخاب شده به عنوان معيارهاي ارزيابي در نظر گرفته شده­اند، به همين دليل اين روش­ها مي­توانند بدون داشتن اطلاعات اوليه از ويژگي­ها، زيرمجموعه­هاي بهينه را انتخاب کنند. براي نشان دادن کارآمدي روش­هاي پيشنهادي و مقايسه آنها با روش­هاي ديگر، در اين پايان نامه سه نوع مجموعه داده در زمينه­هاي طبقه­بندي متن، بيوانفورماتيک و سيستم­هاي شناسايي چهره انتخاب شده­اند و روش­هاي مذکور بر روي آنها پياده­سازي شده­اند. از نتايج بدست آمده از پياده­سازي روش­هاي ارائه شده و مقايسه اين روش­ها با چندين روش ديگر انتخاب ويژگي، به اين نتيجه رسيديم که روش­هاي پيشنهاد شده بر مبناي الگويتم­هاي هوش ازدحامي با انتخاب تعداد ويژگي­هاي کمتري کارائي خيلي بهتري دارند. همچنين اين روش­ها با حذف کردن ويژگي­هاي نامرتبط دقت و سرعت يادگيري طبقه­بندي کننده را افزايش مي­دهند.

واژه­هاي کليدي: بهينه­سازي کلوني مورچه­ها، انتخاب ويژگي، بهينه­سازي ازدحام ذرات، هوش ازدحامي