تحصيلات تکميلي

نام و نام خانوادگي : محمدرضا مهدي پور

دانشکده : فني و مهندسي

استاد راهنما : دکتر کامران زماني فر-دکتر عباس وفايي

تاريخ دفاع : 28/4/83

رشته و گرايش : کامپيوتر-معماري کامپيوتر

استاد مشاور : -

يادگيري رفتاري در محيط رباتهاي فوتباليست

چکيده

علم هوش مصنوعي با وارد شدن مفاهيم عامل هاي هميار شاخه هاي زيادي را براي تحقيق در اختيار محققان قرار داد. يکي از مباحثي که بسيار مورد توجه واقع شد، مفهوم يادگير بود. يکي از کاربرد هاي که امروزه محققان با آن درگير مي باشند، آماده سازي يک عامل، قبل از ورود به محيط عملياتي مي باشد؛ اين بدين مفهوم مي باشد که بتوان به عامل، عمليات پايه رفتاري را به سرعت آموزش داد که در محيطهاي پويا بتوانند از اين قابليت خود استفاده نمايند.گروهاي متفاوتي روي اين مبحث کار کرده، و نظريه متفاوتي ارائه نمودن ولي اغلب اين کارها وابسته به محيط و عاملي بود که بر روي آن تحقيق انجام مي گرديد. در اين پروژه هدف ايجاد يک بستر(معماري) و الگوريتم يادگيري بود که وابسته به محيط و عامل عملياتي نباشد. براي اينکه قابليت اين طرح هاي ارائه شده در اين پروژه مورد ارزيابي قرار گيرد، محيط آزمون، روبات هاي فوتباليست مجازي در نظر گرفته شد.در اين پروژه از کارها و الگوريتم هاي معروف يادگيري که توسط گروهاي ديگر ارائه شده است استفاده و با در نظر گرفتن نقاط قوت و ضعف آنها يک الگوريتم ترکيبي ارائه گرديده است. در نهايت به معماري دست يافتيم که الگوريتم يادگيري در عمليات پايه آن قرار داده شد که با آموزش به سرعت و خطايي کم عمليات پايه را فرا مي گيرد، که نسبت به الگوريتم هاي ديگر در بازه قابل قبول تري از نظر سرعت و دقت قرار دارد.