مقاله : آتاماتای یادگیر
فرمت : word
تعداد صفحه : 30
قیمت: مبلغ 9هزار تومان
مقدمه
فرآيند يادگيري موجودات زنده يكي از موضوعات تحقيقاتي جديد بشمار ميآيد. اين تحقيقات به دو دسته كلي تقسيم ميشوند. دسته نخست به شناخت اصول يادگيري موجودات زنده و مراحل آن ميپردازند و دسته دوم بدنبال ارائه يك متدولوژي براي قرار دادن اين اصول در يك ماشين ميباشند. يادگيري بصورت تغييرات ايجادشده در كارايي يك سيستم بر اساس تجربههاي گذشته تعريف ميشود. يك ويژگي مهم سيستمهاي يادگير، توانايي بهبود كارايي خود با گذشت زمان است. به بيان رياضي ميتوان اينطور عنوان كرد كه هدف يك سيستم يادگير بهينهسازي وظيفهاي است كه كاملا شناخته شده نيست. بنابراين يك رويكرد به اين مساله، كاهش اهداف سيستم يادگير به يك مساله بهينهسازي است كه بر روي مجموعهاي از پارامترها تعريف ميشود و هدف آن پيدا كردن مجموعه پارامترهاي بهينه ميباشد.
در بسياري از مسائل مطرح شده، اطلاعي از پاسخهاي صحيح مساله ( كه يادگيري با نظارت به آنها نياز دارد) در دست نيست. بهمين علت استفاده از يك روش يادگيري بنام يادگيري تقويتي مورد توجه قرار گرفته است. يادگيري تقويتي نه زير مجموعه شبكههاي عصبي است و نه انتخابي بجاي آنها محسوب ميشود. بلكه رويكردي متعامد براي حل مسائل متفاوت و مشكلتر بشمار ميرود. يادگيري تقويتي، از تركيب برنامهنويسي پويا و يادگيري نظارتي براي دستيابي به يك سيستم قدرتمند يادگيري ماشين استفاده ميكند. در يادگيري تقويتي هدفي براي عامل يادگير مشخص ميشود تا به آن دست يابد. آنگاه عامل مذكور ياد ميگيرد كه چگونه با آزمايشهاي صحيح و خطا با محيط خود، به هدف تعيين شده برسد.
در يادگيري تقويتي يك عامل يادگيرنده در طي يادگيري با فعل و انفعالات مكرر با محيط، به يك سياست كنترل بهينه ميرسد. كارايي اين فعل و انفعالات با محيط بوسيله بيشينه(كمينه) بودن پاداش (جريمه) عددي كه از محيط گرفته ميشود، ارزيابي ميگردد. علاوه بر اين در روشهاي يادگيري تقويتي، اولا استفاده از يادگيري روش ساده، سيستماتيك و واقعي براي رسيدن به يك جواب تقريبا بهينه را بيان ميكند.(پيدا كردن اين جواب بهينه با استفاده از روشهاي سنتي بسيار مشكل است.) ثانيا، دانشي كه در طي فرايند يادگيري بدست ميآيد، در يك مكانيزم نمايش دانش مانند شبكه عصبي يا جدول مراجعه ذخيره ميشود كه از طريق آن ميتوان با محاسبات اندك و با كارايي بالايي عمل تخصيص كانال را انجام داد. ثالثا، از آنجاييكه اين روش يادگيري در محيطي بلادرنگ در حال انجام است، ميتوان آنرا همزمان با فعاليت محيط (مانند شبكه سلولي) انجام داد. كه در اين حالت با تمام رخدادهاي پيشبيني نشده بصورت يك تجربه جديد برخورد ميشود كه ميتوان از آنها براي بهبود كيفيت يادگيري استفاده كرد.
مزيت اصلي يادگيري تقويتي نسبت به ساير روشهاي يادگيري عدم نياز به هيچگونه اطلاعاتي از محيط (بجز سيگنال تقويتي) است. يكي از روشهاي يادگيري تقويتي، اتوماتاي يادگير تصادفي است. اتوماتاي تصادفي بدون هيچگونه اطلاعاتي درباره اقدام بهينه (يعني با در نظر گرفتن احتمال يكسان براي تمامي اقدامهاي خود در آغاز كار) سعي در يافتن پاسخ مساله دارد. يك اقدام اتوماتا بصورت تصادفي انتخاب ميشود، در محيط اِعمال ميگردد. سپس پاسخ محيط دريافت شده و احتمال اقدامها بر طبق الگوريتم يادگيري بِروز ميشوند و روال فوق تكرار ميگردد. اتوماتاي تصادفي كه بصورت فوق در جهت افزايش كارايي خود عمل كند، يك اتوماتاي يادگير تصادفي گفته ميشود. در ادامه اين فصل به معرفي اتوماتاي يادگير تصادفي پرداخته می شود
فهرست مطالب اين مقاله عبارتند از :
1. مقدمه
1.1. تاريخچه اتوماتاي يادگير
2. اتوماتاي يادگير
2.1. اتوماتاي تصادفي
2.2. محيط
2.3. معيارهاي رفتار اتوماتاي يادگير
2.4. الگوريتمهاي يادگير
2.4.1. الگوريتمهاي يادگير استاندارد
2.4.2. الگوريتمهاي يادگيري مدل-S
2.5. اتوماتاي يادگير با اقدامهاي متغير
2.6. اتوماتاي يادگير توزيع شده
3. اتوماتاي يادگير واكنشي
3.1. اتوماتاي يادگير واكنشي توزيع شده
4. کوتاهترين مسير در گراف هاي تصادفي با اتوماتاي يادگير توزيع شده
5. حل مساله فروشنده دورهگرد احتمالي با اتوماتاي يادگير توزيع شده
5.1. تابع هدف مساله فروشنده دورهگرد احتمالي
5.2. الگوريتم پيشنهادي
6. مراجع
***************************************************************************************
در صورت تمایل
به دریافت فایل فوق در مدت 10 دقیقه ، لطفاً اینجا کلیک
کنید
***************************************************************************************
مشاوره ؛نگارش پایان نامه ؛ مقاله + شبیه سازی
در تمام مقاطع دانشگاهی پذیرفته می شود
در صورت
تمایل می توانید عنوان و جزئیات پروژه خود را در قسمت نظرات این پست
اعلام فرمایید. ضمنا می توانید اطلاعات درخواستی خود را به ایمیل یا تلگرام
نمایید
ایمیل :
com.dr@yahoo.com
درباره :
اتوماتای یادگیری , آتاماتای یادگیر ,
|