چکیده
مقدمه
1-کلیات
1-1-سئوالات کلیدی پروژه
1-2- مفروضات پروژه
1-3- روش کار و تحقیق
1-4- ساختاربندی پروژه
2- تئوری بازی
2-1- رقابت در عاملها
2-1-1- بازیهای بدیهی
2-1-2- بازیهای بدون رقابت
2-1-3- بازیهای کاملاً رقابتی
2-1-4- بازیهای با تضاد جزئی
2-2- ساختار بازیها
2-2-1- بازیهای نرمال
2-2-2- بازیهای پویا
2-3- مفهوم غلبه
2-3-1- غلبه اکید در استراتژی محض
2-3-2- غلبه ضعیف
2-3-3- غلبه اکید در استراتژیهای مرکب
2-4- نقطه تعادل نش
2-5- نقطه تعادل کامل زیربازی
2-6- بهینگی پارتو
2-7- مفاهیم بسط یافته تعادل نش
2-7-1- نقطه تعادل هم بسته
2-7-2- نقطه تعادل ε
2-7-3- نقطه تعادل کامل دست لرزان
2-7-4- نقطه تعادل صحیح
2-7-5- نقطه تعادل پاسخ دو جانبهای (QRE)
2-7-6- نقطه تعادل شبه کامل
2-7-7- نقطه تعادل سلطهجو
2-7-8- نقطه تعادل متوالی
3- روشهای کلاسیک محاسبه نقطه تعادل نش
3-1- محاسبه نقطه تعادل نش در بازیهای نرمال
3-1-1- Lamke-hawson method
3-1-2- Simple search method
3-2- محاسبه نقطه تعادل نش در بازیهای پویا
3-2-1- الگوریتم استقراء معکوس
4- یادگیری تقویتی
4-1- مبانی اولیه
4-2- خاصیت مارکوف
4-3- فرآیند تصمیم گیری مارکوف
4-3-1- تابع ارزش
4-3-2- تابع ارزش بهینه
4-3-3- روشهای حل فرآیندهای تصمیم گیری مارکوف
4-3-4- برنامه ریزی پویا
4-3-5- روش مونت کارلو
4-3-6- روش تفاضل زمانی
4-4- روشهای یادگیری تک عاملی
4-4-1- الگوریتم Sarsa
4-4-2- الگوریتم Q-Learning
4-4-3- الگوریتم Dyna_Q
5- یادگیری تقویتی چندعاملی
5-1- تاریخچه
5-1-1- یادگیری Nash-Q
5-1-2- یادگیری Friend or Foe
5-1-3- یادگیری Asymmetric-Q
5-1-4- Minimax
5-1-5- Infinitesimal Gradient Ascent (IGA)
5-1-6- Wolf-IGA
5-1-7- (Policy dynamic wolf) PD-Wolf
5-2- فرآیند بازی مارکوف
6- محاسبه نقطه تعادل نش در یادگیری تقویتی n-عامله
6-1- بازیهای مارکوف نرمال n-عامله
6-1-1- استفاده از الگوریتم ژنتیک در محاسبه نقطه تعادل نش
6-2- بازیهای مارکوف پویا n-عامله
6-2-1- استفاده از روش استقراء معکوس تعمیم یافته در محاسبه نقطه تعادل نش
7- شبیه سازی
7-1- شبیهسازی در محیط مشبک
7-1-1- استفاده از Q-Learning در محیطهای چندعاملی
7-1-2- مقایسه الگوریتم Nash-Q و Q-Learning
7-1-3- محاسبه نقطه تعادل نش در یادگیری تقویتی چندعاملی
7-2- شبیه سازی بازار برق
7-2-1- مطالعه موردی
8- نتیجهگیری
مراجع
ABSTRACT
پایان نامه ارشد برق محاسبه نقطه تعادل نش در روش های یادگیری تقویتی چند عاملی با فرمت ورد