فهرست مطالب
مسیر یادگیری خود را انتخاب کنید
مقدمه

- اصلا RL چیه؟
- اجزای اصلی چیا هستن؟
- چند مثال برای درک بهتر.
مساله Multi-armed bandit ساده

- مساله k-armed Bandit رو توضیح بدیم؟
- پیاده سازی Incremental.
- اکسپلور یا اکسپلویت؟ کدومش؟
مساله Contextual Multi-armed Bandit

- حل مساله Bandit با استفاده از کانتکست
- LinUCB و مقایسه با UCB
- کاربردهای دنیای واقعی