فهرست مطالب

مسیر یادگیری خود را انتخاب کنید

مقدمه
مقدمه
  • اصلا RL چیه؟
  • اجزای اصلی چیا هستن؟
  • چند مثال برای درک بهتر.
مساله Multi-armed bandit ساده
Multi-armed Bandits
  • مساله k-armed Bandit رو توضیح بدیم؟
  • پیاده سازی Incremental.
  • اکسپلور یا اکسپلویت؟ کدومش؟
مساله Contextual Multi-armed Bandit
Contextual Multi-armed Bandits
  • حل مساله Bandit با استفاده از کانتکست
  • LinUCB و مقایسه با UCB
  • کاربردهای دنیای واقعی