Schița de curs

Introducere în Reinforcement Learning

  • Ce este învățarea prin recompense?
  • Concepte cheie: agent, mediu, stări, acțiuni și recompense
  • Challenges in reinforcement learning (Aceste termeni tehnici rămân nedețaliți pentru coerența conceptuală.)

Explorare și Exploatare

  • Eliberarea echilibrului între explorare și exploatare în modelele RL
  • Strategii de explorare: epsilon-greedy, softmax și alte strategii

Q-Learning și Rețele Q Profunde (DQN)

  • Introducere în Q-learning
  • Implementarea DQN folosind TensorFlow
  • Optimizarea Q-learning prin replay-ul experiențelor și rețelele ținte

Metode bazate pe Politica

  • Algoritmi de gradient politic
  • Algoritmul REINFORCE și implementarea sa
  • Metode actor-critic

Lucrul cu OpenAI Gym

  • Configurarea mediilor în OpenAI Gym
  • Simularea agenților în medii dinamice
  • Evaluarea performanței agentului

Tehnici Avansate de Reinforcement Learning

  • Învățare prin recompense cu mai mulți agenți
  • Gradient politic determinist profund (DDPG)
  • Optimizarea politicii proximale (PPO)

Deploying Reinforcement Learning Models (Această termen tehnic rămâne nedețalit pentru coerența conceptuală.)

  • Aplicații în lumea reală ale învățării prin recompense
  • Integrarea modelelor RL în medii de producție

Rezumat și Pașii Următori

Cerințe

  • Experiență în programare cu Python
  • Compreensiune de bază a conceptelor de învățare profundă și învățare automată
  • Cunoștințe despre algoritmi și concepte matematice utilizate în învățarea prin recompense (reinforcement learning)

Publicație

  • Scientiști ai datelor
  • Practicieni de învățare automată
  • Cercetători AI
 28 ore

Numărul de participanți


Pret per participant

Upcoming Courses

Categorii înrudite