Schița de curs

Tehnici Avansate Reinforcement Learning

Implementarea Modelelor Reinforcement Learning

Explorare și Exploatare

Introducere în Reinforcement Learning

Metode Bazate pe Politici

Q-Learning și Rețele Q Profunde (DQNs)

Concluzii și Pasul Următor

Lucru cu OpenAI Gym

  • Echilibrarea explorării și exploatarii în modele RL
  • Strategii de explorare: epsilon-greedy, softmax și alte strategii
  • Introducere în Q-learning
  • Implementarea DQNs folosind TensorFlow
  • Optimizarea Q-learning prin replierea experienței și rețelele țintă
  • Aprenderea recompensată cu mai mulți agenți
  • Gradientul politic determinist profund (DDPG)
  • Optimizarea politicii proximale (PPO)
  • Algoritmi de gradient politic
  • Algoritmul REINFORCE și implementarea sa
  • Metode actor-critic
  • Aplicații din viața reală a învățării prin recompense
  • Integrarea modelelor RL în mediul de producție
  • Configurarea mediilor în OpenAI Gym
  • Simularea agentelor în medii dinamice
  • Evaluarea performanței agenților
  • Ce este învățarea prin recompense?
  • Concepte cheie: agent, mediu, stări, acțiuni și recompense
  • provocări în învățarea prin recompense

Cerințe

Audiența

  • Cercetători în științele datelor
  • Practicieni în învățarea automatizată
  • Cercetători AI
  • Experiență cu programare Python
  • Compreensiune de bază a conceptelor de învățare profundă și învățare automatizată
  • Cunoștințe ale algoritmilor și conceptelor matematice utilizate în învățarea prin recompense
 28 ore

Numărul de participanți


Pret per participant

Upcoming Courses

Categorii înrudite