Curs de pregatire Fundamentale ale Învățării Prin Recompensă

Învățarea prin recompensă (Reinforcement Learning - RL) este o tehnică de învățare automată în care un program de calculator (agent) învață să se comporte într-un mediu prin efectuarea de acțiuni și primirea de feedback asupra rezultatelor acțiunilor. Pentru fiecare acțiune bună, agentul primește feedback pozitiv, iar pentru fiecare acțiune proastă, agentul primește feedback negativ (pedeapsă).

Acest training condus de un instructor, live (online sau la fața locului), este destinat specialiștilor în știința datelor care doresc să depășească abordările tradiționale de învățare automată pentru a învăța un program de calculator să rezolve probleme fără a utiliza date etichetate și seturi mari de date.

La sfârșitul acestui training, participanții vor putea:

Instala și aplica bibliotecile și limbajul de programare necesare pentru implementarea Învățării Prin Recompensă.
Crea un agent software capabil să învețe prin feedback în loc de învățare supravegheată.
Programa un agent să rezolve probleme în care luarea deciziilor este secvențială și finită.
Aplica cunoștințele pentru a proiecta software care poate învăța într-un mod similar cu cel în care învață oamenii.

Formatul cursului

Prelegere interactivă și discuții.
Multe exerciții și practică.
Implementare practică într-un mediu live-lab.

Opțiuni de personalizare a cursului

Pentru a solicita un training personalizat pentru acest curs, vă rugăm să ne contactați pentru a aranja.

CB Center

810 EUR (Online (Remote))

810 EUR (Sală de clasă)

Curs de pregatire Fundamentale ale Învățării Prin Recompensă

Schița de curs

Cerințe

Cursuri viitoare

Fundamentale ale Învățării Prin Recompensă

Fundamentale ale Învățării Prin Recompensă

Fundamentale ale Învățării Prin Recompensă

Fundamentale ale Învățării Prin Recompensă

Fundamentale ale Învățării Prin Recompensă

Categorii înrudite

Această site în alte țări/regiuni

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites

Curs de pregatire Fundamentale ale Învățării Prin Recompensă

Schița de curs

Cerințe

Cursuri viitoare

Fundamentale ale Învățării Prin Recompensă

Fundamentale ale Învățării Prin Recompensă

Fundamentale ale Învățării Prin Recompensă

Fundamentale ale Învățării Prin Recompensă

Fundamentale ale Învățării Prin Recompensă

Cursuri înrudite

Învățare Profundă prin Reforțare cu Python

Fine-Tuning cu Învățare Prin Reforțare din Feedback Uman (RLHF)

Modele de Limbaj de Mare Anvergură (LLMs) și Învățarea prin Întărire (RL)

Învățare prin Reforțare cu Google Colab

Categorii înrudite

Reinforcement Learning

Această site în alte țări/regiuni

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites