Schița de curs

Fundamentele Depannerii și Evaluării Mastra

  • Înțelegerea modelelor de comportament ale agentelor și a modurilor de eșec
  • Principii fundamentale de depanare în Mastra
  • Evaluarea acțiunilor deterministe și non-deterministe ale agentelor

Configurarea Mediilor pentru Testarea Agentelor

  • Configurarea spațiilor de testare sandbox și evaluări izolate
  • Capturarea jurnalurilor, urmelor și telemetriei pentru analize detaliate
  • Prepararea seturilor de date și a prompt-urilor pentru testare structurată

Depanarea Comportamentului Agentelor AI

  • Urmarirea căilor de decizie și semnalelor de raționament intern
  • Identificarea halucinațiilor, erorilor și comportamentelor neintenționate
  • Utilizarea tablourilor de bord de observabilitate pentru investigarea cauzei primare

Metricile de Evaluare și Cadrele de Bază de Referință

  • Definirea metricilor de evaluare cuantitativ și calitativ
  • Măsurarea acurateții, consistenței și a conformității contextuale
  • Aplicarea seturilor de date de bază pentru evaluarea repetabilă

Ingineria Fiabilității Agentelor AI

  • Proiectarea testelor de fiabilitate pentru agente cu cicluri lungi de funcționare
  • Detectarea derivației și degradării performanței agentelor
  • Implementarea mecanismelor de protecție pentru fluxurile de lucru critice

Procesele și Automatizarea Asigurării Calității

  • Construirea canalelor QA pentru evaluare continuă
  • Automatizarea testelor de regresie pentru actualizările agentelor
  • Integrarea QA cu CI/CD și fluxurile de lucru enterprise

Tehnici Avansate pentru Reducerea Halucinațiilor

  • Strategii de prompting pentru reducerea ieșirilor neconvenabile
  • Buclele de validare și mecanismele de auto-verificare
  • Experimentarea combinărilor de modele pentru îmbunătățirea fiabilității

Raportare, Monitorizare și Îmbunătățiri Continue

  • Dezvoltarea rapoartelor QA și scorurilor agentelor
  • Monitorizarea comportamentului pe termen lung și a modelor de erori
  • Iterarea asupra cadrelor de evaluare pentru sistemele în evoluție

Rezumat și Următoarele Pași

Cerințe

  • O înțelegere a comportamentului agentelor IA și a interacțiunilor de model
  • Experiență cu depanarea sau testarea sistemelor software complexe
  • Familiarizare cu instrumentele de observabilitate sau de logging

Audiență

  • Ingineri QA
  • Ingineri de fiabilitate AI
  • Dezvoltatori responsabili pentru calitatea și performanța agentelor
 21 ore

Numărul de participanți


Pret per participant

Cursuri viitoare

Categorii înrudite