Schița de curs

Fundamentele Sistemelor Agentice în Producție

  • Arhitecturi agentice: bucle, instrumente, memorie și straturi de orchestră
  • Ciclul de viață al agenților: dezvoltare, implementare și funcționare continuă
  • Provocări ale gestionării agenților la scară de producție

Modele de Infrastructură și Implementare

  • Implementarea agenților în medii containerizate și în cloud
  • Modele de scalare: scalare orizontală vs verticală, concurență și limitare
  • Orchestrarea multi-agent și echilibrarea sarcinilor de lucru

Monitorizare și Observabilitate

  • Metrici cheie: latență, rata de succes, utilizarea memoriei și adâncimea apelurilor agenților
  • Trasarea activității agenților și a graficelor de apel
  • Instrumentarea observabilității folosind Prometheus, OpenTelemetry și Grafana

Înregistrare, Audit și Conformitate

  • Înregistrare centralizată și colectare structurată a evenimentelor
  • Conformitate și auditabilitate în fluxurile de lucru agentice
  • Proiectarea de căi de audit și mecanisme de redare pentru depanare

Reglarea Performanței și Optimizarea Resurselor

  • Reducerea supraîncărcării de inferență și optimizarea ciclurilor de orchestră a agenților
  • Caching de modele și încorporări ușoare pentru o recuperare mai rapidă
  • Testarea sarcinii și scenarii de stres pentru conductele AI

Controlul Costurilor și Guvernanță

  • Înțelegerea factorilor de cost ai agenților: apeluri API, memorie, calcul și integrări externe
  • Urmărirea costurilor la nivel de agent și implementarea modelelor de facturare
  • Politici de automatizare pentru a preveni împrăștierea agenților și consumul de resurse inactiv

Strategii CI/CD și Lansare pentru Agenți

  • Integrarea conductelor agenților în sistemele CI/CD
  • Testarea, versiunile și strategiile de revenire pentru actualizări iterative ale agenților
  • Lansări progresive și mecanisme de implementare sigure

Recuperarea din Defecțiuni și Ingineria Fiabilității

  • Proiectare pentru toleranță la defecțiuni și degradare grațioasă
  • Modele de reluare, timeout și întreruptor de circuit pentru fiabilitatea agenților
  • Răspuns la incidente și cadre post-mortem pentru operațiuni AI

Proiect Final

  • Construirea și implementarea unui sistem AI agentic cu monitorizare completă și urmărire a costurilor
  • Simularea sarcinii, măsurarea performanței și optimizarea utilizării resurselor
  • Prezentarea arhitecturii finale și a panoului de monitorizare colegilor

Rezumat și Pași Următori

Cerințe

  • Înțelegere solidă a MLOps și a sistemelor de învățare automată în producție
  • Experiență cu implementări containerizate (Docker/Kubernetes)
  • Familiaritate cu instrumente de optimizare a costurilor în cloud și de observabilitate

Publicul Țintă

  • Ingineri MLOps
  • Ingineri de Fiabilitate a Site-urilor (SREs)
  • Manageri de inginerie care supraveghează infrastructura AI
 21 Ore

Numărul de participanți


Pret per participant

Mărturii (3)

Cursuri viitoare

Categorii înrudite