Intrati in legatura

Schița de curs

Introducere în Operațiunile Kubernetes Îmbunătățite de AI

  • De ce AI contează pentru operațiunile moderne de cluster
  • Limitările logicii tradiționale de scalare și planificare
  • Concepte cheie ale ML pentru gestionarea resurselor

Fundamentele Gestionării Resurselor Kubernetes

  • Elemente fundamentale ale alocării CPU, GPU și memorie
  • Înțelegerea cotelor, limitelor și cerințelor
  • Identificarea punctelor de blocaj și ineficiențelor

Abordări de Învățare Automată pentru Planificare

  • Modele supervizate și nesupravizate pentru plasarea sarcinilor de lucru
  • Algoritmi predictivi pentru cerințele de resurse
  • Utilizarea caracteristicilor ML în planificatori personalizați

Învățarea Prin Întărire pentru Scalare Automată Inteligentă

  • Cum agenții RL învață din comportamentul clusterului
  • Proiectarea funcțiilor de recompensă pentru eficiență
  • Construirea strategiilor de scalare automată bazate pe RL

Scalare Automată Predictivă cu Metrici și Telemetrie

  • Utilizarea datelor Prometheus pentru previziuni
  • Aplicarea modelelor de serii temporale la scalarea automată
  • Evaluarea acurateței predicțiilor și ajustarea modelelor

Implementarea Instrumentelor de Optimizare Conduse de AI

  • Integrarea cadrelor ML cu controlere Kubernetes
  • Implementarea buclelor de control inteligente
  • Extinderea KEDA pentru luarea de decizii asistate de AI

Strategii de Optimizare a Costurilor și Performanței

  • Reducerea costurilor de calcul prin scalare predictivă
  • Îmbunătățirea utilizării GPU prin plasare bazată pe ML
  • Echilibrarea latenței, a debitului și a eficienței

Scenarii Practice și Cazuri de Utilizare Reale

  • Scalarea automată a aplicațiilor cu încărcare ridicată folosind AI
  • Optimizarea bazelor de noduri eterogene
  • Aplicarea ML în medii multi-tenant

Rezumat și Pași Următori

Cerințe

  • Înțelegerea fundamentelor Kubernetes
  • Experiență în implementarea aplicațiilor containerizate
  • Familiaritate cu operațiunile de cluster și gestionarea resurselor

Publicul țintă

  • SRE care lucrează cu sisteme distribuite la scară largă
  • Operatorii Kubernetes care gestionează sarcini de lucru cu cerințe ridicate
  • Ingineri de platformă care optimizează infrastructura de calcul
 21 Ore

Numărul de participanți


Pret per participant

Mărturii (3)

Cursuri viitoare

Categorii înrudite