Schița de curs

Introducere în AIOps cu Instrumente Open Source

  • Prezentare generală a conceptelor și beneficiilor AIOps
  • Rolul Prometheus și Grafana în stiva de observabilitate
  • Locul ML în AIOps: analiză predictivă vs. reactivă

Configurarea Prometheus și Grafana

  • Instalarea și configurarea Prometheus pentru colectarea de serii temporale
  • Crearea de tablouri de bord în Grafana folosind metrici în timp real
  • Explorarea exportatoarelor, relabeling și descoperirea serviciilor

Prelucrarea Datelor pentru ML

  • Extragerea și transformarea metricilor Prometheus
  • Pregătirea seturilor de date pentru detectarea anomaliilor și prognoză
  • Utilizarea transformărilor Grafana sau a conductelor Python

Aplicarea Învățării Automate pentru Detectarea Anomaliilor

  • Modele de bază ML pentru detectarea outlier-ilor (de ex., Isolation Forest, One-Class SVM)
  • Antrenarea și evaluarea modelelor pe date de serie temporală
  • Vizualizarea anomaliilor în tablouri de bord Grafana

Prognozarea Metricilor cu ML

  • Construirea de modele simple de prognoză (ARIMA, Prophet, introducere în LSTM)
  • Prezicerea încărcării sistemului sau a utilizării resurselor
  • Utilizarea predicțiilor pentru alertare timpurie și decizii de scalare

Integrarea ML cu Alertarea și Automatizarea

  • Definirea regulilor de alertă bazate pe rezultatele ML sau pe praguri
  • Utilizarea Alertmanager și a rutării notificărilor
  • Declanșarea scripturilor sau a fluxurilor de lucru automate la detectarea anomaliilor

Scalarea și Operationalizarea AIOps

  • Integrarea instrumentelor externe de observabilitate (de ex., stiva ELK, Moogsoft, Dynatrace)
  • Operationalizarea modelelor ML în conductele de observabilitate
  • Cele mai bune practici pentru AIOps la scară largă

Rezumat și Pași Următori

Cerințe

  • Înțelegerea conceptelor de monitorizare a sistemelor și observabilitate
  • Experiență în utilizarea Grafana sau Prometheus
  • Familiaritate cu Python și principiile de bază ale învățării automate

Publicul Țintă

  • Ingineri de observabilitate
  • Echipe de infrastructură și DevOps
  • Arhitecți de platforme de monitorizare și ingineri de fiabilitate a site-ului (SREs)
 14 Ore

Numărul de participanți


Pret per participant

Cursuri viitoare

Categorii înrudite