Schița de curs

Introducere în AIOps cu instrumente open source

  • Prezentare generală a conceptelor și beneficiilor ale lui AIOps
  • Prometheus și Grafana în stiva observabilității
  • Unde se potrivesc ML-urile în AIOps: analitici predictive vs. reactive

Configurarea lui Prometheus și Grafana

  • Instalarea și configurarea lui Prometheus pentru colectarea seriei temporale
  • Crearea de panouri instrumentale în Grafana folosind metricele în timp real
  • Explorarea exportatorilor, relabelării și a descoperirii serviciului

Preprocesarea datelor pentru ML

  • Extrage și transformă metricele Prometheus
  • Pregătirea seturilor de date pentru detectarea anomalilor și previziunile
  • Utilizarea transformărilor lui Grafana sau conductelor Python

Aplicare a lui Machine Learning pentru detectarea anomaliilor

  • Modele ML de bază pentru detectarea valorilor atipice (de exemplu, Izolație Forest, SVM clasa unică)
  • Antrenarea și evaluarea modelului pe date seriale temporale
  • Vizualizarea anomalilor în panourile instrumentale Grafana

Metrice Forecasting cu ML

  • Construirea unor modele simple de previziuni (ARIMA, Prophet, introducere LSTM)
  • Previzualizarea sarcinii sistemului sau a utilizării resurselor
  • Utilizarea previziunilor pentru alerte timpurii și decizii de scalare

Integrarea ML cu alerta și automatizare

  • Definirea regulilor de alertă bazate pe iesirea ML sau praguri
  • Utilizarea Alertmanager și rutelor de notificare
  • Deselegeri de scripte sau fluxuri de automatizare la detectarea anomaliei

Scalare și operativilizare a lui AIOps

  • Integrarea unor instrumente observabile externe (de exemplu, stiva ELK, Moogsoft, Dynatrace)
  • Operativilizarea modelelor ML în conductele observabilității
  • Cele mai bune practici pentru AIOps la scară largă

Rezumat și următoarele pași

Cerințe

  • Oprit înțelegerea conceptelor de monitorizare și observabilitate a sistemului
  • Experiență cu Grafana sau Prometheus
  • Cunoașterea instrumentelor Python și principiilor fundamentale ale învățării automatizate

Public țintă

  • Inginerii de observabilitate
  • Echipele infrastructurii și DevOps
  • Arhitecții platformelor de monitorizare și inginerii de ușurare a siguranței site-ului (SRE)
 14 ore

Numărul de participanți


Pret per participant

Upcoming Courses

Categorii înrudite