Schița de curs

Proiectarea unei Arhitecturi AIOps Open

  • Prezentare generală a componentelor cheie din conductele AIOps open
  • Fluxul de date de la ingestie la alertare
  • Compararea instrumentelor și strategia de integrare

Colectarea și Agregarea Datelor

  • Ingestia datelor serii temporale cu Prometheus
  • Capturarea jurnalelor cu Logstash și Beats
  • Normalizarea datelor pentru corelarea inter-sursă

Construirea de Panouri de Observabilitate

  • Vizualizarea metricilor cu Grafana
  • Construirea de panouri Kibana pentru analiza jurnalelor
  • Utilizarea interogărilor Elasticsearch pentru a extrage informații operaționale

Detectarea Anomaliilor și Prezicerea Incidentelor

  • Exportul datelor de observabilitate în conducte Python
  • Antrenarea modelelor ML pentru detectarea valorilor aberante și previziune
  • Implementarea modelelor pentru inferență live în conducta de observabilitate

Alertarea și Automatizarea cu Instrumente Open

  • Crearea regulilor de alertă Prometheus și rutarea Alertmanager
  • Declanșarea scripturilor sau a fluxurilor de lucru API pentru răspuns automat
  • Utilizarea instrumentelor de orchestratie open source (de ex., Ansible, Rundeck)

Considerații de Integrare și Scalabilitate

  • Gestionarea ingestiei de volum mare și a reținerii pe termen lung
  • Securitate și controlul accesului în stivele open source
  • Scalarea fiecărui strat independent: ingestie, procesare, alertare

Aplicații și Extensii din Lumea Reală

  • Studii de caz: optimizarea performanței, prevenirea timpilor de nefuncționare și optimizarea costurilor
  • Extinderea conductelor cu instrumente de trasare sau grafice de servicii
  • Cele mai bune practici pentru rularea și întreținerea AIOps în producție

Rezumat și Pași Următori

Cerințe

  • Experiență cu instrumente de observabilitate precum Prometheus sau ELK
  • Cunoaștere de bază a Python și a fundamentelor învățării automate
  • Înțelegere a operațiunilor IT și a fluxurilor de lucru pentru alertare

Publicul țintă

  • Ingineri de fiabilitate a site-urilor (SRE) avansați
  • Ingineri de date care lucrează în operațiuni
  • Conducători de platforme DevOps și arhitecți de infrastructură
 14 Ore

Numărul de participanți


Pret per participant

Cursuri viitoare

Categorii înrudite