Mulțumim pentru trimiterea solicitării! Un membru al echipei noastre vă va contacta în curând.
Mulțumim pentru trimiterea rezervării! Un membru al echipei noastre vă va contacta în curând.
Schița de curs
Introducere în AIOps
- Ce este AIOps și de ce este important
- Monitorizarea tradițională vs. observabilitatea bazată pe AIOps
- Arhitectura AIOps și componentele cheie
Colectarea și Normalizarea Datelor Operaționale
- Tipuri de date de observabilitate: metrici, loguri și urme
- Ingestia datelor din multiple surse (servere, containere, cloud)
- Utilizarea agenților și exportatorilor (Prometheus, Beats, Fluentd)
Corelarea Datelor și Detectarea Anomaliilor
- Corelarea seriilor temporale și metode statistice
- Utilizarea modelelor de ML pentru detectarea anomaliilor
- Detectarea incidentelor în sisteme distribuite
Alertarea și Reducerea Zgomotului
- Proiectarea regulilor de alerte inteligente și a pragurilor
- Suprimarea, deduplicarea și gruparea alertelor
- Integrarea cu Alertmanager, Slack, PagerDuty sau Opsgenie
Analiza Cauzei Rădăcină și Vizualizarea
- Utilizarea dashboard-urilor pentru vizualizarea metricilor și detectarea tendințelor
- Explorarea evenimentelor și a cronologiilor pentru RCA
- Trasarea problemelor pe straturi cu unelte de tracing distribuit
Automatizarea și Remedierea
- Declanșarea scripturilor sau fluxurilor de lucru automate din incidente
- Integrarea cu sisteme ITSM (ServiceNow, Jira)
- Cazuri de utilizare: auto-reparare, scalare, redirecționare a traficului
Platforme AIOps Open Source și Comerciale
- Prezentarea generală a uneltelor: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Criterii de evaluare pentru selectarea unei platforme AIOps
- Demo și exerciții practice cu un stack selectat
Rezumat și Pași Următori
Cerințe
- Înțelegerea conceptelor de operațiuni IT și monitorizare a sistemelor
- Experiență cu unelte de monitorizare sau dashboard-uri
- Familiaritate cu formatele de bază ale logurilor și metricilor
Publicul țintă
- Echipe de operațiuni responsabile de infrastructură și aplicații
- Ingineri de Fiabilitate a Site-urilor (SREs)
- Echipe de monitorizare și observabilitate IT
14 Ore