Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Schița de curs
Introducere în AIOps
- Ceea ce este AIOps și de ce contează
- Monitorizarea tradițională vs. observabilitatea condusă de AIOps
- Arhitectura AIOps și componentele cheie
Colecționare și Normalizare a Datelor Operaționale
- Tipuri de date ale observabilității: metrice, jurnale și trasee
- Ingestarea datelor din surse multiple (servers, containeri, cloud)
- Folosirea agentilor și exporterilor (Prometheus, Beats, Fluentd)
Corelația Datelor și Detectarea Anomaliei
- Corelația în serie de timp și metode statistice
- Folosirea modelului ML pentru detectarea anomalilor
- Detectarea incidentelor în sisteme distribuite
Avertizări și Reducerea Zgomotului
- Proiectarea regulilor inteligente de avertisment și praguri
- Supresia, deduplicarea și gruparea avizelor
- Integrarea cu Alertmanager, Slack, PagerDuty sau Opsgenie
Analiza Cauzei Fundamentale și Visualizare
- Folosirea panourilor de control pentru a vizualiza metricele și detecta tendințe
- Explorarea evenimentelor și cronologiilor pentru RCA
- Situarea problemelor în straturi cu instrumentele de traseu distribuit
Automatizare și Remediere
- Trigerarea unor scripte sau fluxuri automate din incidente
- Integrarea cu sistemele ITSM (ServiceNow, Jira)
- Cazuri de utilizare: autoînființare, scalare, redirecționarea traficului
Plațile Open Source și Comerciale pentru AIOps
- Prezentare a unor instrumente: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Criterii de evaluare pentru selectarea unei platforme AIOps
- Demo și practică cu o pachetă selecționată
Rezumat și Următoarele Pași
Cerințe
- Opritunețe în domeniul operării IT și conceptele de monitorizare a sistemelor
- Experiența cu instrumente sau panouri de monitorizare
- Cunoștințe de bază cu formatele jurnalelor și metricele
Auditoriu
- Echipele operaționale responsabile pentru infrastructura și aplicațiile
- Inginerii de fiabilitate a site-urilor (SRE)
- Echipele de monitorizare IT și observabilitate
14 ore