Mulțumim pentru trimiterea solicitării! Un membru al echipei noastre vă va contacta în curând.
Mulțumim pentru trimiterea rezervării! Un membru al echipei noastre vă va contacta în curând.
Schița de curs
Introducere în AIOps Predictive
- Prezentare generală a analizei predictive în operațiunile IT
- Surse de date pentru predicție (jurnale, metrici, evenimente)
- Concepte cheie în previzionarea seriilor temporale și modele de anomalii
Proiectarea Modelelor de Prezicere a Incidentelor
- Etichetarea incidentelor istorice și a comportamentului sistemului
- Alegerea și antrenarea modelelor (de ex., LSTM, Random Forest, AutoML)
- Evaluarea performanței modelului și gestionarea falselor pozitive
Colectarea Datelor și Ingineria Caracteristicilor
- Ingestia și alinierea datelor din jurnale și metrici pentru intrarea modelului
- Extragerea caracteristicilor din date structurate și nestructurate
- Gestionarea zgomotului și a datelor lipsă în conductele operaționale
Automatizarea Analizei Cauzelor de Bază (RCA)
- Corelarea bazată pe graf a serviciilor și infrastructurii
- Utilizarea ML pentru a deduce cauzele probabile din lanțuri de evenimente
- Vizualizarea RCA cu panouri de control bazate pe topologie
Remedierea și Automatizarea Fluxurilor de Lucru
- Integrarea cu platforme de automatizare (de ex., Ansible, Rundeck)
- Declanșarea revenirilor, repornirilor sau redirecționării traficului
- Auditarea și documentarea intervențiilor automate
Scalarea Conductelor AIOps Inteligente
- MLOps pentru observabilitate: reantrenarea și versionarea modelelor
- Rularea predicțiilor în timp real pe noduri distribuite
- Cele mai bune practici pentru implementarea AIOps în medii de producție
Studii de Caz și Aplicații Practice
- Analiza datelor reale ale incidentelor folosind modele AIOps predictive
- Implementarea conductelor RCA cu date sintetice și de producție
- Revizuirea cazurilor de utilizare din industrie: întreruperi în cloud, instabilitate a microserviciilor, degradări ale rețelei
Rezumat și Pași Următori
Cerințe
- Experiență cu sisteme de monitorizare precum Prometheus sau ELK
- Cunoștințe de lucru cu Python și învățare automată de bază
- Familiaritate cu fluxurile de lucru de gestionare a incidentelor
Publicul Țintă
- Ingineri senior de fiabilitate a site-urilor (SREs)
- Arhitecți de automatizare IT
- Responsabili de platforme DevOps și observabilitate
14 Ore