Schița de curs
Fundamentele Operațiunilor în Cloud pe AWS
- Roluri și responsabilități operaționale în cloud
- Structura contului AWS, organizațiile și strategia multi-cont
- Serviciile de bază operaționale: CloudWatch, CloudTrail, AWS Config
Infrastructura ca Cod și Alocarea
- Principiile IaC și a infrastructurii imutabile
- Alocarea cu Terraform și AWS CloudFormation
- Gestionarea stării, modulelor și promovării mediilor
CI/CD și Strategii de Implementare
- Proiectarea pipeleinelor CI/CD pentru aplicațiile cloud-native
- Implementări blue/green, canary și rolling
- Automatizarea rollback-ului, verificărilor de sănătate și validării lansărilor
Monitorizare, Observabilitate și Alerte
- Metricile, jurnalele și traseele: transport, stocare și analiză
- Utilizarea CloudWatch, X-Ray și uneltele de observabilitate de trece parte
- Definirea SLO-uri/SLI-uri, politicilor de alertare și practicilor on-call
Securitatea Operațională și Managementul Identității
- Cele mai bune practici IAM, privilegiu minim necesar și acces între conturi
- Gestionarea secretelor, KMS și depozitele securizate de parametri
- Securitatea operațională: strategii de actualizare, scanarea vulnerabilităților și istoricul audit-urilor
Reziliența, Backup-ul și Recuperarea după Dezastru
- Proiectarea pentru toleranța la defecte și disponibilitatea ridicată
- Strategii de backup, automatizarea snapshot-urilor și procedurile de restabilire
- Planificarea recuperării după dezastru și crearea runbook-urilor
Optimizarea Costului și Gestionarea
- Vizibilitatea costurilor: facturare, tagging și strategii de alocare a costurilor
- Redimensionarea, instanțele rezervate/savings plans și controalele bugetare
- Gestionarea: politici, parapete și automatizări pentru conformitate
Operațiunile cu Containere, Serverless și Runtime
- Considerente operaționale pentru ECS, EKS și Lambda
- Descoperirea serviciilor, autoscaling-ul și limitele resurselor
- Jurnalizarea, trasearea și depanarea sarcinilor containerize
Răspuns la Incidente, Ghiduri de Lucru și Ingineria Haosului
- Răspunsul la incidente bazat pe runbook-uri și practici de postmortem
- Automatizarea remedierii și modelelor auto-sanative
- Introducere la experimente cu haos pentru validarea rezilienței
Atelier Practic: Operațiunea unei Sarcini de Exemplu
- Implementarea unei aplicații de exemplu folosind IaC și o pipeline CI/CD
- Implementarea monitorizării, alertelor și a script-ului automatizat de remediere
- Simularea incidentelor și practica răspunderii bazate pe runbook-uri
Rezumat și Pașii Următori
Cerințe
- O înțelegere de bază a conceptelor cloud și ale rețelelor
- Familiarizarea cu linia de comandă Linux și scripting-ul
- Experiența cu controlul surselor (Git) și conceptele CI/CD de bază
Audientă
- Ingineri operaționali cloud
- SRE-uri și inginerii de platformă
- Ingineri DevOps și liderii echipei tehnice
Mărturii (5)
Formatorul avea o bună înțelegere a conceptelor
Josheel - Verizon Connect
Curs - Amazon Redshift
Tradus de catre o masina
Partea practică.
Radu - Ness Digital Engineering
Curs - AWS: A Hands-on Introduction to Cloud Computing
Tradus de catre o masina
Formarea a fost mai practică
Siphokazi Biyana - Vodacom SA
Curs - Kubernetes on AWS
Tradus de catre o masina
Instrutorul știa exact despre ce vorbea.
Madumetsa Msomi - BMW
Curs - AWS DevOps Engineers
Tradus de catre o masina
Toate bune, nu este nimic de îmbunătățit
Ievgen Vinchyk - GE Medical Systems Polska Sp. Z O.O.
Curs - AWS Lambda for Developers
Tradus de catre o masina