Schița de curs
Fundamentele Operațiunilor în Cloud pe AWS
- Roluri și responsabilități operaționale în cloud
- Structura contului AWS, organizații și strategii multi-cont
- Servicii operaționale de bază: CloudWatch, CloudTrail, AWS Config
Infrastructură-ca-Cod și Provisioning
- Principiile IaC și infrastructurii imutabile
- Provisioning cu Terraform și AWS CloudFormation
- Gestionarea stării, modulelor și promovării mediilor
CI/CD și Strategii de Implementare
- Proiectarea pipeline-urilor CI/CD pentru aplicații cloud-native
- Implementări blue/green, canary și rolling
- Automatizarea rollback-ului, verificărilor de sănătate și validării lansării
Monitorizare, Observabilitate și Alertare
- Metrici, loguri și trace-uri: expediere, stocare și analiză
- Utilizarea CloudWatch, X-Ray și a altor instrumente de observabilitate
- Definirea SLO-urilor/SLI-urilor, politici de alertare și practici de on-call
Securitate Operațională și Gestionarea Identităților
- Cele mai bune practici IAM, principiul privilegiului minim și acces inter-cont
- Gestionarea secretelor, KMS și stocarea securizată a parametrilor
- Securitate operațională: strategii de patch-uri, scanare de vulnerabilități și urme de audit
Reziliență, Backup și Recuperare în Caz de Dezastru
- Proiectare pentru toleranță la defecte și disponibilitate ridicată
- Strategii de backup, automatizare de snapshot-uri și proceduri de restaurare
- Planificarea recuperării în caz de dezastru și crearea de runbook-uri
Optimizarea Costurilor și Guvernanță
- Vizibilitate a costurilor: facturare, tagging și strategii de alocare a costurilor
- Redimensionare, instanțe rezervate/planuri de economisire și controale de buget
- Guvernanță: politici, bariere de protecție și automatizare pentru conformitate
Containere, Serverless și Operațiuni Runtime
- Considerații operaționale pentru ECS, EKS și Lambda
- Descoperirea serviciilor, scalare automată și limite de resurse
- Logging, tracing și depanarea sarcinilor de lucru containerizate
Răspuns la Incidente, Playbook-uri și Ingineria Haosului
- Răspuns la incidente bazat pe runbook-uri și practici postmortem
- Automatizarea remedierii și a modelelor de auto-reparare
- Introducere în experimentele de haos pentru validarea rezilienței
Atelier Practic: Operare a unei Sarcini de Lucru Exemplu
- Implementarea unei aplicații exemplu folosind IaC și un pipeline CI/CD
- Implementarea monitorizării, alertelor și a unui script de remediere automată
- Simularea incidentelor și practicarea răspunsului bazat pe runbook-uri
Rezumat și Pași Următori
Cerințe
- O înțelegere de bază a conceptelor de cloud și rețea
- Familiaritate cu linia de comandă Linux și scripting
- Experiență cu controlul versiunilor (Git) și concepte de bază ale CI/CD
Publicul țintă
- Ingineri de operațiuni cloud
- Ingineri SRE și platforme
- Ingineri DevOps și lideri de echipe tehnice
Mărturii (2)
Am aflat lucruri noi și interesante despre Lambda și Serverless
Oleg Buldumac - PUBLIC COURSE
Curs - AWS Lambda for Developers
Tradus de catre o masina
Totul în general.
Bruno - Verizon Connect
Curs - Amazon Redshift
Tradus de catre o masina