Intrati in legatura

Schița de curs

Fundamentele Operațiunilor în Cloud pe AWS

  • Roluri și responsabilități operaționale în cloud
  • Structura contului AWS, organizații și strategii multi-cont
  • Servicii operaționale de bază: CloudWatch, CloudTrail, AWS Config

Infrastructură-ca-Cod și Provisioning

  • Principiile IaC și infrastructurii imutabile
  • Provisioning cu Terraform și AWS CloudFormation
  • Gestionarea stării, modulelor și promovării mediilor

CI/CD și Strategii de Implementare

  • Proiectarea pipeline-urilor CI/CD pentru aplicații cloud-native
  • Implementări blue/green, canary și rolling
  • Automatizarea rollback-ului, verificărilor de sănătate și validării lansării

Monitorizare, Observabilitate și Alertare

  • Metrici, loguri și trace-uri: expediere, stocare și analiză
  • Utilizarea CloudWatch, X-Ray și a altor instrumente de observabilitate
  • Definirea SLO-urilor/SLI-urilor, politici de alertare și practici de on-call

Securitate Operațională și Gestionarea Identităților

  • Cele mai bune practici IAM, principiul privilegiului minim și acces inter-cont
  • Gestionarea secretelor, KMS și stocarea securizată a parametrilor
  • Securitate operațională: strategii de patch-uri, scanare de vulnerabilități și urme de audit

Reziliență, Backup și Recuperare în Caz de Dezastru

  • Proiectare pentru toleranță la defecte și disponibilitate ridicată
  • Strategii de backup, automatizare de snapshot-uri și proceduri de restaurare
  • Planificarea recuperării în caz de dezastru și crearea de runbook-uri

Optimizarea Costurilor și Guvernanță

  • Vizibilitate a costurilor: facturare, tagging și strategii de alocare a costurilor
  • Redimensionare, instanțe rezervate/planuri de economisire și controale de buget
  • Guvernanță: politici, bariere de protecție și automatizare pentru conformitate

Containere, Serverless și Operațiuni Runtime

  • Considerații operaționale pentru ECS, EKS și Lambda
  • Descoperirea serviciilor, scalare automată și limite de resurse
  • Logging, tracing și depanarea sarcinilor de lucru containerizate

Răspuns la Incidente, Playbook-uri și Ingineria Haosului

  • Răspuns la incidente bazat pe runbook-uri și practici postmortem
  • Automatizarea remedierii și a modelelor de auto-reparare
  • Introducere în experimentele de haos pentru validarea rezilienței

Atelier Practic: Operare a unei Sarcini de Lucru Exemplu

  • Implementarea unei aplicații exemplu folosind IaC și un pipeline CI/CD
  • Implementarea monitorizării, alertelor și a unui script de remediere automată
  • Simularea incidentelor și practicarea răspunsului bazat pe runbook-uri

Rezumat și Pași Următori

Cerințe

  • O înțelegere de bază a conceptelor de cloud și rețea
  • Familiaritate cu linia de comandă Linux și scripting
  • Experiență cu controlul versiunilor (Git) și concepte de bază ale CI/CD

Publicul țintă

  • Ingineri de operațiuni cloud
  • Ingineri SRE și platforme
  • Ingineri DevOps și lideri de echipe tehnice
 21 Ore

Numărul de participanți


Pret per participant

Mărturii (2)

Cursuri viitoare

Categorii înrudite