Intrati in legatura

Schița de curs

Introducere în Modelarea Amenințărilor pentru IA

  • Ce face sistemele de IA vulnerabile?
  • Suprafața de atac a sistemelor de IA vs sistemele tradiționale
  • Vectori principali de atac: straturile de date, model, ieșire și interfață

Atacuri Adverse asupra Modelelor de IA

  • Înțelegerea exemplelor adverse și a tehnicilor de perturbare
  • Atacuri white-box vs black-box
  • Metodele FGSM, PGD și DeepFool
  • Vizualizarea și crearea de probe adverse

Inversiunea Modelului și Scurgeri de Confidențialitate

  • Deducerea datelor de antrenament din ieșirea modelului
  • Atacuri de inferență a apartenenței
  • Riscuri de confidențialitate în modelele de clasificare și generative

Otrăvirea Datelor și Injecții de Backdoor

  • Cum influențează datele otrăvite comportamentul modelului
  • Backdoor-uri bazate pe trigger și atacuri Trojan
  • Strategii de detectare și dezinfectare

Tehnici de Robustete și Apărare

  • Antrenare adversă și augmentare a datelor
  • Maskarea gradientului și preprocesarea intrărilor
  • Netezirea modelului și tehnici de regularizare

Mecanisme de Apărare pentru Confidențialitate în IA

  • Introducere în confidențialitatea diferențială
  • Injecție de zgomot și bugete de confidențialitate
  • Învățare federată și agregare securizată

Securitatea IA în Practică

  • Evaluarea și implementarea modelelor conștiente de amenințări
  • Utilizarea ART (Adversarial Robustness Toolbox) în setări aplicate
  • Studii de caz din industrie: breșe și măsuri de atenuare din lumea reală

Rezumat și Pași Următori

Cerințe

  • Înțelegerea fluxurilor de lucru în învățarea automată și antrenarea modelelor
  • Experiență cu Python și cadre comune de învățare automată precum PyTorch sau TensorFlow
  • Familiaritate cu conceptele de bază ale securității sau modelării amenințărilor este utilă

Publicul țintă

  • Ingineri de învățare automată
  • Analiști de securitate cibernetică
  • Cercetători în IA și echipe de validare a modelelor
 14 Ore

Numărul de participanți


Pret per participant

Mărturii (2)

Cursuri viitoare

Categorii înrudite