Intrati in legatura

Schița de curs

Fundamentele AI Sigure și Corecte

  • Concepte cheie: siguranță, părtinire, corectitudine, transparență
  • Tipuri de părtinire: din setul de date, de reprezentare, algoritmică
  • Prezentare generală a cadrelor de reglementare (Actul UE privind AI, GDPR, etc.)

Părtinirea în Modelele Fine-Tunate

  • Cum fine-tuning-ul poate introduce sau amplifica părtinirea
  • Studii de caz și eșecuri din lumea reală
  • Identificarea părtinirii în seturile de date și predicțiile modelului

Tehnici de Mitigare a Părtinirii

  • Strategii la nivel de date (reechilibrare, augmentare)
  • Strategii în timpul antrenamentului (regularizare, debiasing adversar)
  • Strategii post-procesare (filtrare a ieșirilor, calibrare)

Siguranța și Robustetea Modelului

  • Detectarea ieșirilor nesigure sau dăunătoare
  • Gestionarea inputurilor adversare
  • Red teaming și testarea sub stres a modelelor fine-tunate

Auditarea și Monitorizarea Sistemelor AI

  • Metrici de evaluare a părtinirii și corectitudinii (e.g., paritate demografică)
  • Instrumente de explicabilitate și cadre de transparență
  • Practici de monitorizare și guvernanță continuă

Seturi de Instrumente și Practică Practică

  • Utilizarea bibliotecilor open-source (e.g., Fairlearn, Transformers, CheckList)
  • Exercițiu practic: Detectarea și mitigarea părtinirii într-un model fine-tunat
  • Generarea de ieșiri sigure prin designul și constrângerile prompturilor

Cazuri de Utilizare în Întreprinderi și Pregătire pentru Conformitate

  • Cele mai bune practici pentru integrarea siguranței în fluxurile de lucru LLM
  • Documentație și fișe de model pentru conformitate
  • Pregătirea pentru audituri și revizuiri externe

Rezumat și Pași Următori

Cerințe

  • O înțelegere a modelelor de învățare automată și a proceselor de antrenament
  • Experiență în lucrul cu fine-tuning și LLM-uri
  • Cunoștințe de bază despre Python și concepte de NLP

Publicul țintă

  • Echipe de conformitate AI
  • Ingineri de ML
 14 Ore

Numărul de participanți


Pret per participant

Cursuri viitoare

Categorii înrudite