Intrati in legatura

Schița de curs

Bazele AI Sigure și Echitabile

  • Concepte cheie: siguranță, părtinire, echitate, transparență
  • Tipuri de părtinire: din setul de date, de reprezentare, algoritmică
  • Prezentare generală a cadrelor de reglementare (EU AI Act, GDPR, etc.)

Părtinirea în Modelele Fine-Tuned

  • Cum poate fine-tuning-ul să introducă sau să amplifice părtinirea
  • Studii de caz și eșecuri din lumea reală
  • Identificarea părtinirii în seturile de date și predicțiile modelelor

Tehnici de Reducere a Părtinirii

  • Strategii la nivel de date (reechilibrare, augmentare)
  • Strategii în timpul antrenamentului (regularizare, debiasing adversar)
  • Strategii post-procesare (filtrare a ieșirilor, calibrare)

Siguranța și Robustetea Modelelor

  • Detectarea ieșirilor nesigure sau dăunătoare
  • Gestionarea inputurilor adversare
  • Red teaming și testarea sub presiune a modelelor fine-tuned

Auditarea și Monitorizarea Sistemelor AI

  • Metrici de evaluare a părtinirii și echității (e.g., paritate demografică)
  • Instrumente de explicabilitate și cadre de transparență
  • Practici de monitorizare și guvernanță continuă

Instrumente și Practică Practică

  • Utilizarea bibliotecilor open-source (e.g., Fairlearn, Transformers, CheckList)
  • Practică: Detectarea și reducerea părtinirii într-un model fine-tuned
  • Generarea de ieșiri sigure prin designul și constrângerile prompt-urilor

Cazuri de Utilizare Întreprindere și Pregătire pentru Conformitate

  • Bune practici pentru integrarea siguranței în fluxurile de lucru LLM
  • Documentație și fișe de model pentru conformitate
  • Pregătirea pentru audituri și revizuiri externe

Rezumat și Pași Următori

Cerințe

  • Înțelegerea modelelor de învățare automată și a proceselor de antrenament
  • Experiență în lucrul cu fine-tuning și LLM
  • Familiaritate cu Python și conceptele NLP

Publicul Țintă

  • Echipe de conformitate AI
  • Ingineri de învățare automată
 14 Ore

Numărul de participanți


Pret per participant

Cursuri viitoare

Categorii înrudite