Schița de curs

Fundații ale AI Sigur și Corect

  • Concepte cheie: siguranță, prejudecățiile, corectitudinea, transparența
  • Tipuri de prejudecati: a setului de date, reprezentare, algoritmice
  • Prezentare generală a cadrurilor de reglementare (Actul UE privind IA, GDPR, etc.)

Prejudecarea în Modele Fino-Ajustate

  • Cum poate fino-adjustarea introduce sau amplifica prejudecățiile
  • Studii de caz și eșuări din lumea reală
  • Identificarea prejudecăților în seturi de date și predictiile modelului

Tehnici pentru Mitigarea Prejudecăților

  • Strategii la nivel de date (rebalansare, amplificare)
  • Strategii în timpul instruirii (regularizare, debiasing adversarial)
  • Strategii post-procesare (filtrarea rezultatelor, calibrare)

Siguranța și Robustea Modelului

  • Detectarea ieșirilor nesigure sau dăunătoare
  • Gestionarea intrărilor adversare
  • Testele de echipă roșie și testele de stres pentru modele fino-adjustate

Auditarea și Monitorizarea Sistemelor AI

  • Metrii de evaluare a prejudecăților și corectitudinii (de exemplu, paritatea demografică)
  • Unelte de explicație și cadre de transparență
  • Monitorizarea continuă și practici de guvernanță

Folosirea Uneltelor și Practica Manuală

  • Folosirea bibliotecilor open-source (de exemplu, Fairlearn, Transformers, CheckList)
  • Practică manuală: Detectarea și mitigarea prejudecăților într-un model fino-adjustat
  • Generarea de ieșiri sigure prin design-ul prompt-urilor și constrângerile

Cazuri de Utilizare în Enterprise și Gata Pentru Conformitate

  • Bune practici pentru integrarea siguranței în fluxurile de lucru LLM
  • Documentare și carduri de modele pentru conformitate
  • Prepararea pentru auditări și revizii externe

Rezumat și Următoarele Pași

Cerințe

  • O înțelegere a modelelor de machine learning și proceselor de instruire
  • Experiență în lucrul cu ajustările fine și LLMs (Large Language Models)
  • Familiarizare cu Python și conceptele NLP (Natural Language Processing)

Audientă

  • Echipe de conformitate AI
  • Ingineri ML (Machine Learning)
 14 ore

Numărul de participanți


Pret per participant

Cursuri viitoare

Categorii înrudite