Intrati in legatura

Schița de curs

Introducere în modelele open-source LLM

  • Ce sunt modelele cu greutăți deschise și de ce sunt importante
  • Prezentare generală a modelelor LLaMA, Mistral, Qwen și altor modele din comunitate
  • Cazuri de utilizare pentru implementări private, on-premise sau sigure

Configurarea mediului și uneltele

  • Instalarea și configurarea bibliotecilor Transformers, Datasets și PEFT
  • Alegerea hardware-ului potrivit pentru fine-tuning
  • Încărcarea modelelor pre-antrenate de pe Hugging Face sau alte depozite

Pregătirea și preprocesarea datelor

  • Formate de seturi de date (instrucțiuni de ajustare, date de chat, doar text)
  • Tokenizare și gestionarea secvențelor
  • Crearea de seturi de date și încărcătoare de date personalizate

Tehnici de fine-tuning

  • Fine-tuning standard complet vs. metode eficiente din punct de vedere al parametrilor
  • Aplicarea LoRA și QLoRA pentru fine-tuning eficient
  • Utilizarea API-ului Trainer pentru experimentare rapidă

Evaluarea și optimizarea modelelor

  • Evaluarea modelelor ajustate cu metrici de generare și acuratețe
  • Gestionarea supraajustării, generalizării și seturilor de validare
  • Sfaturi pentru optimizarea performanței și înregistrarea datelor

Implementare și utilizare privată

  • Salvarea și încărcarea modelelor pentru inferență
  • Implementarea modelelor ajustate în medii de întreprindere sigure
  • Strategii de implementare on-premise vs. cloud

Studii de caz și cazuri de utilizare

  • Exemple de utilizare în întreprinderi ale modelelor LLaMA, Mistral și Qwen
  • Gestionarea fine-tuning-ului multilingv și specific domeniului
  • Discuție: Compromisuri între modelele deschise și cele închise

Rezumat și pași următori

Cerințe

  • O înțelegere a modelelor de limbaj de mare dimensiune (LLM) și a arhitecturii acestora
  • Experiență cu Python și PyTorch
  • Familiarizare de bază cu ecosistemul Hugging Face

Publicul țintă

  • Practicieni în domeniul ML
  • Dezvoltatori AI
 14 Ore

Numărul de participanți


Pret per participant

Cursuri viitoare

Categorii înrudite