Schița de curs
Modulul 1: Python de Bază pentru Fluxuri de Lucru ML
• Lansarea cursului și configurarea mediului
Alinierea obiectivelor și configurarea unui spațiu de lucru Python ML reproducibil
• Elementele esențiale ale limbajului Python (curs rapid)
Revizuirea sintaxei, fluxului de control, funcțiilor și modelelor utilizate frecvent în codurile ML
• Structuri de date pentru ML
Liste, dicționare, seturi și tupluri pentru caracteristici, etichete și metadate
• Comprehensions și instrumente funcționale
Exprimarea transformărilor folosind comprehensions și funcții de ordin înalt
• Python orientat pe obiecte pentru dezvoltatorii ML
Clase, metode, compoziție și decizii practice de proiectare
• dataclasses și modelare ușoară
Containere tipizate pentru configurare, exemple și rezultate
• Decoratori și manageri de context
Modele de temporizare, caching, logare și execuție sigură a resurselor
• Lucrul cu fișiere și căi
Gestionarea robustă a seturilor de date și formate de serializare
• Excepții și programare defensivă
Scrierea scripturilor ML care eșuează în siguranță și transparență
• Module, pachete și structura proiectului
Organizarea codurilor ML reutilizabile
• Tipizare și calitate a codului
Sugestii de tip, documentație și structură prietenoasă pentru lint
Modulul 2: Python Numeric, SciPy și Gestionarea Datelor
• Fundamentele NumPy pentru calcul vectorizat
Operații eficiente cu array-uri și codare conștientă de performanță
• Indexare, tăiere, broadcasting și forme
Manipularea sigură a tensorilor și raționamentul formelor
• Elemente esențiale de algebră liniară cu NumPy și SciPy
Operații stabile cu matrice și descompuneri utilizate în ML
• Scufundare în SciPy
Statistică, optimizare, ajustare a curbelor și matrici rare
• Pandas pentru date tabulare ML
Curățarea, îmbinarea, agregarea și pregătirea seturilor de date
• Scufundare în scikit-learn
Interfața estimator, conducte și fluxuri de lucru reproducibile
• Elemente esențiale de vizualizare
Grafice de diagnostic pentru explorarea datelor și comportamentul modelelor
Modulul 3: Modele de Programare pentru Construirea Aplicațiilor ML
• De la notebook la proiect menținabil
Refactorizarea codului exploratoriu în pachete structurate
• Managementul configurației
Parametri externi și validare la pornire
• Logare, avertismente și observabilitate
Logare structurată pentru sisteme ML debugabile
• Componente reutilizabile cu OOP și compoziție
Proiectarea de transformatoare și predictori extensibili
• Modele practice de proiectare
Modelul Pipeline, Factory sau Registry, Strategy și Adapter
• Validarea datelor și verificări de schemă
Prevenirea problemelor silențioase ale datelor
• Performanță și profilare
Identificarea punctelor de blocare și aplicarea tehnicilor de optimizare
• Interfețe I/O și inferență pentru modele
Persistență sigură și interfețe de predicție curate
• Construcție mini de la cap la capăt
Conductă ML în stil de producție cu configurare și logare
Modulul 4: Învățare Statistică pentru Date Tabulare, Text și Imagine
• Fundamente de evaluare
Divizarea în seturi de antrenament și validare, cross-validation sinceră și metrici aliniate afacerii
• ML tabular avansat
GLM-uri regularizate, ansambluri de arbori și preprocesare fără scurgeri
• Calibrare și incertitudine
Scalare Platt, regresie izotonică, bootstrap și predicție conformă
• Metode clasice NLP
Compromisuri de tokenizare, TF-IDF, modele liniare și Naive Bayes
• Modelare de subiecte
Fundamente LDA și limitări practice
• Computer vision clasic
HOG, PCA și conducte bazate pe caracteristici
• Analiza erorilor
Detecția bias-ului, zgomotul etichetelor și corelațiile false
• Laboratoare practice
Conductă tabulară fără scurgeri
Compararea și interpretarea bazelor de text
Bază de vision clasică cu analiză structurată a eșecurilor
Modulul 5: Rețele Neuronale pentru Date Tabulare, Text și Imagine
• Stăpânirea buclei de antrenament
Bucle PyTorch curate cu AMP, clipping și reproductibilitate
• Optimizare și regularizare
Inițializare, normalizare, optimizatori și planificatori
• Precizie mixtă și scalare
Acumularea gradientului și strategii de checkpointing
• Rețele neuronale tabulare
Încorporări categorice, încrucișări de caracteristici și studii de ablare
• Rețele neuronale pentru text
Încorporări, CNNs, BiLSTM sau GRU și gestionarea secvențelor
• Rețele neuronale pentru vizualizare
Fundamentele CNN și arhitecturi de tip ResNet
• Laboratoare practice
Cadru de antrenament reutilizabil
Compararea NN tabular vs boosting
CNN cu experimente de augmentare și planificare
Modulul 6: Arhitecturi Neuronale Avansate
• Strategii de transfer learning
Modele de înghețare și dezghețare, rate de învățare discriminative
• Arhitecturi Transformer pentru text
Mecanisme de self-attention și abordări de fine-tuning
• Structuri de bază pentru vizualizare și predicție densă
Concepte ResNet, EfficientNet, Vision Transformers și U-Net
• Arhitecturi tabulare avansate
TabTransformer, FT-Transformer și rețele Deep and Cross
• Considerații pentru serii de timp
Divizări temporale și detectarea schimbării covariate
• Tehnici PEFT și de eficiență
Compromisuri LoRA, distilare și cuantizare
• Laboratoare practice
Fine-tuning pentru un transformer de text preantrenat
Fine-tuning pentru un model de vizualizare preantrenat
Compararea transformer tabular vs GBDT
Modulul 7: Sisteme Generative AI
• Fundamentele prompting-ului
Prompting structurat și generare controlată
• Fundamentele LLM
Tokenizare, instruire pe instrucțiuni și atenuarea halucinațiilor
• Generare Augmentată de Recuperare
Fragmentare, încorporări, căutare hibridă și metrici de evaluare
• Strategii de fine-tuning
LoRA și QLoRA cu controale de calitate a datelor
• Modele de difuzie
Intuiția difuziei latente și adaptarea practică
• Date tabulare sintetice
CTGAN și considerente de confidențialitate
• Laboratoare practice
Mini-aplicație RAG în stil de producție
Validarea ieșirilor structurate cu aplicarea schemei
Experimentare opțională cu difuzie
Modulul 8: Agenți AI și MCP
• Proiectarea buclei agentului
Observă, planifică, acționează, reflectă și persistă
• Arhitecturi de agenți
ReAct, plan-and-execute și coordonare multi-agent
• Managementul memoriei
Abordări episodice, semantice și scratchpad
• Integrarea instrumentelor și siguranța
Contracte de instrumente, sandboxing și apărare împotriva injecțiilor de prompt
• Cadre de evaluare
Trasee rejucabile, suite de sarcini și teste de regresie
• MCP și interoperabilitate bazată pe protocol
Proiectarea serverelor MCP cu expunere sigură a instrumentelor
• Laboratoare practice
Construiește un agent de la zero
Expune instrumente prin server de tip MCP
Creează un cadru de evaluare cu constrângeri de siguranță
Cerințe
Participanții ar trebui să aibă cunoștințe de bază în programarea Python.
Acest program este destinat profesioniștilor tehnici de nivel intermediar până la avansat.
Mărturii (2)
ecosistemul ML nu include doar MLFlow, ci și Optuna, hyperops, Docker și Docker-Compose
Guillaume GAUTIER - OLEA MEDICAL
Curs - MLflow
Tradus de catre o masina
M-a plăcut să particip la instruirea Kubeflow, care a avut loc la distanță. Această instruire mi-a permis să consolidez cunoștințele despre serviciile AWS, K8s și toate instrumentele devOps în jurul Kubeflow, care reprezintă bazele necesare pentru a aborda subiectul cu succes. Vreau să-i mulțumesc lui Malawski Marcin pentru răbdarea sa și profesionalismul demonstrat în instruire și sfaturi privind cele mai bune practici. Malawski abordează subiectul din diferite unghiuri, folosind diferite instrumente de implementare precum Ansible, EKS kubectl, Terraform. Acum sunt cu adevărat convins că intru în domeniul de aplicație potrivit.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Curs - Kubeflow
Tradus de catre o masina