Schița de curs

Introducere în Învățarea Automată

  • Tipuri de învățare automată – supervizată vs nesupervizată
  • De la învățarea statistică la învățarea automată
  • Fluxul de lucru în data mining: înțelegerea afacerii, pregătirea datelor, modelarea, implementarea
  • Alegerea algoritmului potrivit pentru sarcină
  • Supraadaptarea și compromisul bias-varianță

Prezentare generală a Python și a bibliotecilor pentru Învățarea Automată

  • De ce să folosim limbaje de programare pentru Învățarea Automată
  • Alegerea între R și Python
  • Curs rapid de Python și Jupyter Notebooks
  • Biblioteci Python: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testarea și evaluarea algoritmilor de Învățare Automată

  • Generalizare, supraadaptare și validare a modelelor
  • Strategii de evaluare: holdout, cross-validare, bootstrapping
  • Metrici pentru regresie: ME, MSE, RMSE, MAPE
  • Metrici pentru clasificare: acuratețe, matrice de confuzie, clase dezechilibrate
  • Vizualizarea performanței modelului: curba profitului, curba ROC, curba lift
  • Selectarea modelului și căutarea în grilă pentru ajustare

Pregătirea datelor

  • Importul și stocarea datelor în Python
  • Analiză exploratorie și statistici descriptive
  • Gestionarea valorilor lipsă și a valorilor aberante
  • Standardizare, normalizare și transformare
  • Recodificarea datelor calitative și manipularea datelor cu pandas

Algoritmi de clasificare

  • Clasificare binară vs multiclasă
  • Regresie logistică și funcții discriminante
  • Naïve Bayes, k-vecini cei mai apropiați
  • Arbori de decizie: CART, Păduri aleatoare, Bagging, Boosting, XGBoost
  • Mașini cu vectori de suport și nuclee
  • Tehnici de învățare ensemble

Regresie și predicție numerică

  • Metoda celor mai mici pătrate și selecția variabilelor
  • Metode de regularizare: L1, L2
  • Regresie polinomială și modele neliniare
  • Arbori de regresie și spline

Rețele neuronale

  • Introducere în rețele neuronale și învățare profundă
  • Funcții de activare, straturi și backpropagation
  • Multilayer perceptrons (MLP)
  • Folosirea TensorFlow sau PyTorch pentru modelarea de bază a rețelelor neuronale
  • Rețele neuronale pentru clasificare și regresie

Previziuni de vânzări și analitică predictivă

  • Previziuni bazate pe serii temporale vs regresie
  • Gestionarea datelor sezoniere și bazate pe trend
  • Construirea unui model de previziune a vânzărilor folosind tehnici de Învățare Automată
  • Evaluarea acurateței previziunilor și incertitudinii
  • Interpretarea și comunicarea rezultatelor în context de afaceri

Învățare nesupervizată

  • Tehnici de clustering: k-means, k-medoids, clustering ierarhic, SOMs
  • Reducerea dimensionalității: PCA, analiza factorială, SVD
  • Scalare multidimensională

Minerit de text

  • Preprocesarea textului și tokenizarea
  • Sac de cuvinte, stemming și lematizare
  • Analiza sentimentelor și frecvența cuvintelor
  • Vizualizarea datelor text cu nori de cuvinte

Sisteme de recomandare

  • Filtrare colaborativă bazată pe utilizator și pe elemente
  • Proiectarea și evaluarea motoarelor de recomandare

Mineritul de modele de asociere

  • Seturi de elemente frecvente și algoritmul Apriori
  • Analiza coșurilor de cumpărături și raportul de lift

Detectarea valorilor aberante

  • Analiza valorilor extreme
  • Metode bazate pe distanță și densitate
  • Detectarea valorilor aberante în date de dimensiuni mari

Studiu de caz în Învățarea Automată

  • Înțelegerea problemei de afaceri
  • Pregătirea datelor și inginerie de caracteristici
  • Selectarea modelului și ajustarea parametrilor
  • Evaluarea și prezentarea rezultatelor
  • Implementare

Rezumat și pași următori

Cerințe

  • Cunoștințe de bază despre concepte de învățare automată, cum ar fi învățarea supervizată și nesupervizată
  • Familiaritate cu programarea în Python (variabile, bucle, funcții)
  • O oarecare experiență cu manipularea datelor folosind biblioteci precum pandas sau NumPy este utilă, dar nu este obligatorie
  • Nu este necesară experiență anterioară cu modelare avansată sau rețele neuronale

Public țintă

  • Oameni de știință de date
  • Analiști de afaceri
  • Ingineri software și profesioniști tehnici care lucrează cu date
 28 Ore

Numărul de participanți


Pret per participant

Mărturii (2)

Cursuri viitoare

Categorii înrudite