Schița de curs

Machine Learning

Introducere în Machine Learning

  • Aplicații ale învățării automate (machine learning)
  • Invățare supervizată versus invățare nesupervizată
  • Algoritmi de machine learning
    • Regresie
    • Clasificare
    • Agrupare (clustering)
    • Sisteme de recomandare
    • Detectarea anomaliei
    • Invățare prin întărirea (reinforcement learning)

Regresie

  • Regresia simplă și multiplă
    • Metoda pătratelor minime (least square method)
    • Evaluarea coeficienților
    • Verificarea acurateții estimărilor coeficienților
    • Verificarea acurateții modelului
    • Analiza post-estimare
    • Alte considerentii în modelele de regresie
    • Predictori calitativi
    • Extensii ale modelilor liniare
    • Probleme potențiale
    • Echilibrarea bias-varianță (subalocare/superalocare) pentru modele de regresie

Metode de resampling

  • Validarea croșată (cross-validation)
  • Metoda setului de validare
  • Validarea croșată cu eliminarea unei observații (leave-one-out cross-validation)
  • Validarea croșată k-fold
  • Echilibrarea bias-varianță pentru k-fold
  • Bootstrap-ul

Selectia modelului și regularizarea

  • Selectarea subset-urilor
    • Selectarea celor mai bune subset-uri
    • Selectarea treptată (stepwise selection)
    • Alegerea modelului optimal
  • Metode de reducere a dimensiunii/regularizare
    • Regresia ridge
    • Lasso și elastic net
  • Selectarea parametrului de ajustare (tuning parameter)
  • Metode de reducere a dimensiunii
    • Regresia prin componente principale (principal components regression)
    • Componentele parțiale minime (partial least squares)

Clasificare

Regresia logistică

  • Functia de cost a modelului logistic
  • Evaluarea coeficienților
  • Făcerea predictiilor
  • Raportul de șanse (odds ratio)
  • Matricile de evaluare a performanței
    • Sensibilitate/specificitate/PPV/NPV
    • Precizie
    • Curbura ROC
  • Regresia logistică multiplă
  • Regresia logistică pentru peste 2 clase de răspuns
  • Regresia logistică regularizată

Analiza discriminantă liniară (LDA)

  • Folosirea teoremei lui Bayes pentru clasificare
  • Analiza discriminantă liniară pentru p=1
  • Analiza discriminantă liniară pentru p>1

Analiza discriminantă pătratică (QDA)

K-Vecinii Cel mai Apropiți (KNN)

  • Clasificare cu limite de decizie neliniare

Machiezi de suport vectori (SVM)

  • Scopul optimizării
  • Classifier-ul marginii maxime
  • Nuclele (kernels)
  • Clasificare una împotriva unei (one-versus-one)
  • Clasificare una împotriva tuturor (one-versus-all)

Compararea metodelor de clasificare

Invățarea profundă (Deep Learning)

Introducere în invățarea profundă

Rețele neuronale artificiale (ANNs)

  • Neuronii biologici și cei artificiali
  • Hipoteza neliniară
  • Reprezentarea modelului
  • Exemple și intuiții
  • Funcțiile de transfer/funcțiile de activare
  • Clase tipice de arhitecturi de rețele
    • Rețele feedforward ANN
    • Rețele feedforward multi-stratificare (multi-layer)
  • Algoritmul backpropagation
  • Backpropagation - instruire și convergență
  • Aproximarea funcțională cu backpropagation
  • Probleme practice și de design ale învățării prin backpropagation

Invățare profundă

  • Inteligenta artificială și invățarea profundă
  • Regresia softmax
  • Invățare auto
  • Rețele adânci (deep networks)
  • Demonstrații și aplicații

Laborator:

Pornirea cu R

  • Introducere în R
  • Comenzi de bază și biblioteci
  • Manipularea datelor
  • Importarea și exportarea datelor
  • Sumele grafice și numerice
  • scrierea funcțiilor

Regresie

  • Regresia liniară simplă și multiplă
  • Termeni de interacție
  • Transformări neliniare
  • Regresia cu variabile dummy
  • Validarea croșată și bootstrap-ul
  • Metode de selectare a subset-urilor
  • Penalizarea (ridge, lasso, elastic net)

Clasificare

  • Regresia logistică, LDA, QDA și KNN
  • Resampling și regularizare
  • Machiezi de suport vectori (SVM)

Note:

  • Pentru algoritmi de machine learning, vor fi folosite studii de caz pentru a discuta aplicațiile lor, avantajele și problemele potențiale.
  • Analiza diferitelor seturi de date va fi efectuată folosind R.

Cerințe

  • Cunoașterea de bază a conceptelor statistice este dorită

Audiență

  • Data scientists
  • Ingineri în învățarea automată (machine learning)
  • Dezvoltatori de software interesați de AI
  • Cercetători care lucrează cu modelarea datelor
  • Profesioniști care doresc să aplice învățarea automată în afaceri sau industrie
 21 ore

Numărul de participanți


Pret per participant

Mărturii (6)

Cursuri viitoare

Categorii înrudite