Schița de curs

1. Înțelegerea clasificării folosind cei mai apropiați vecini

  • Algoritmul kNN
  • Calcularea distanței
  • Alegerea unui k
  • Pregătirea datelor pentru utilizare cu kNN
  • De ce este leneș algoritmul kNN?

2. Înțelegerea naivului Bayes

  • Concepte de bază ale metodelor bayesiene
  • Probabilitate
  • Probabilitate comună
  • Probabilitate condiționată cu teorema lui Bayes
  • Algoritmul naiv Bayes
  • Clasificarea naiva Bayes
  • Estimatorul Laplace
  • Folosind caracteristici numerice cu Bayes naiv

3. Înțelegerea arborilor de decizie

  • Diviza și cuceri
  • Algoritmul arborelui de decizie C5.0
  • Alegerea celei mai bune diviziuni
  • Tăierea arborelui de decizie

4. Înțelegerea regulilor de clasificare

  • Separați și cuceriți
  • Algoritmul One Rule
  • Algoritmul RIPPER
  • Reguli din arborele de decizie

5. Înțelegerea regresiei

  • Regresia liniară simplă
  • Estimarea obișnuită cu cele mai mici pătrate
  • Corelații
  • Regresie liniară multiplă

6. Înțelegerea arborilor de regresie și a arborilor model

  • Adăugarea regresiei la copaci

7. Înțelegerea rețelelor neuronale

  • De la neuroni biologici la neuroni artificiali
  • Funcții de activare
  • Topologie de rețea
  • Numărul de straturi
  • Direcția de deplasare a informațiilor
  • Numărul de noduri din fiecare strat
  • Antrenarea rețelelor neuronale cu backpropagation

8. Înțelegerea mașinilor Vector Vector

  • Clasificarea cu hiperplane
  • Găsirea marjei maxime
  • Cazul datelor separabile liniar
  • Cazul datelor neliniar separabile
  • Utilizarea nucleelor pentru spații neliniare

9. Înțelegerea regulilor de asociere

  • Algoritmul Apriori pentru învățarea regulilor de asociere
  • Măsurarea interesului regulilor – sprijin și încredere
  • Construirea unui set de reguli cu principiul Apriori

10. Înțelegerea grupării

  • Clustering ca sarcină de învățare automată
  • Algoritmul k-means pentru grupare
  • Utilizarea distanței pentru a atribui și actualiza clustere
  • Alegerea numărului adecvat de clustere

11. Măsurarea performanței pentru clasificare

  • Lucrul cu datele de predicție de clasificare
  • O privire mai atentă asupra matricelor de confuzie
  • Utilizarea matricelor de confuzie pentru a măsura performanța
  • Dincolo de acuratețe – alte măsuri de performanță
  • Statistica kappa
  • Sensibilitate și specificitate
  • Precizie și reamintire
  • Măsura F
  • Vizualizarea compromisurilor de performanță
  • curbele ROC
  • Estimarea performantelor viitoare
  • Metoda holdout
  • Validare încrucișată
  • Bootstrap eșantionare

12. Reglarea modelelor de stoc pentru o performanță mai bună

  • Folosind caret pentru reglarea automată a parametrilor
  • Crearea unui model reglat simplu
  • Personalizarea procesului de reglare
  • Îmbunătățirea performanței modelului cu meta-learning
  • Înțelegerea ansamblurilor
  • Bagare
  • Amplificare
  • Păduri aleatorii
  • Antrenarea pădurilor la întâmplare
  • Evaluarea aleatorie a performanței pădurilor

13. Deep Learning

  • Trei clase de Deep Learning
  • Deep Autoencoders
  • Pre-antrenat Deep Neural Networks
  • Rețele de stivuire profundă

14. Discuții despre domenii specifice de aplicare

 21 ore

Mărturii (1)

Cursuri înrudite

Categorii înrudite