Schița de curs

Introducere

Această secțiune oferă o introducere generală cu privire la situațiile în care se utilizează 'machine learning', ce ar trebui luat în considerare și ce înseamnă toate acestea, inclusiv avantajele și dezavantajele. Tipuri de date (structurate/ne-structurate/statice/în flux), validitatea/volumul de date, analiza bazată pe date vs. analiza bazată pe utilizator, modele statistice vs. modele de învățare automată/ provocările învățării nesupravegheate, compromisul părtinire-varianță, iterație/evaluare, abordări de validare încrucișată, supervizat/ne-supravegheat/reforțare.

TEMATICI MAJORE.

1. Înțelegerea lui Bayes naiv

  • Conceptele de bază ale metodelor bayesiene
  • Probabilitate
  • Probabilitate jointă
  • Probabilitate condițională cu teorema lui Bayes
  • Algoritmul Bayes naiv
  • Clasificarea Bayes naiv
  • Estimatoarele Laplace
  • Utilizarea caracteristicilor numerice cu Bayes naiv

2. Înțelegerea arborilor de decizie

  • Divizează și conquerează
  • Algoritmul arborelui de decizie C5.0
  • Alegerea celei mai bune împărțiri
  • Tăierea arborelui de decizie

3. Înțelegerea rețelelor neuronale

  • Din neuroni biologici la artificiali
  • Funcțiile de activare
  • Topologia rețelei
  • Numărul stratelor
  • Sensul călătoriei informației
  • Numărul nodurilor din fiecare strat
  • Treinarea rețelelor neuronale cu retropropagare
  • Deep Learning

4. Înțelegerea mașinilor vectoriale de suport

  • Clasificarea cu iperplane
  • Găsirea marginii maxime
  • Cazul datelor separabile liniar
  • Cazul datelor ne-separabile liniar
  • Utilizarea nucleurilor pentru spații non-linare

5. Înțelegerea grupării

  • Gruparea ca sarcina de învățare automată
  • Algoritmul k-means pentru grupare
  • Utilizarea distanței pentru a atribui și actualiza grupurile
  • Alegerea numărului adecvat de grupuri

6. Măsurarea performanței pentru clasificare

  • Munca cu datele de predicție ale clasificării
  • O privire mai atentă la matricea de confuzie
  • Utilizarea matricelor de confuzie pentru a măsura performanța
  • Peste acuratețe – alte măsurători ale performanței
  • Statisticile kappa
  • Sensibilitate și specificitate
  • Precizie și recall
  • Măsuratorile F
  • Vizualizarea compromisurilor de performanță
  • Curbelor ROC
  • Estimarea viitoarei performanțe
  • Metoda rezervării
  • Validarea încrucișată
  • Bootstrap eșantionaj

7. Reglarea modelelor de stoc pentru o performanță mai bună

  • Utilizarea caretului pentru reglare automată a parametrilor
  • Creați un model simplu ajustat
  • Personalizarea procesului de ajustare
  • Îmbunătățirea performanței modelelor cu învățarea meta
  • Comprende legăturile
  • Bagging
  • Boosting
  • Păduri aleatorii
  • Treinarea pădurilor aleatoare
  • Evaluarea performanței pădurilor aleatoare

TEME MINORE

8. Înțelegerea clasificării cu ajutorul celor mai apropiați vecini

  • Algoritmul kNN
  • Calea distanței
  • Alegerea unui k adecvat
  • Pregătirea datelor pentru utilizare cu kNN
  • De ce algoritmul kNN este leneș?

9. Înțelegerea regulilor de clasificare

  • Separate și conquerează
  • Algoritmul One Rule
  • Algoritmul RIPPER
  • Reguli din arborele de decizie

10. Înțelegerea regresiei

  • Regressia liniară simplă
  • Estimarea celor mai mici pătrate obișnuite
  • Corespunzător
  • Regressia liniară multiplă

11. Înțelegerea arborilor de regresie și a arborilor model

  • Adăugarea regresiei la arborele

12. Înțelegerea regulilor de asociere

  • Algoritmul Apriori pentru învățare cu reguli de asociere
  • Măsurarea interesului regulelor – suport și încredere
  • Construirea unui set de reguli cu principiul Apriori

Extras

  • Spark/PySpark/MLlib și Multi-armed bandits

Cerințe

Python Cunoaștere

 21 ore

Numărul de participanți


Pret per participant

Mărturii (7)

Upcoming Courses

Categorii înrudite