Schița de curs
- Introducere în învățarea automată Tipuri de învățare automată – învățare supravegheată versus învățare nesupravegheată De la învățarea statistică la învățarea automată Fluxul de lucru Data Mining: Înțelegerea afacerii Înțelegerea datelor Pregătirea datelor Modelare Evaluare Implementare Algoritmi de învățare automată Alegerea algoritmului adecvat problemei Compensarea supraadaptarii și a variației prejudecate în ML ML biblioteci și limbaje de programare De ce să folosiți un limbaj de programare Alegerea între R și Python Curs rapid Python Resurse Python Biblioteci Python pentru învățare automată Caiete Jupyter și codare interactivă Testarea algoritmilor ML Generalizare și supraadaptare Evitarea supraadaptării Metoda Holdout Validare încrucișată Bootstrapping Evaluarea predicțiilor numerice Evaluarea preciziei numerice: ME, MSE, RMSE, MAPE Stabilitatea parametrilor și a predicției Evaluarea algoritmilor de clasificare Acuratețea și problemele acesteia Matricea de confuzie Problema claselor dezechilibrate Vizualizarea performanței modelului Curba profitului Curba ROC Curba de ridicare Selectarea modelului Ajustarea modelului – strategii de căutare în grilă Exemple în Python Pregătirea datelor Importul și stocarea datelor Înțelegerea datelor – explorări de bază Manipulări de date cu biblioteca panda Transformări de date – dispută de date Analiză exploratorie Observații lipsă – detecție și soluții Valori aberante – detecție și strategii Standardizare, normalizare, binarizare Recodificarea datelor calitative Exemple în Clasificare Python Clasificare binară vs clasificare multiclasă Clasificare prin funcții matematice Liniar funcții discriminante Funcții discriminante pătratice Regresie logistică și abordare a probabilității k-cei mai apropiați vecini Naïve Bayes Arbori de decizie CART Bagging Random Forests Boosting Xgboost Support Vector Machines and kernels Maximal Margin Clasifier Support Vector Machine Learning Ensemble Exemple în Python Regresie și predicție numerică Estimarea celor mai mici pătrate Variabile tehnici de selecție Regularizare și stabilitate- L1, L2 Neliniarități și cele mai mici pătrate generalizate Regresie polinomială Spline de regresie Arbori de regresie Exemple în Python Învățare nesupravegheată Clustering Clustering-based centroid – k-means, k-medoids, PAM, CLARA clustering ierarhic – Diana, Agnes Model- clustering bazat - EM Hărți de auto-organizare Evaluarea și evaluarea clusterelor Reducerea dimensionalității Analiza componentelor principale și analiza factorilor Descompunerea valorii unice Scalare multidimensională Exemple în Python Exploatarea textului Preprocesarea datelor Modelul sac-de-cuvinte Strângerea și lemizarea Analiza frecvențelor cuvintelor Analiza sentimentelor Crearea norilor de cuvinte Exemple în motoare de recomandări Python și filtrare colaborativă Date de recomandare Filtrare colaborativă bazată pe utilizatori Filtrare colaborativă pe bază de articole Exemple în minarea modelelor de asociere Python Algoritmul seturi frecvente de articole Analiza coșului de piață Exemple în analiza valorii aberante Python Analiza valorii extreme Detectarea valorii aberante pe distanță Metode bazate pe densitate ridicată detectarea valorii aberante dimensionale Exemple în studiul de caz Python Machine Learning Înțelegerea problemelor de afaceri Preprocesarea datelor Selectarea și reglarea algoritmului Evaluarea constatărilor Implementarea
Cerințe
Cunoașterea și conștientizarea elementelor fundamentale Machine Learning
Mărturii (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Curs - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Curs - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback