Schița de curs
Introducere în Învățarea Automată
- Tipuri de învățare automată – supervizată vs nesupravegheată
- De la învățarea statistică la învățarea automată
- Fluxul de lucru în explorarea datelor: înțelegerea afacerii, pregătirea datelor, modelarea, implementarea
- Alegerea algoritmului potrivit pentru sarcină
- Supraadaptarea și compromisul bias-varianță
Prezentare generală a Python și a bibliotecilor pentru Învățare Automată
- De ce să folosim limbaje de programare pentru Învățare Automată
- Alegerea între R și Python
- Curs rapid de Python și Jupyter Notebooks
- Biblioteci Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testarea și evaluarea algoritmilor de Învățare Automată
- Generalizare, supraadaptare și validare a modelelor
- Strategii de evaluare: holdout, cross-validation, bootstrapping
- Metrici pentru regresie: ME, MSE, RMSE, MAPE
- Metrici pentru clasificare: acuratețe, matrice de confuzie, clase dezechilibrate
- Vizualizarea performanței modelelor: curba profitului, curba ROC, curba lift
- Selecția modelelor și căutarea în grilă pentru ajustare
Pregătirea Datelor
- Importul și stocarea datelor în Python
- Analiză exploratorie și statistici sumare
- Gestionarea valorilor lipsă și a valorilor aberante
- Standardizare, normalizare și transformare
- Recodificarea datelor calitative și manipularea datelor cu pandas
Algoritmi de Clasificare
- Clasificare binară vs multiclasă
- Regresie logistică și funcții discriminante
- Naïve Bayes, k-cei mai apropiați vecini
- Arbori de decizie: CART, Păduri Aleatoare, Bagging, Boosting, XGBoost
- Mașini cu vectori de suport și nuclee
- Tehnici de învățare ensemble
Regresie și Predicție Numerică
- Cele mai mici pătrate și selecția variabilelor
- Metode de regularizare: L1, L2
- Regresie polinomială și modele neliniare
- Arbori de regresie și spline
Învățare Nesupravegheată
- Tehnici de clustering: k-means, k-medoids, clustering ierarhic, SOMs
- Reducerea dimensionalității: PCA, analiza factorială, SVD
- Scalare multidimensională
Explorarea Textelor
- Preprocesarea și tokenizarea textelor
- Bag-of-words, stemming și lematizare
- Analiza sentimentelor și frecvența cuvintelor
- Vizualizarea datelor textuale cu nori de cuvinte
Sisteme de Recomandare
- Filtrare colaborativă bazată pe utilizator și pe elemente
- Proiectarea și evaluarea motoarelor de recomandare
Explorarea Modelelor de Asociere
- Seturi frecvente și algoritmul Apriori
- Analiza coșurilor de cumpărături și raportul de lift
Detectarea Valorilor Aberante
- Analiza valorilor extreme
- Metode bazate pe distanță și densitate
- Detectarea valorilor aberante în date de dimensiuni mari
Studiu de Caz în Învățarea Automată
- Înțelegerea problemei de afaceri
- Pregătirea datelor și inginerie de caracteristici
- Selecția modelelor și ajustarea parametrilor
- Evaluarea și prezentarea rezultatelor
- Implementare
Rezumat și Pași Următori
Cerințe
- Cunoștințe de bază în statistică și algebră liniară
- Familiaritate cu concepte de analiză a datelor sau inteligență de afaceri
- Expunere la programare (de preferință Python sau R) este recomandată
- Interes pentru învățarea aplicată a învățării automate pentru proiecte bazate pe date
Publicul țintă
- Analiști și specialiști în știința datelor
- Statisticieni și profesioniști în cercetare
- Dezvoltatori și profesioniști IT care explorează instrumente de învățare automată
- Oricine este implicat în proiecte de știință a datelor sau analiză predictivă
Mărturii (3)
Chiar și cu o zi absentă din cauza întâlnirilor cu clienții, simt că am o înțelegere mult mai clară a proceselor și tehnicilor folosite în Machine Learning și când să aleg un abordare față de alta. Provocarea noastră acum este să ne antrenăm ceea ce am învățat și să îl aplicăm în domeniul nostru de problemă
Richard Blewett - Rock Solid Knowledge Ltd
Curs - Machine Learning – Data science
Tradus de catre o masina
Mă place că instruirea s-a concentrat pe exemple și codificare. Am crezut că este imposibil să se încadreze atât de mult conținut în trei zile de instruire, dar m-am greșit. Instruirea a acoperit multe subiecte și totul s-a făcut cu o atenție foarte de detaliu (mai ales ajustarea parametrilor modelului - nu m-am așteptat că va fi timp pentru asta și am fost foarte surprins).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Curs - Machine Learning – Data science
Tradus de catre o masina
Afișează multe metode cu scripturi pregătite - materiale foarte bine pregătite și ușor de urmărit
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Curs - Machine Learning – Data science
Tradus de catre o masina