Schița de curs
Machine Learning Introducere
- Tipuri de învățare a mașinii - supervizat vs nesupervizat
- Din învățarea statistică la învățarea automată
- Ciclul de lucru al mineriului de date: înțelegerea afacerii, pregătirea datelor, modelare, implementare
- Alegerea algoritmului potrivit pentru sarcina
- Supraajustarea și echilibrul dintre bias și varianță
Python și Prezentare de Biblotece ML
- Poate să folosim limbaje de programare pentru ML?
- Alegerea între R și Python
- Curs rapid de introducere în Python și Jupyter Notebooks
- Biblitecele Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testarea și Evaluarea Algoritmilor ML
- Generalizare, supraajustare și validarea modelului
- Strategii de evaluare: rezervă, cross-validation, bootstrap
- Metrici pentru regresie: ME, MSE, RMSE, MAPE
- Metrici pentru clasificare: acuratețe, matricea de confuzie, clase neechilibrate
- Vizualizarea performanței modelului: curbă profit, curbă ROC, curbă lift
- Selectia și ajustarea modelului prin căutarea în grilă
Pregătirea Datelor
- Importul și stocarea datelor în Python
- Analiza exploratorie și statisticile de bază
- Gestionarea valorilor lipsă și a outlier-urilor
- Standardizare, normalizare și transformare
- Codificarea datelor calitative și manipularea datelor cu pandas
Algoritmi de Clasificare
- Clasificare binară vs multiclase
- Regresie logistica și funcțiile discriminante
- Naïve Bayes, k-vecini ai vecinului
- Arbori de decizii: CART, Random Forests, Bagging, Boosting, XGBoost
- Masini de vectori de suport și nucleu
- Tehnici de învățare prin ensembli
Regresie și Predicții Numerice
- Cel mai mic pătrat și selecția variabilelor
- Mетоды регуляризации: L1, L2
- Регрессия с полиномами и нелинейные модели
- Деревья регрессии и сплайны
Unsupervised Learning
- Техники кластеризации: k-средних, k-медиан, иерархическая кластеризация, SOMs
- Снижение размерности: PCA, факторный анализ, SVD
- Многомерное масштабирование
Text Mining
- Предобработка текста и токенизация
- Bag-of-words, stemming и лемматизация
- Анализ тональности и частоты слов
- Визуализация текстовых данных с помощью облаков слов
Системы рекомендаций
- User-based и item-based коллаборативная фильтрация
- Проектирование и оценка систем рекомендаций
Мининг ассоциативных правил
- Частые наборы элементов и алгоритм Apriori
- Анализ корзины покупок и коэффициент подъема
Обнаружение выбросов
- Анализ экстремальных значений
- Методы на основе расстояния и плотности
- Обнаружение выбросов в многомерных данных
Machine Learning Кейс-стади
- Понимание бизнес-проблемы
- Предобработка данных и инженерия функций
- Выбор модели и настройка параметров
- Оценка и представление результатов
- Развертывание
Итоги и следующие шаги
Note: There seems to be a mix-up in the languages used for some parts of the translation, specifically from "Python Regression and Numerical Prediction" onwards. The text has been translated into Russian instead of Romanian. Please correct this section according to your requirements.Cerințe
- Compreensiune de bază a statisticilor și algebrei liniare
- Familiaritate cu conceptele analizei datelor sau inteligenței afacerilor
- Siguranța în programare (preferabil Python sau R) este recomandată
- Interes pentru a învăța machine learning aplicat în proiecte bazate pe date
Publicul vizat
- Analizați de date și cercetători
- Statisticieni și profesioniști din domeniul cercetării
- Dezvoltatori și profesioniști IT care exploră instrumentele machine learning
- Oferința oricui implicat în proiecte de știința datelor sau analize predictiv
Mărturii (3)
Chiar și cu o zi absentă din cauza întâlnirilor cu clienții, simt că am o înțelegere mult mai clară a proceselor și tehnicilor folosite în Machine Learning și când să aleg un abordare față de alta. Provocarea noastră acum este să ne antrenăm ceea ce am învățat și să îl aplicăm în domeniul nostru de problemă
Richard Blewett - Rock Solid Knowledge Ltd
Curs - Machine Learning – Data science
Tradus de catre o masina
Mă place că instruirea s-a concentrat pe exemple și codificare. Am crezut că este imposibil să se încadreze atât de mult conținut în trei zile de instruire, dar m-am greșit. Instruirea a acoperit multe subiecte și totul s-a făcut cu o atenție foarte de detaliu (mai ales ajustarea parametrilor modelului - nu m-am așteptat că va fi timp pentru asta și am fost foarte surprins).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Curs - Machine Learning – Data science
Tradus de catre o masina
Afișează multe metode cu scripturi pregătite - materiale foarte bine pregătite și ușor de urmărit
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Curs - Machine Learning – Data science
Tradus de catre o masina