Schița de curs
Machine Learning Introducere
- Tipuri de învățare a mașinii – supraveghere vs nesupravegheată
- Din învățarea statistică la învățarea automată
- Fluxul de lucru al mineriului de date: înțelegerea afacerii, pregătirea datelor, modelare, implementare
- Alegerea algoritmului potrivit pentru sarcina
- Superspeciale și echilibrul dintre bias și varianță
Python și Prezentarea Bibliotecilor ML
- Poate să folosim limbajele de programare pentru ML?
- Alegerea între R și Python
- Crash course în Python și Jupyter Notebooks
- Biblioteci Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testarea și Evaluarea Algoritmilor ML
- Generalizare, superspeciale și validarea modelului
- Strategii de evaluare: holdout, cross-validation, bootstrapping
- Metrici pentru regresie: ME, MSE, RMSE, MAPE
- Metrici pentru clasificare: acuratețe, matricea de confuzie, clase neechilibrate
- Vizualizarea performanței modelului: curbă de profit, ROC curve, curbă lift
- Selectia și ajustarea modelului prin căutare în grilă
Pregătirea Datelor
- Importul și stocarea datelor în Python
- Analiza exploratorie și statistici de bază
- Gestionarea valorilor lipsă și outlier-urilor
- Standardizare, normalizare și transformare
- Recodificarea datelor calitative și manipularea datelor cu pandas
Algoritmi de Clasificare
- Clasificare binară vs multiclase
- Regresie logistica și funcții discriminante
- Naïve Bayes, k-nearest neighbors
- Arbori de decizie: CART, Random Forests, Bagging, Boosting, XGBoost
- Masini Vector Support (SVM) și nucleu
- Tehnici de învățare prin ansamblu
Regresie și Predicții Numerice
- Cele mai mici pătrate și selecția variabilelor
- Mетоды регуляризации: L1, L2
- Регрессия полиномиального порядка и нелинейные модели
- Деревья регрессии и сплайны
Neural Networks
- Введение в нейронные сети и глубокое обучение
- Функции активации, слои и обратное распространение ошибки
- Многослойные перцептроны (MLP)
- Использование TensorFlow или PyTorch для базовой моделирования нейронных сетей
- Нейронные сети для классификации и регрессии
Прогнозирование продаж Forecasting и Predictive Analytics
- Временные ряды против прогнозирования на основе регрессии
- Обработка сезонных и трендовых данных
- Построение модели прогнозирования продаж с использованием методов машинного обучения
- Оценка точности прогноза и неопределенности
- Business интерпретация и коммуникация результатов
Unsupervised Learning
- Кластеризационные техники: k-средние, k-medoids, иерархическая кластеризация, SOMs
- Снижение размерности: PCA, факторный анализ, SVD
- Многомерное масштабирование
Текстовый анализ
- Предобработка текста и токенизация
- Bag-of-words, стемминг и лемматизация
- Анализ тональности и частоты слов
- Визуализация текстовых данных с помощью облаков слов
Системы рекомендаций
- Пользовательский и предметный коллаборативный фильтринг
- Проектирование и оценка систем рекомендаций
Минирование ассоциативных паттернов
- Частые наборы элементов и алгоритм Apriori
- Анализ корзины покупок и отношение подъема
Обнаружение выбросов
- Анализ экстремальных значений
- Методы на основе расстояния и плотности
- Обнаружение выбросов в многомерных данных
Machine Learning Случайное исследование
- Понимание бизнес-проблемы
- Предобработка данных и инженерия признаков
- Выбор модели и настройка параметров
- Оценка и представление результатов
- Развертывание
Сводка и следующие шаги
**Note:** The translation was stopped due to the presence of non-translatable elements (e.g., Neural Networks, Python) that were kept in their original form.Cerințe
- Cunoștințe de bază ale conceptelor de învățare automată, cum ar fi învățarea supravegheată și cea nesupravegheată
- Familiaritate cu Python programare (variabile, bucle, funcții)
- Experiență de bază cu manipularea datelor folosind biblioteci precum pandas sau NumPy este utilă, dar nu este obligatorie
- Nu se presupune experiență anterioară cu modelare avansată sau rețele neuronale
Publicul vizat
- Cercetători de date
- Business analisti
- Ingineri software și profesioniști tehnici care lucrează cu date
Mărturii (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Curs - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.