Schița de curs
Machine Learning Introducere
- Tipuri de învățare a mașinii – supraveghere vs nesupravegheată
- Din învățarea statistică la învățarea automată
- Fluxul de lucru al mineriului de date: înțelegerea afacerii, pregătirea datelor, modelare, implementare
- Alegerea algoritmului potrivit pentru sarcina
- Superspeciale și echilibrul dintre bias și varianță
Python și Prezentarea Bibliotecilor ML
- Poate să folosim limbajele de programare pentru ML?
- Alegerea între R și Python
- Crash course în Python și Jupyter Notebooks
- Biblioteci Python: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testarea și Evaluarea Algoritmilor ML
- Generalizare, superspeciale și validarea modelului
- Strategii de evaluare: holdout, cross-validation, bootstrapping
- Metrici pentru regresie: ME, MSE, RMSE, MAPE
- Metrici pentru clasificare: acuratețe, matricea de confuzie, clase neechilibrate
- Vizualizarea performanței modelului: curbă de profit, ROC curve, curbă lift
- Selectia și ajustarea modelului prin căutare în grilă
Pregătirea Datelor
- Importul și stocarea datelor în Python
- Analiza exploratorie și statistici de bază
- Gestionarea valorilor lipsă și outlier-urilor
- Standardizare, normalizare și transformare
- Recodificarea datelor calitative și manipularea datelor cu pandas
Algoritmi de Clasificare
- Clasificare binară vs multiclase
- Regresie logistica și funcții discriminante
- Naïve Bayes, k-nearest neighbors
- Arbori de decizie: CART, Random Forests, Bagging, Boosting, XGBoost
- Masini Vector Support (SVM) și nucleu
- Tehnici de învățare prin ansamblu
Regresie și Predicții Numerice
- Cele mai mici pătrate și selecția variabilelor
- Mетоды регуляризации: L1, L2
- Регрессия полиномиального порядка и нелинейные модели
- Деревья регрессии и сплайны
Neural Networks
- Введение в нейронные сети и глубокое обучение
- Функции активации, слои и обратное распространение ошибки
- Многослойные перцептроны (MLP)
- Использование TensorFlow или PyTorch для базовой моделирования нейронных сетей
- Нейронные сети для классификации и регрессии
Прогнозирование продаж Forecasting и Predictive Analytics
- Временные ряды против прогнозирования на основе регрессии
- Обработка сезонных и трендовых данных
- Построение модели прогнозирования продаж с использованием методов машинного обучения
- Оценка точности прогноза и неопределенности
- Business интерпретация и коммуникация результатов
Unsupervised Learning
- Кластеризационные техники: k-средние, k-medoids, иерархическая кластеризация, SOMs
- Снижение размерности: PCA, факторный анализ, SVD
- Многомерное масштабирование
Текстовый анализ
- Предобработка текста и токенизация
- Bag-of-words, стемминг и лемматизация
- Анализ тональности и частоты слов
- Визуализация текстовых данных с помощью облаков слов
Системы рекомендаций
- Пользовательский и предметный коллаборативный фильтринг
- Проектирование и оценка систем рекомендаций
Минирование ассоциативных паттернов
- Частые наборы элементов и алгоритм Apriori
- Анализ корзины покупок и отношение подъема
Обнаружение выбросов
- Анализ экстремальных значений
- Методы на основе расстояния и плотности
- Обнаружение выбросов в многомерных данных
Machine Learning Случайное исследование
- Понимание бизнес-проблемы
- Предобработка данных и инженерия признаков
- Выбор модели и настройка параметров
- Оценка и представление результатов
- Развертывание
Сводка и следующие шаги
**Note:** The translation was stopped due to the presence of non-translatable elements (e.g., Neural Networks, Python) that were kept in their original form.Cerințe
- Cunoștințe de bază ale conceptelor de învățare automată, cum ar fi învățarea supravegheată și cea nesupravegheată
- Familiaritate cu Python programare (variabile, bucle, funcții)
- Experiență de bază cu manipularea datelor folosind biblioteci precum pandas sau NumPy este utilă, dar nu este obligatorie
- Nu se presupune experiență anterioară cu modelare avansată sau rețele neuronale
Publicul vizat
- Cercetători de date
- Business analisti
- Ingineri software și profesioniști tehnici care lucrează cu date
Mărturii (2)
ecosistemul ML nu se limitează la MLFlow ci include și Optuna, hyperops, docker, docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Curs - MLflow
Tradus de catre o masina
Am apreciat participarea la antrenamentul Kubeflow, care s-a desfășurat în mod remote. Acest antrenament m-a permis să consolidez cunoștințele despre serviciile AWS, K8s și toolele devOps din jurul Kubeflow, care sunt bazele necesare pentru a aborda subiectul în mod corespunzător. Doresc să-i mulțumesc lui Malawski Marcin pentru paciența și profesionalismul arătat în antrenament și în oferirea de sfaturi privind cele mai bune practici. Malawski abordează subiectul din diferite perspective, folosind diverse instrumente de dezvoltare Ansible, EKS kubectl, Terraform. Acum sunt cu siguranță convins că mă îndrept către domeniul potrivit de aplicare.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Curs - Kubeflow
Tradus de catre o masina