Schița de curs

Machine Learning Introducere

  • Tipuri de învățare a mașinii – supraveghere vs nesupravegheată
  • Din învățarea statistică la învățarea automată
  • Fluxul de lucru al mineriului de date: înțelegerea afacerii, pregătirea datelor, modelare, implementare
  • Alegerea algoritmului potrivit pentru sarcina
  • Superspeciale și echilibrul dintre bias și varianță

Python și Prezentarea Bibliotecilor ML

  • Poate să folosim limbajele de programare pentru ML?
  • Alegerea între R și Python
  • Crash course în Python și Jupyter Notebooks
  • Biblioteci Python: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testarea și Evaluarea Algoritmilor ML

  • Generalizare, superspeciale și validarea modelului
  • Strategii de evaluare: holdout, cross-validation, bootstrapping
  • Metrici pentru regresie: ME, MSE, RMSE, MAPE
  • Metrici pentru clasificare: acuratețe, matricea de confuzie, clase neechilibrate
  • Vizualizarea performanței modelului: curbă de profit, ROC curve, curbă lift
  • Selectia și ajustarea modelului prin căutare în grilă

Pregătirea Datelor

  • Importul și stocarea datelor în Python
  • Analiza exploratorie și statistici de bază
  • Gestionarea valorilor lipsă și outlier-urilor
  • Standardizare, normalizare și transformare
  • Recodificarea datelor calitative și manipularea datelor cu pandas

Algoritmi de Clasificare

  • Clasificare binară vs multiclase
  • Regresie logistica și funcții discriminante
  • Naïve Bayes, k-nearest neighbors
  • Arbori de decizie: CART, Random Forests, Bagging, Boosting, XGBoost
  • Masini Vector Support (SVM) și nucleu
  • Tehnici de învățare prin ansamblu

Regresie și Predicții Numerice

  • Cele mai mici pătrate și selecția variabilelor
  • Mетоды регуляризации: L1, L2
  • Регрессия полиномиального порядка и нелинейные модели
  • Деревья регрессии и сплайны

Neural Networks

  • Введение в нейронные сети и глубокое обучение
  • Функции активации, слои и обратное распространение ошибки
  • Многослойные перцептроны (MLP)
  • Использование TensorFlow или PyTorch для базовой моделирования нейронных сетей
  • Нейронные сети для классификации и регрессии

Прогнозирование продаж Forecasting и Predictive Analytics

  • Временные ряды против прогнозирования на основе регрессии
  • Обработка сезонных и трендовых данных
  • Построение модели прогнозирования продаж с использованием методов машинного обучения
  • Оценка точности прогноза и неопределенности
  • Business интерпретация и коммуникация результатов

Unsupervised Learning

  • Кластеризационные техники: k-средние, k-medoids, иерархическая кластеризация, SOMs
  • Снижение размерности: PCA, факторный анализ, SVD
  • Многомерное масштабирование

Текстовый анализ

  • Предобработка текста и токенизация
  • Bag-of-words, стемминг и лемматизация
  • Анализ тональности и частоты слов
  • Визуализация текстовых данных с помощью облаков слов

Системы рекомендаций

  • Пользовательский и предметный коллаборативный фильтринг
  • Проектирование и оценка систем рекомендаций

Минирование ассоциативных паттернов

  • Частые наборы элементов и алгоритм Apriori
  • Анализ корзины покупок и отношение подъема

Обнаружение выбросов

  • Анализ экстремальных значений
  • Методы на основе расстояния и плотности
  • Обнаружение выбросов в многомерных данных

Machine Learning Случайное исследование

  • Понимание бизнес-проблемы
  • Предобработка данных и инженерия признаков
  • Выбор модели и настройка параметров
  • Оценка и представление результатов
  • Развертывание

Сводка и следующие шаги

**Note:** The translation was stopped due to the presence of non-translatable elements (e.g., Neural Networks, Python) that were kept in their original form.

Cerințe

  • Cunoștințe de bază ale conceptelor de învățare automată, cum ar fi învățarea supravegheată și cea nesupravegheată
  • Familiaritate cu Python programare (variabile, bucle, funcții)
  • Experiență de bază cu manipularea datelor folosind biblioteci precum pandas sau NumPy este utilă, dar nu este obligatorie
  • Nu se presupune experiență anterioară cu modelare avansată sau rețele neuronale

Publicul vizat

  • Cercetători de date
  • Business analisti
  • Ingineri software și profesioniști tehnici care lucrează cu date
 28 ore

Numărul de participanți


Pret per participant

Mărturii (2)

Upcoming Courses

Categorii înrudite