Schița de curs

Introducere

  • Înțelegerea importanței pregătirii datelor în analiza și machine learning
  • Tubulajul de pregătire a datelor și rolul său în ciclul de viață al datelor
  • Explorarea provocărilor comune din datele brute și impactul lor asupra analizei

Colectarea și Acțiunea Asupra Datelor

  • Surse ale datelor: baze de date, API-uri, fețe de calcul, fișiere text, etc.
  • Tehnici de colectare a datelor și asigurarea calității acestora în timpul colectării
  • Colectarea datelor din diverse surse

Tehnici de Curățare a Datelor

  • Identificarea și gestionarea valorilor lipsă, outlier-urilor și incoerențelor
  • Gestionarea dublurilor și erorilor din setul de date
  • Curățarea seturilor de date din lumea reală

Tehnici de Transformare și Standardizare a Datelor

  • Tehnici de normalizare și standardizare a datelor
  • Gestionarea datelor categorice: codificare, binning și inginerie de caracteristici
  • Transformarea datelor crude în formate utilizabile

Tehnici de Integrare și Agregare a Datelor

  • Combinarea seturilor de date din surse diferite
  • Rezolvarea conflictelor de date și alinierea tipurilor de date
  • Tehnici de agregare și consolidare a datelor

Asigurarea Calității Datelor

  • Metode pentru asigurarea calității și integrității datelor în tot procesul
  • Implementarea controlurilor de calitate și procedurilor de validare
  • Studii de caz și aplicări practice ale asigurării calității datelor

Reducerea Dimensiunii și Selectia Caracteristicilor

  • Înțelegerea nevoiei de reducere a dimensiunii
  • Tehnici precum PCA, selectia caracteristicilor și strategiile de reducere
  • Implementarea tehnicilor de reducere a dimensiunii

Schimbări și Pași Următori

Cerințe

  • Cunoștințe de bază ale conceptelor de date

Audiență

  • Analisti de date
  • Administratori de baze de date
  • Profesioniști IT
 14 ore

Numărul de participanți


Pret per participant

Mărturii (2)

Cursuri viitoare

Categorii înrudite