Schița de curs

Introducere

  • Înțelegerea importanței pregătirii datelor în analiză și învățare automată
  • Fluxul de pregătire a datelor și rolul său în ciclul de viață al datelor
  • Explorarea provocărilor comune ale datelor brute și impactul asupra analizei

Colectarea și achiziționarea datelor

  • Surse de date: baze de date, API-uri, foi de calcul, fișiere text și altele
  • Tehnici de colectare a datelor și asigurarea calității datelor în timpul colectării
  • Colectarea datelor din diverse surse

Tehnici de curățare a datelor

  • Identificarea și gestionarea valorilor lipsă, a valorilor aberante și a inconsecvențelor
  • Gestionarea duplicatelor și a erorilor din setul de date
  • Curățarea seturilor de date din lumea reală

Transformarea și standardizarea datelor

  • Tehnici de normalizare și standardizare a datelor
  • Gestionarea datelor categorice: codificare, grupare și inginerie de caracteristici
  • Transformarea datelor brute în formate utilizabile

Integrarea și agregarea datelor

  • Combinarea și unirea seturilor de date din diverse surse
  • Rezolvarea conflictelor de date și alinierea tipurilor de date
  • Tehnici de agregare și consolidare a datelor

Asigurarea calității datelor

  • Metode de asigurare a calității și integrității datelor pe parcursul procesului
  • Implementarea verificărilor de calitate și a procedurilor de validare
  • Studii de caz și aplicații practice ale asigurării calității datelor

Reducerea dimensionalității și selecția caracteristicilor

  • Înțelegerea necesității reducerii dimensionalității
  • Tehnici precum PCA, selecția caracteristicilor și strategii de reducere
  • Implementarea tehnicilor de reducere a dimensionalității

Rezumat și pași următori

Cerințe

  • Înțelegere de bază a conceptelor de date

Publicul țintă

  • Analiști de date
  • Administratori de baze de date
  • Profesioniști IT
 14 Ore

Numărul de participanți


Pret per participant

Mărturii (2)

Cursuri viitoare

Categorii înrudite