Schița de curs

Introducere în ecosistemele Big Data

  • Prezentare generală a tehnologiilor și arhitecturilor de big data
  • Procesare în loturi vs. procesare în timp real
  • Strategii de stocare a datelor pentru scalabilitate

Procesare Avansată a Datelor cu Apache Spark

  • Optimizarea job-urilor Spark pentru performanță
  • Transformări și acțiuni avansate
  • Lucrul cu fluxuri structurate

Învățarea Automată la Scară Mare

  • Tehnici de antrenare distribuită a modelelor
  • Reglarea hiperparametrilor pe seturi de date mari
  • Implementarea modelelor în medii de big data

Învățarea Profundă pentru Big Data

  • Integrarea TensorFlow și PyTorch cu Spark
  • Fluxuri de antrenare distribuită pentru învățare profundă
  • Cazuri de utilizare în analiza de imagini, text și serii de timp

Analiză în Timp Real și Fluxuri de Date

  • Apache Kafka pentru ingestia de date în flux
  • Cadre de procesare a fluxurilor
  • Monitorizare și alertare în sistemele în timp real

Gestionarea, Securitatea și Etica Datelor

  • Cerințe de confidențialitate și conformitate a datelor
  • Controlul accesului și criptarea în sistemele de big data
  • Considerații etice în analiza la scară largă

Integrarea Big Data cu Inteligența de Afaceri

  • Vizualizarea datelor și crearea de panouri de bord pentru big data
  • Conectarea fluxurilor de big data la instrumente de BI
  • Conducerea rezultatelor de afaceri cu analize avansate

Rezumat și Pași Următori

Cerințe

  • Înțelegere solidă a conceptelor de analiză a datelor și modelare statistică
  • Experiență cu instrumente de procesare a datelor și limbaje de programare precum Python, R sau Scala
  • Cunoașterea cadrelor de calcul distribuit precum Hadoop sau Spark

Publicul țintă

  • Oameni de știință ai datelor care doresc să stăpânească procesarea datelor la scară largă și analiza predictivă
  • Analiști senior care doresc să proiecteze și să implementeze fluxuri de lucru analitice avansate
  • Profesioniști din domeniul cercetării și dezvoltării care se concentrează pe soluții inovatoare bazate pe date
 42 Ore

Numărul de participanți


Pret per participant

Mărturii (4)

Cursuri viitoare

Categorii înrudite