Schița de curs
Introducere în Google Colab și Apache Spark
- Panoramă despre Google Colab
- Introducere în Apache Spark
- Configurarea Spark în Google Colab
Procesare a datelor cu Apache Spark
- Lucru cu RDD-uri și DataFrames
- Încărcarea și procesarea seturilor de date mari
- Utilizarea Spark SQL pentru interogarea datelor structurate
Analize avansate cu Spark
- Aprenderea mașină cu Spark MLlib
- Executarea analizelor de date în timp real
- Calcul distribuit cu Spark
Visualizare și Collaboration în Google Colab
- Integrarea Colab cu bibliotecile populare de visualizare
- Fluxuri de lucru collaborative cu notebook-uri Colab
- Împărțirea și exportul rezultatelor
Optimizarea fluxurilor de Big Data
- Tuning Spark pentru performanță
- Optimizarea utilizării memoriei și a stocării
- Scalare a fluxurilor de lucru pentru seturi mari de date
Big Data în cloud
- Integrarea Google Colab cu instrumentele bazate pe cloud
- Utilizarea stocării cloud pentru mari seturi de date
- Lucrul cu Spark în medii distribuite cloud
Studii de caz și cele mai bune practici
- Revizuirea aplicațiilor reale ale datelor mari
- Studii de caz folosind Apache Spark și Colab
- Cele mai bune practici pentru analiza datelor mari
Rezumat și următoarele pași
Cerințe
- Cunoștințe de bază cu conceptele din domeniul științei datelor
- Familiaritate cu Apache Spark
- Competențe în programare Python
Publicul cântarit
- Științificii datelor
- Inginerii datelor
- Cercetătorii care lucrează cu date mari
Mărturii (5)
Exemplele practice ne au permis să obținem o senzație reală de cum funcționează programul. Explicațiile detaliate și integrarea conceptelor teoretice și modul în care sunt legate de aplicațiile practice.
Ian - Archeoworks Inc.
Curs - ArcGIS Fundamentals
Tradus de catre o masina
Toate temele pe care le-a abordat, inclusiv exemplele. De asemenea, le-a explicat cum sunt utile în munca noastră zilnică.
madduri madduri - Boskalis Singapore Pte Ltd
Curs - QGIS for Geographic Information System
Tradus de catre o masina
Mi-a plăcut stilul lui Pablo, faptul că a abordat o mulțime de subiecte, de la proiectarea rapoartelor, personalizarea cu html până la implementarea unor algoritmi ML simpli. Good bilanț informații teoretice / exerciții. Pablo a acoperit cu adevărat toate subiectele care m-au interesat și a dat răspunsuri complete la întrebările mele.
Cristian Tudose - SC Automobile Dacia SA
Curs - Advanced Data Analysis with TIBCO Spotfire
Tradus de catre o masina
Aplicarea practică a lui Spotfire și toate funcțiile de bază.
Michael Capili - STMicroelectronics, Inc.
Curs - Introduction to Spotfire
Tradus de catre o masina
Cel mai mult mi-a plăcut despre antrenament organizarea și locația
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Curs - ArcGIS for Spatial Analysis
Tradus de catre o masina