Schița de curs
Introducere
Prezentare generală a abordărilor de acces la date (Hive, baze de date, etc.)
Prezentare generală a caracteristicilor și arhitecturii Spark
Instalarea și configurarea Spark
Înțelegerea Dataframes în Spark
Definirea tabelelor și importul seturilor de date
Interogarea Data Frames folosind SQL
Efectuarea agregațiilor, JOIN-urilor și a interogărilor imbricate
Încărcarea și accesarea datelor
Interogarea diferitelor tipuri de date
- JSON, Parquet, etc.
Interogarea lacurilor de date cu SQL
Depanare
Rezumat și concluzii
Cerințe
- Experiență cu interogări SQL
- Experiență de programare în orice limbaj
Publicul țintă
- Analiști de date
- Oameni de știință în domeniul datelor
- Ingineri de date
Mărturii (3)
Mi-a plăcut că a fost practic. Am adorat să aplic cunoștințele teoretice cu exemple practice.
Aurelia-Adriana - Allianz Services Romania
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina
Faptul că am reușit să ne luăm cu noi majoritatea informațiilor/cursului/prezentării/exercițiilor realizate, astfel încât să le putem examina și eventual să refacem ceea ce nu am înțeles inițial sau să îmbunătățim ceea ce deja am făcut.
Raul Mihail Rat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina