Schița de curs
Introducere
Prezentare generală a abordărilor de acces la date (Hive, baze de date etc.)
Prezentare generală a caracteristicilor și arhitecturii Spark
Instalarea și configurarea Spark
Înțelegerea Dataframes în Spark
Definirea tabelelor și importul seturilor de date
Interogarea Data Frames folosind SQL
Efectuarea de agregații, JOIN-uri și interogări imbricate
Încărcarea și accesarea datelor
Interogarea diferitelor tipuri de date
- JSON, Parquet etc.
Interogarea lacurilor de date cu SQL
Depanare
Rezumat și concluzii
Cerințe
- Experiență cu interogări SQL
- Experiență de programare în orice limbaj
Public țintă
- Analiști de date
- Oameni de știință de date
- Ingineri de date
Mărturii (5)
Exemplele live
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina
Suficient de practic, instrucționarul este căpățan
Chris Tan
Curs - A Practical Introduction to Stream Processing
Tradus de catre o masina
Învățați spark streaming, Databricks și AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curs - Apache Spark in the Cloud
Tradus de catre o masina
sarcini de exercițiu
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina