Schița de curs
Introducere
Prezentare generală a abordărilor de acces la date (Hive, baze de date, etc.)
Prezentare generală a caracteristicilor și arhitecturii Spark
Instalarea și configurarea Spark
Înțelegerea Dataframe-urilor în Spark
Definirea tabelelor și importul seturilor de date
Interogarea Dataframe-urilor folosind SQL
Efectuarea agregărilor, JOIN-uri și interogării înnestești
Încărcarea și accesarea datelor
Interogarea diferitelor tipuri de date
- JSON, Parquet, etc.
Interogarea lacurilor de date cu SQL
Soluționarea problemelor
Synopsis și concluzie
Cerințe
- Experiență cu interogările SQL
- Experiență în programare în orice limbaj
Public Țintă
- Analistii de date
- Cercetătorii de date
- Inginerii de date
Mărturii (5)
Exemplele în direct
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina
Suficientă practică, formatorul este cunoscutor
Chris Tan
Curs - A Practical Introduction to Stream Processing
Tradus de catre o masina
Aflați să vă familiarizați cu Spark Streaming, Databricks și AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curs - Apache Spark in the Cloud
Tradus de catre o masina
teme de practică
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina
