Schița de curs
Introducere
- Apache Spark vs Hadoop MapReduce
Prezentare generală a caracteristicilor și arhitecturii Apache Spark
Alegerea unui limbaj de programare
Configurarea Apache Spark
Crearea unei aplicații de exemplu
Alegerea setului de date
Efectuarea analizei datelor pe setul de date
Procesarea datelor structurate cu Spark SQL
Procesarea datelor de streaming cu Spark Streaming
Integrarea Apache Spark cu instrumente de învățare automată de la terți
Utilizarea Apache Spark pentru procesarea graficelor
Optimizarea Apache Spark
Depanare
Rezumat și concluzii
Cerințe
- Experiență cu linia de comandă Linux
- O înțelegere generală a procesării datelor
- Experiență de programare în Java, Scala, Python sau R
Public țintă
- Dezvoltatori
Mărturii (5)
Exemplele live
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina
Suficient de practic, instrucționarul este căpățan
Chris Tan
Curs - A Practical Introduction to Stream Processing
Tradus de catre o masina
Învățați spark streaming, Databricks și AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curs - Apache Spark in the Cloud
Tradus de catre o masina
sarcini de exercițiu
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina