Schița de curs
Introducere
- Prezentare generală a funcțiilor și arhitecturii Spark și Hadoop
- Înțelegerea big data
- Python elementele de bază ale programării
Noțiuni introductive
- Configurarea Python, Spark și Hadoop
- Înțelegerea structurilor de date în Python
- Înțelegerea API-ului PySpark
- Înțelegerea HDFS și MapReduce
Integrarea Spark și Hadoop cu Python
- Implementarea Spark RDD în Python
- Prelucrarea datelor utilizând MapReduce
- Crearea seturilor de date distribuite în HDFS
Machine Learning cu Spark MLlib
Prelucrarea Big Data cu Spark Streaming
Lucrul cu sistemele de recomandare
Lucrul cu Kafka, Sqoop, Kafka și Flume
Apache Mahout cu Spark și Hadoop
Rezolvarea problemelor
Rezumat și pași următori
Cerințe
- Experiență cu Spark și Hadoop
- Python experiență în programare
Audiență
- Oameni de știință în domeniul datelor
- Dezvoltatori
Mărturii (3)
Faptul că am reușit să ne luăm cu noi majoritatea informațiilor/cursului/prezentării/exercițiilor realizate, astfel încât să le putem examina și eventual să refacem ceea ce nu am înțeles inițial sau să îmbunătățim ceea ce deja am făcut.
Raul Mihail Rat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
Mi-a plăcut că a reușit să pună bazele subiectului și să ajungă la exerciții destul de avansate. De asemenea, oferea modalități ușoare de scriere/testare a codului.
Ionut Goga - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
Exemplele live
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina