Schița de curs
Introducere
- Prezentare generală a caracteristicilor și arhitecturii Spark și Hadoop
- Înțelegerea datelor mari
- Bazele programării în Python
Începutul
- Configurarea Python, Spark și Hadoop
- Înțelegerea structurilor de date în Python
- Înțelegerea API-ului PySpark
- Înțelegerea HDFS și MapReduce
Integrarea Spark și Hadoop cu Python
- Implementarea Spark RDD în Python
- Procesarea datelor folosind MapReduce
- Crearea de seturi de date distribuite în HDFS
Învățarea automată cu Spark MLlib
Procesarea datelor mari cu Spark Streaming
Lucrul cu sisteme de recomandare
Lucrul cu Kafka, Sqoop, Kafka și Flume
Apache Mahout cu Spark și Hadoop
Depanare
Rezumat și pași următori
Cerințe
- Experiență cu Spark și Hadoop
- Experiență în programare Python
Public țintă
- Oameni de știință de date
- Dezvoltatori
Mărturii (3)
Faptul că am reușit să ne luăm cu noi majoritatea informațiilor/cursului/prezentării/exercițiilor realizate, astfel încât să le putem examina și eventual să refacem ceea ce nu am înțeles inițial sau să îmbunătățim ceea ce deja am făcut.
Raul Mihail Rat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
Mi-a plăcut că a reușit să pună bazele subiectului și să ajungă la exerciții destul de avansate. De asemenea, oferea modalități ușoare de scriere/testare a codului.
Ionut Goga - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
Exemplele live
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina