Schița de curs
Introducere
- Prezentare generală a funcțiilor și arhitecturii Spark și Hadoop
- Înțelegerea big data
- Python elementele de bază ale programării
Noțiuni introductive
- Configurarea Python, Spark și Hadoop
- Înțelegerea structurilor de date în Python
- Înțelegerea API-ului PySpark
- Înțelegerea HDFS și MapReduce
Integrarea Spark și Hadoop cu Python
- Implementarea Spark RDD în Python
- Prelucrarea datelor utilizând MapReduce
- Crearea seturilor de date distribuite în HDFS
Machine Learning cu Spark MLlib
Prelucrarea Big Data cu Spark Streaming
Lucrul cu sistemele de recomandare
Lucrul cu Kafka, Sqoop, Kafka și Flume
Apache Mahout cu Spark și Hadoop
Rezolvarea problemelor
Rezumat și pași următori
Cerințe
- Experiență cu Spark și Hadoop
- Python experiență în programare
Audiență
- Oameni de știință în domeniul datelor
- Dezvoltatori
Mărturii (3)
Faptul că am reușit să ne luăm cu noi majoritatea informațiilor/sesiunii de curs/prezentări/exerciții realizate, astfel încât să le putem revizui și poate să refacem ceea ce nu am înțeles la prima oară sau să îmbunătățim ceea ce am făcut deja.
Raul Mihail Rat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
Mi-au plăcut fondamentele pe care le-a pus pentru subiect și faptul că a mers până la exerciții destul de avansate. De asemenea, a oferit modalități ușoare de scriere și testare a codului.
Ionut Goga - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
Exemplele în direct
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina