Schița de curs

Introducere

  • Apache Spark vs Hadoop MapReduce

Prezentare generală a Apache Spark Caracteristici și arhitectură

Alegerea unei limbi Programming

Setarea Apache Spark

Crearea unei aplicații de probă

Alegerea setului de date

Rularea Data Analysis pe date

Prelucrarea datelor structurate cu Spark SQL

Prelucrarea datelor în flux cu Spark Streaming

Integrarea Apache Spark cu partea a 3-a Machine Learning Instrumente

Utilizarea Apache Spark pentru procesarea grafică

Optimizarea Apache Spark

Depanare

Rezumat și concluzii

Cerințe

  • Experiență cu linia de comandă Linux
  • O înțelegere generală a prelucrării datelor
  • Experiență de programare cu Java, Scala, Python sau R

Audiență

  • Dezvoltatorii
  21 ore

Mărturii (2)

Cursuri înrudite

Big Data Analytics in Health

  21 ore

Categorii înrudite