Intrati in legatura

Schița de curs

Introducere

Înțelegerea conceptului de Date Mari

Prezentare generală a Spark

Prezentare generală a Python

Prezentare generală a PySpark

  • Distribuirea datelor folosind cadrul Resilient Distributed Datasets
  • Distribuirea calculului folosind operatorii API Spark

Configurarea Python cu Spark

Configurarea PySpark

Utilizarea instanțelor Amazon Web Services (AWS) EC2 pentru Spark

Configurarea Databricks

Configurarea clusterului AWS EMR

Învățarea elementelor de bază ale programării în Python

  • Începutul lucrului cu Python
  • Utilizarea Jupyter Notebook
  • Utilizarea variabilelor și a tipurilor de date simple
  • Lucrul cu liste
  • Utilizarea instrucțiunilor if
  • Utilizarea intrărilor utilizatorului
  • Lucrul cu bucle while
  • Implementarea funcțiilor
  • Lucrul cu clase
  • Lucrul cu fișiere și excepții
  • Lucrul cu proiecte, date și API-uri

Învățarea elementelor de bază ale Spark DataFrame

  • Începutul lucrului cu Spark DataFrames
  • Implementarea operațiilor de bază cu Spark
  • Utilizarea operațiilor Groupby și Aggregate
  • Lucrul cu timpstampe și date

Lucrul la un exercițiu de proiect cu Spark DataFrame

Înțelegerea învățării automate cu MLlib

Lucrul cu MLlib, Spark și Python pentru învățarea automată

Înțelegerea regresiilor

  • Învățarea teoriei regresiei liniare
  • Implementarea unui cod de evaluare a regresiei
  • Lucrul la un exercițiu de regresie liniară
  • Învățarea teoriei regresiei logistice
  • Implementarea unui cod de regresie logistică
  • Lucrul la un exercițiu de regresie logistică

Înțelegerea pădurilor aleatoare și a arborilor de decizie

  • Învățarea teoriei metodelor arborelui
  • Implementarea codurilor pentru arbori de decizie și păduri aleatoare
  • Lucrul la un exercițiu de clasificare cu păduri aleatoare

Lucrul cu clustering K-means

  • Înțelegerea teoriei clusteringului K-means
  • Implementarea unui cod de clustering K-means
  • Lucrul la un exercițiu de clustering

Lucrul cu sisteme de recomandare

Implementarea procesării limbajului natural

  • Înțelegerea procesării limbajului natural (NLP)
  • Prezentarea generală a instrumentelor NLP
  • Lucrul la un exercițiu de NLP

Streaming cu Spark pe Python

  • Prezentarea generală a streamingului cu Spark
  • Exercițiu de streaming cu Spark

Observații finale

Cerințe

  • Cunoștințe generale de programare

Publicul țintă

  • Dezvoltatori
  • Profesioniști IT
  • Specialiști în Știința Datelor
 21 Ore

Numărul de participanți


Pret per participant

Mărturii (6)

Cursuri viitoare

Categorii înrudite