Schița de curs

Introducere

  • Prezentare generală a Databricks și Apache Spark
  • Înțelegerea arhitecturii Databricks

Noțiuni introductive

  • Configurarea mediului
  • Instalarea și configurarea Databricks
  • Navigarea în interfața cu utilizatorul Databricks
  • Crearea unui spațiu de lucru Databricks

Lucrul cu datele în Databricks

  • Conectarea la o sursă de date Apache Spark
  • Înțelegerea noțiunilor de bază privind coloanele și tipurile de date
  • Gestionarea sistemului de fișiere în notebook-uri

Gestionarea locurilor de muncă și a clusterelor

  • Crearea și configurarea clusterelor
  • Crearea de lucrări utilizând Notebook
  • Rularea lucrărilor
  • Vizualizarea lucrărilor și a detaliilor acestora

Folosind Delta Lake în Databricks

  • Încărcarea datelor în Delta Lake
  • Gestionarea datelor în Delta Lake

Asigurarea Databricks

  • Gestionarea securității Databricks
  • Gestionarea backup-ului și a recuperării

Depanare

Rezumat și etapele următoare

Cerințe

  • Înțelegere de bază a analizei datelor
  • Cunoștințe de Apache Spark
  • .

Audiență

  • Inginerii de date
  • Cercetători de date
  • Developers
  14 ore
 

Mărturii (2)

Cursuri înrudite

Azure for Data Engineer

  35 ore

Data Analysis for Marketers

  14 ore

Categorii înrudite