Schița de curs

Introducere

  • Prezentare generală a Databricks și Apache Spark
  • Înțelegerea arhitecturii Databricks

Începutul

  • Configurarea mediului
  • Configurarea și gestionarea Databricks
  • Navigarea în interfața utilizator Databricks
  • Crearea unui spațiu de lucru Databricks

Lucrul cu date în Databricks

  • Conectarea la o sursă de date Apache Spark
  • Înțelegerea bazelor coloanelor și tipurilor de date
  • Gestionarea sistemului de fișiere în Notebooks

Gestionarea job-urilor și a clusterelor

  • Crearea și configurarea clusterelor
  • Crearea job-urilor folosind Notebook
  • Executarea job-urilor
  • Vizualizarea job-urilor și a detaliilor acestora

Utilizarea Delta Lake în Databricks

  • Încărcarea datelor în Delta Lake
  • Gestionarea datelor în Delta Lake

Securizarea Databricks

  • Gestionarea securității Databricks
  • Gestionarea backup-ului și recuperării

Depanare

Rezumat și pași următori

Cerințe

  • Înțelegere de bază a analizei datelor
  • Cunoștințe despre Apache Spark

Publicul țintă

  • Ingineri de date
  • Specialiști în știința datelor
  • Dezvoltatori
 14 Ore

Numărul de participanți


Pret per participant

Cursuri viitoare

Categorii înrudite