Schița de curs

Introducere

  • Prezentare generală a Databricks și Apache Spark
  • Înțelegerea arhitecturii Databricks

Începuturi

  • Setarea mediului de lucru
  • Configurarea și setarea Databricks
  • Navigarea în interfața utilizator a Databricks
  • Crearea unui spațiu de lucru Databricks

Lucrul cu datele din Databricks

  • Conectarea la sursa de date Apache Spark
  • Înțelegerea coloanelor și a tipurilor de date de bază
  • Gestionarea sistemului de fișiere în Notebooks

Gestionarea sarcinilor și clusterelor

  • Crearea și configurarea clusterelor
  • Crearea sarcinilor folosind Notebook
  • Pornirea sarcinilor
  • Afișarea sarcinilor și a detaliilor acestora

Folosirea Delta Lake în Databricks

  • Încărcarea datelor în Delta Lake
  • Gestionarea datelor din Delta Lake

Sigurarea Databricks

  • Gestionarea securității Databricks
  • Gestionarea siguranței și recuperării

Rezolvarea problemelor

Rezumat și următorii pași

Cerințe

  • Cunoaștere basică a analizei datelor
  • Cunoaștere a Apache Spark

Audiență

  • Ingineri de date
  • Științiiți ai datelor
  • Dezvoltatori
 14 ore

Numărul de participanți


Pret per participant

Cursuri viitoare

Categorii înrudite