Schița de curs
Introducere în Apache Iceberg
- Prezentare generală a Apache Iceberg
- Revizuirea conceptelor de bază
Analiza detaliată a arhitecturii Iceberg
- Analiza în profunditate a formatului tabelar al Iceberg
- Prezentare detaliată a arhitecturii, inclusiv metadate și structura fișierelor
- Internul evoluției schemei și a particionării
Instalarea avansată și configurarea Iceberg
- Configurarea Iceberg pentru performanțe optimale în diferite medii
- Integrarea cu diferite motoare de procesare a datelor
- Configurarea avansată: securitate, criptare și controale de acces
- Configurarea Iceberg într-un mediu distribuit
Operațiuni avansate și întreținere
- Gestionarea tabelelor de scară largă Iceberg
- Implementarea și gestionarea schimbărilor complexe ale schemei
- Gestionarea evoluției particionării și a particionării ascunse
- Operațiuni avansate CRUD cu schimbări ale schemei și particionării
Tehnici de optimizare a interogărilor
- Tehnici pentru reducerea latentei interogărilor
- Reducerea particionării și a fișierelor
- Memoria cache a metadatelor și strategii de optimizare
- Implementarea și testarea tehnicilor de optimizare a interogărilor
Optimizarea performanței pentru seturi de date de scară largă
- Optimizarea performanței pentru seturi de date de scară largă
- Utilizarea funcțiilor integrale ale Iceberg pentru optimizarea performanței
- Studii de caz privind optimizarea performanței în scenarii reale
- Optimizarea performanței pentru seturi de date de scară largă
Migrații avansate și integrare a datelor
- Migrația structurilor complexe de date din alte sisteme
- Integrarea Iceberg cu fluxurile de date în timp real
- Migrația seturilor de date complexe și integrarea fluxurilor de date în timp real
Fiabilitatea și consistența datelor
- Asigurarea consistenței și integrității datelor în mediile distribuite
- Implementarea și gestionarea garanțiilor tranzacționale
- Gestionarea eșecurilor și mecanismelor de recuperare
- Implementarea funcțiilor de fiabilitate și consistență
Funcții avansate și personalizare
- Implementarea catalogelor personalizate
- Extinderea Iceberg cu funcționalități personalizate
- Implementarea catalogului personalizat și extinderea funcțiilor Iceberg
Guvernanța datelor și conformitatea
- Implementarea politicilor de guvernanță a datelor
- Conformitatea cu reglementările privind datele
- Gestionarea urmelor de audit și liniajului datelor
- Implementarea funcțiilor de guvernanță și conformitate
Rezumat și următorii pași
Cerințe
- Cunoaștere a conceptelor de bază, operațiunilor fundamentale și gestionării tabelelor Iceberg
Audiență
- Ingineri de date
- Arhitecți de date
- Analii de date
- Dezvoltatori software
Mărturii (5)
Exemplele în direct
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina
Suficientă practică, formatorul este cunoscutor
Chris Tan
Curs - A Practical Introduction to Stream Processing
Tradus de catre o masina
Aflați să vă familiarizați cu Spark Streaming, Databricks și AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curs - Apache Spark in the Cloud
Tradus de catre o masina
teme de practică
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina