Schița de curs
Introducere în Apache Iceberg
- Prezentare generală a Apache Iceberg
- Recapitulare a conceptelor de bază
Analiză aprofundată a arhitecturii Iceberg
- Analiză detaliată a formatului de tabel Iceberg
- Prezentare detaliată a arhitecturii, inclusiv gestionarea metadatelor și structura fișierelor
- Detalii despre evoluția schemei și a partițiilor
Instalare și configurare avansată
- Configurarea Iceberg pentru performanță optimă în diferite medii
- Integrarea cu diverse motoare de procesare a datelor
- Configurare avansată: securitate, criptare și controale de acces
- Configurarea Iceberg într-un mediu distribuit
Operațiuni și întreținere avansată
- Gestionarea tabelelor Iceberg la scară largă
- Implementarea și gestionarea schimbărilor complexe de scheme
- Gestionarea evoluției partițiilor și a partițiilor ascunse
- Operațiuni CRUD avansate cu schimbări de scheme și partiții
Tehnici de optimizare a interogărilor
- Tehnici de reducere a latenței interogărilor
- Tăierea partițiilor și a fișierelor
- Strategii de stocare în cache și optimizare a metadatelor
- Implementarea și testarea tehnicilor de optimizare a interogărilor
Optimizarea performanței pentru seturi de date mari
- Optimizarea performanței pentru seturi de date la scară largă
- Utilizarea funcționalităților integrate ale Iceberg pentru optimizarea performanței
- Studii de caz despre optimizarea performanței în scenarii reale
- Optimizarea performanței pentru seturi de date la scară largă
Migrare și integrare avansată a datelor
- Migrarea structurilor complexe de date din alte sisteme
- Integrarea Iceberg cu fluxuri de date în timp real
- Migrarea seturilor de date complexe și integrarea fluxurilor de date în timp real
Fiabilitate și consistență
- Asigurarea consistenței și integrității datelor în medii distribuite
- Implementarea și gestionarea garanțiilor tranzacționale
- Gestionarea eșecurilor și a mecanismelor de recuperare
- Implementarea funcționalităților de fiabilitate și consistență
Funcționalități și personalizare avansată
- Implementări personalizate de cataloage
- Extinderea Iceberg cu funcționalități personalizate
- Implementarea catalogului personalizat și extinderea funcționalităților Iceberg
Guvernanța și conformitatea datelor
- Implementarea politicilor de guvernanță a datelor
- Conformitatea cu reglementările privind datele
- Gestionarea traseelor de audit și a liniei de date
- Implementarea funcționalităților de guvernanță și conformitate
Rezumat și pași următori
Cerințe
- Familiarizare cu conceptele de bază, operațiunile de bază și gestionarea tabelelor Iceberg
Publicul țintă
- Ingineri de date
- Arhitecți de date
- Analiști de date
- Dezvoltatori de software
Mărturii (3)
Mi-a plăcut că a fost practic. Am adorat să aplic cunoștințele teoretice cu exemple practice.
Aurelia-Adriana - Allianz Services Romania
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina
Faptul că am reușit să ne luăm cu noi majoritatea informațiilor/cursului/prezentării/exercițiilor realizate, astfel încât să le putem examina și eventual să refacem ceea ce nu am înțeles inițial sau să îmbunătățim ceea ce deja am făcut.
Raul Mihail Rat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina