Mulțumim pentru trimiterea solicitării! Un membru al echipei noastre vă va contacta în curând.
Mulțumim pentru trimiterea rezervării! Un membru al echipei noastre vă va contacta în curând.
Schița de curs
Fundamentele Depozitării de Date
- Scopul, componente și arhitectura depozitelor de date
- Data marts, depozitele enterprise și pattern-urile lakehouse
- Fundamentele OLTP vs OLAP și separarea sarcinilor de lucru
Modelare Dimensională
- Fapte, dimensiuni și granularitate
- Schema star vs schema snowflake
- Tipurile de Dimensiuni care se schimbă încet (SCD) și gestionarea lor
Procesele ETL și ELT
- Strategii de extracție din OLTP și API-uri
- Transformări, curățare și conformizarea datelor
- Pattern-urile de încărcare, orchestrarea și gestionarea dependențelor
Calitatea Datelor și Gestionarea Metadatelor
- Profilarea datelor și regulile de validare
- Alinierea datelor master și referențiale
- Lineage, cataloguri și documentație
Analiza și Performanța
- Concepte de cub, agregate și vedere materializată
- Partitionarea, clustering și indexarea pentru analiză
- Gestionarea sarcinilor de lucru, caching și optimizarea interogărilor
Securitatea și Guvernanța
- Controlul accesului, rolurile și securitatea la nivel de linie
- Considerente privind conformitatea și auditul
- Practici de backup, recuperare și fiabilitate
Arhitecturi Moderne
- Depozitele de date cloud și elasticitatea
- Ingestiune streaming și analiză aproape în timp real
- Optimizarea costurilor și monitorizarea
Capstone: De la Sursă la Schema Star
- Modelare a unui proces de afaceri în fapte și dimensiuni
- Construirea unui flux de lucru end-to-end ETL sau ELT
- Publicarea dashboard-urilor și validarea metricilor
Rezumat și Pași Următori
Cerințe
- O înțelegere a bazelor de date relaționale și SQL
- Experiență cu analiza datelor sau raportarea
- Familiaritate basică cu platformele de date cloud sau on-premises
Audiență
- Analistii de date care se orientează către depozitarea de date
- Dezvoltatorii BI și inginerii ETL
- Arhitecții datelor și liderii echipelor
35 ore
Mărturii (5)
Exemplele în direct
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina
Suficientă practică, formatorul este cunoscutor
Chris Tan
Curs - A Practical Introduction to Stream Processing
Tradus de catre o masina
Aflați să vă familiarizați cu Spark Streaming, Databricks și AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curs - Apache Spark in the Cloud
Tradus de catre o masina
teme de practică
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina