Schița de curs
Introducere la DataStage
- Prezentare generală a procesului ETL (Extract, Transform, Load)
- Înțelegerea arhitecturii DataStage
- Componentele cheie ale DataStage
Administrarea DataStage
- Instalare și configurare
- Gestionarea utilizatorilor și a securității
- Setările proiectului și gestionarea mediului
- Planificarea și gestionarea sarcinilor (jobs)
- Proceduri de backup și recuperare
Tehnici de extracție a datelor
- Conectarea la diverse surse de date
- Extracția datelor din baze de date, fișiere text și surse externe
- Practici de bine în extracția datelor
Transformarea datelor cu DataStage
- Înțelegerea designer-ului DataStage
- Lucrul cu diferite tipuri de etape (stages)
- Implementarea logicii de afaceri în transformări
- Tehnici avansate de transformare a datelor
Încărcarea și integrarea datelor
- Încărcarea datelor în sistemele de destinație
- Asigurarea calității și integrității datelor
- Gestionarea erorilor și logging-ul
Optimizarea performanței
- Practici de bine pentru optimizarea performanței
- Gestionarea resurselor
- Sequențierea sarcinilor și paralelismul
Subiecte avansate
- Lucrul cu directorul DataStage
- Depanarea și rezolvarea problemelor
Rezumat și următoarele pași
Cerințe
- Înțelegere de bază a conceptelor de bază ale bazelor de date
- Familiarizare cu SQL și principiile depozitării datelor
Audiență
- Profesionaliști IT
- Administratori de baze de date
- Dezvoltatori
Mărturii (5)
Exemplele în direct
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina
Suficientă practică, formatorul este cunoscutor
Chris Tan
Curs - A Practical Introduction to Stream Processing
Tradus de catre o masina
Aflați să vă familiarizați cu Spark Streaming, Databricks și AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curs - Apache Spark in the Cloud
Tradus de catre o masina
teme de practică
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina