Schița de curs
Introducere
Prezentarea caracteristicilor și arhitecturii "Open Studio for Big Data"
Configurarea Open Studio for Big Data
Navigarea în interfata utilizatorului
Înțelegerea componentelor și conectorilor de date mari
Conectarea la un cluster Hadoop
Citirea și scrierea datelor
Procesarea datelor cu Hive și MapReduce
Analizarea rezultatelor
Îmbunătățirea calității datelor mari
Construirea unui canal de date mari
Gestionarea utilizatorilor, grupurilor, rolurilor și proiectelor
Implementarea Open Studio în producție
Monitorizarea Open Studio
Soluționarea problemelor
Synopsis și concluzii
Cerințe
- Înțelegerea bazelor de date relaționale
- Înțelegerea depozitelor de date
- Înțelegerea conceptelor ETL (Extract, Transform, Load)
Audiență
- Profesionaliști în inteligența afacerilor
- Profesionaliști în baze de date
- Dezvoltatori SQL
- Dezvoltatori ETL
- Arhitecți de soluții
- Arhitecți de date
- Profesionaliști în depozitele de date
- Administratori și integratori de sisteme
Mărturii (5)
Exemplele în direct
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina
Suficientă practică, formatorul este cunoscutor
Chris Tan
Curs - A Practical Introduction to Stream Processing
Tradus de catre o masina
Aflați să vă familiarizați cu Spark Streaming, Databricks și AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curs - Apache Spark in the Cloud
Tradus de catre o masina
teme de practică
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina