Schița de curs
Secțiunea 1: Data Management în HDFS
- Diverse formate de date (JSON / Avro / Parquet)
- Scheme de compresie
- Mascarea datelor
- Laboratoare : Analizarea diferitelor formate de date; activarea compresiei
Secțiunea 2: Pig avansat
- Funcții definite de utilizator
- Introducere în bibliotecile Pig (ElephantBird / Data-Fu)
- Încărcarea datelor structurate complexe cu ajutorul Pig
- Reglarea Pig
- Laboratoare : scripting pig avansat, analizarea tipurilor complexe de date
Secțiunea 3 : Advanced Hive
- Funcții definite de utilizator
- Tabele comprimate
- Hive Reglarea performanței
- Laboratoare : crearea tabelelor comprimate, evaluarea formatelor și configurației tabelelor
Secțiunea 4 : HBase avansat
- Modelarea avansată a schemei
- Compresie
- Intrări masive de date
- Comparație între tabele largi și tabele înalte
- HBase și Pig
- HBase și Hive
- Reglarea performanței HBase
- Laboratoare : tuning HBase; accesarea datelor HBase din Pig & Hive; utilizarea Phoenix pentru modelarea datelor
Cerințe
- să fie familiarizat cu Java limbaj de programare (majoritatea exercițiilor de programare sunt în java)
- să se simtă confortabil în mediul Linux (să fie capabil să navigheze pe linia de comandă Linux, să editeze fișiere folosind vi / nano)
- cunoștințe practice de Hadoop.
Mediul de laborator
Zero Install: Nu este nevoie să instalați software-ul hadoop pe mașinile studenților! Un cluster hadoop funcțional va fi pus la dispoziția studenților.
Studenții vor avea nevoie de următoarele
- un client SSH (Linux și Mac au deja clienți ssh, pentru Windows se recomandă Putty )
- un browser pentru a accesa clusterul. Vă recomandăm browserul Firefox
Mărturii (5)
Exemplele în direct
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
În timpul exercițiilor, James m-a explicat cu mai multe detalii fiecare pas în care mă blocau. Eram complet nou la NIFI. El m-a explicat scopul real al lui NIFI, chiar conceptele de bază cum ar fi open source. El a acoperit toate conceptele ale lui Nifi, începând cu nivelul de începător până la nivelul dezvoltatorului.
Firdous Hashim Ali - MOD A BLOCK
Curs - Apache NiFi for Administrators
Tradus de catre o masina
Prepararea și organizarea formatorului și calitatea materialelor furnizate pe github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Curs - Impala for Business Intelligence
Tradus de catre o masina
Cu toate acestea că l-am avut în primul rând. (Note: The given sentence is somewhat incomplete or out of context, so the translation maintains that structure and tone.)
Peter Scales - CACI Ltd
Curs - Apache NiFi for Developers
Tradus de catre o masina
Translate this From: en To: ro lucruri practice de făcut, precum și teorie bine prezentată de Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Curs - Hadoop Administration on MapR
Tradus de catre o masina