Schița de curs
Sectiunea 1: Data Management în HDFS
- Multe Formate de Date (JSON / Avro / Parquet)
- Schemă de Compresie
- Ascundere a Datelor
- Laboratoare : Analiza diferitelor formate de date; activarea compresiei
Sectiunea 2: Pig Avansat
- Funcții Definite de Utilizator
- Introducere în Bibliteca Pig (ElephantBird / Data-Fu)
- Încărcarea Datelor Structurate Complexe folosind Pig
- Tunare a Pig
- Laboratoare : scripting Pig avansat, analizarea tipurilor de date complexe
Sectiunea 3: Hive Avansat
- Funcții Definite de Utilizator
- Tabele Comprimate
- Tunare a Performanței Hive
- Laboratoare : crearea tabelelor compilate, evaluarea formatelor și configurațiilor de tabele
Sectiunea 4: HBase Avansat
- Modelare avansată a schemelor
- Comprimare
- Ingest Bulk de Date
- Compararea tabelelor wide-table / tall-table
- HBase și Pig
- HBase și Hive
- Tunare a Performanței HBase
- Laboratoare : tunarea HBase; accesul la datele HBase din Pig & Hive; Utilizarea Phoenix pentru modelarea datelor
Cerințe
- familiarizat cu limbajul de programare Java (cele mai multe exerciții de programare sunt în java)
- familiarizat cu mediul Linux (trebuie să vă puteți desplaça în linia de comandă a Linux, să editați fișiere folosind vi / nano)
- cunoștințe functionale de Hadoop.
Mediu laborator
Nu este nevoie de instalare: Nu este necesar să instalați software-ul Hadoop pe mașinile studenților! Se va oferi un cluster funcțional de Hadoop pentru studenți.
Studenții vor avea nevoie de următoarele
Mărturii (5)
Exemplele în direct
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
În timpul exercițiilor, James m-a explicat cu mai multe detalii fiecare pas în care mă blocau. Eram complet nou la NIFI. El m-a explicat scopul real al lui NIFI, chiar conceptele de bază cum ar fi open source. El a acoperit toate conceptele ale lui Nifi, începând cu nivelul de începător până la nivelul dezvoltatorului.
Firdous Hashim Ali - MOD A BLOCK
Curs - Apache NiFi for Administrators
Tradus de catre o masina
Prepararea și organizarea formatorului și calitatea materialelor furnizate pe github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Curs - Impala for Business Intelligence
Tradus de catre o masina
Cu toate acestea că l-am avut în primul rând. (Note: The given sentence is somewhat incomplete or out of context, so the translation maintains that structure and tone.)
Peter Scales - CACI Ltd
Curs - Apache NiFi for Developers
Tradus de catre o masina
Translate this From: en To: ro lucruri practice de făcut, precum și teorie bine prezentată de Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Curs - Hadoop Administration on MapR
Tradus de catre o masina