Schița de curs
Secțiunea 1: Gestionarea Datelor în HDFS
- Diverse Formate de Date (JSON / Avro / Parquet)
- Schemă de Comprimare
- Mascarea Datelor
- Laboratoare : Analizarea diferitelor formate de date; activarea compresiei
Secțiunea 2: Pig Avansat
- Funcții Definite de Utilizator
- Introducere în Biblioteci Pig (ElephantBird / Data-Fu)
- Încărcarea Datelor Structurate Complex folosind Pig
- Tuning-ul Pig
- Laboratoare : scriptare avansată cu Pig, parsarea tipurilor de date complexe
Secțiunea 3: Hive Avansat
- Funcții Definite de Utilizator
- Tabele Comprimate
- Tuning-ul Performanței Hive
- Laboratoare : crearea de tabele comprimate, evaluarea formatelor și configurațiilor de tabel
Secțiunea 4: HBase Avansat
- Modelarea Schemelor Avansată
- Comprimare
- Încărcarea Masivă a Datelor
- Compararea Tabelelor Largi și Înalte
- HBase și Pig
- HBase și Hive
- Tuning-ul Performanței HBase
- Laboratoare : tuning HBase; accesarea datelor HBase din Pig & Hive; Utilizarea Phoenix pentru modelarea datelor
Cerințe
- confortabil cu limbajul de programare Java (majoritatea exercițiilor de programare sunt în Java)
- confortabil în mediul Linux (capabil să navighezi prin linia de comandă a Linux, să editezi fișiere folosind vi / nano)
- cunoștințe operaționale ale Hadoop.
Mediul de laborator
Zero Install: Nu este necesară instalarea software-ului Hadoop pe mașinile studenților! Un cluster funcțional Hadoop va fi disponibil pentru studenți.
Studenții vor avea nevoie de următoarele
Mărturii (5)
Exemplele live
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
În timpul exercițiilor, James mi-a explicat fiecare pas în detaliu de ori câteori m-am blocat. Eram complet nou în ceea ce privește NIFI. El mi-a clarificat scopul real al NIFI, inclusiv noțiunile de bază precum open source. A acoperit toate conceptele Nifi, începând de la nivelul de începător până la nivelul de dezvoltator.
Firdous Hashim Ali - MOD A BLOCK
Curs - Apache NiFi for Administrators
Tradus de catre o masina
Că l-am avut în primul rând.
Peter Scales - CACI Ltd
Curs - Apache NiFi for Developers
Tradus de catre o masina
aspecte practice de lucru, precum și teoria au fost prezentate bine de Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Curs - Hadoop Administration on MapR
Tradus de catre o masina
Măsimă întemeiat de VM Profesorul a fost foarte bine informat despre subiect și alte subiecte, a fost foarte prietenos și amabil Mi-a plăcut facilitatea din Dubai.
Safar Alqahtani - Elm Information Security
Curs - Big Data Analytics in Health
Tradus de catre o masina