Mulțumim pentru trimiterea solicitării! Un membru al echipei noastre vă va contacta în curând.
Mulțumim pentru trimiterea rezervării! Un membru al echipei noastre vă va contacta în curând.
Schița de curs
1: HDFS (17%)
- Descrieți funcția Daemonilor HDFS
- Descrieți funcționarea normală a unui cluster Apache Hadoop, atât în ceea ce privește stocarea datelor, cât și procesarea acestora.
- Identificați caracteristicile actuale ale sistemelor de calcul care motivează un sistem precum Apache Hadoop.
- Clasificați obiectivele majore ale proiectării HDFS
- Într-un scenariu dat, identificați cazul de utilizare adecvat pentru HDFS Federation
- Identificați componentele și daemonii unui cluster HDFS HA-Quorum
- Analizați rolul securității HDFS (Kerberos)
- Determinați cea mai bună alegere de serializare a datelor pentru un scenariu dat
- Descrieți căile de citire și scriere a fișierelor
- Identificați comenzile pentru manipularea fișierelor în Shell-ul Sistemului de Fișiere Hadoop
2: YARN și MapReduce versiunea 2 (MRv2) (17%)
- Înțelegeți cum afectează actualizarea unui cluster de la Hadoop 1 la Hadoop 2 setările clusterului
- Înțelegeți cum să implementați MapReduce v2 (MRv2 / YARN), inclusiv toți daemonii YARN
- Înțelegeți strategia de bază de proiectare pentru MapReduce v2 (MRv2)
- Determinați cum gestionează YARN alocarea resurselor
- Identificați fluxul de lucru al unui job MapReduce care rulează pe YARN
- Determinați ce fișiere trebuie să modificați și cum pentru a migra un cluster de la MapReduce versiunea 1 (MRv1) la MapReduce versiunea 2 (MRv2) care rulează pe YARN.
3: Planificarea Clusterului Hadoop (16%)
- Punctele principale de luat în considerare atunci când alegeți hardware-ul și sistemele de operare pentru a găzdui un cluster Apache Hadoop.
- Analizați opțiunile în alegerea unui sistem de operare
- Înțelegeți reglarea kernelului și schimbul pe disc
- Într-un scenariu și un model de sarcină dat, identificați o configurație hardware adecvată pentru scenariu
- Într-un scenariu dat, determinați componentele ecosistemului pe care clusterul dumneavoastră trebuie să le ruleze pentru a îndeplini SLA-ul
- Dimensionarea clusterului: într-un scenariu și o frecvență de execuție date, identificați specificațiile pentru sarcina de lucru, inclusiv CPU, memorie, stocare, I/O disc
- Dimensionarea și configurația discului, inclusiv JBOD față de RAID, SAN-uri, virtualizare și cerințele de dimensiune a discului într-un cluster
- Topologii de rețea: înțelegeți utilizarea rețelei în Hadoop (atât pentru HDFS, cât și pentru MapReduce) și propuneți sau identificați componentele cheie de proiectare a rețelei pentru un scenariu dat
4: Instalarea și Administrarea Clusterului Hadoop (25%)
- Într-un scenariu dat, identificați cum va gestiona clusterul defecțiunile de disc și de mașină
- Analizați o configurație de înregistrare și formatul fișierului de configurare a înregistrărilor
- Înțelegeți elementele de bază ale metricilor Hadoop și monitorizarea stării clusterului
- Identificați funcția și scopul instrumentelor disponibile pentru monitorizarea clusterului
- Fiți capabil să instalați toate componentele ecosistemului în CDH 5, inclusiv (dar nu limitat la): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive și Pig
- Identificați funcția și scopul instrumentelor disponibile pentru gestionarea sistemului de fișiere Apache Hadoop
5: Managementul Resurselor (10%)
- Înțelegeți obiectivele generale de proiectare ale fiecărui planificator Hadoop
- Într-un scenariu dat, determinați cum alocă Planificatorul FIFO resursele clusterului
- Într-un scenariu dat, determinați cum alocă Planificatorul Fair resursele clusterului sub YARN
- Într-un scenariu dat, determinați cum alocă Planificatorul de Capacitate resursele clusterului
6: Monitorizare și Înregistrare (15%)
- Înțelegeți funcțiile și caracteristicile abilităților de colectare a metricilor Hadoop
- Analizați interfețele web NameNode și JobTracker
- Înțelegeți cum să monitorizați Daemonii clusterului
- Identificați și monitorizați utilizarea CPU pe nodurile master
- Descrieți cum să monitorizați schimbul și alocarea memoriei pe toate nodurile
- Identificați cum să vizualizați și să gestionați fișierele de jurnal Hadoop
- Interpretați un fișier de jurnal
Cerințe
- Cunoștințe de bază în administrarea Linux
- Cunoștințe de bază în programare
35 Ore
Mărturii (3)
I genuinely enjoyed the many hands-on sessions.
Jacek Pieczatka
Curs - Administrator Training for Apache Hadoop
Tradus de catre o masina
I genuinely enjoyed the big competences of Trainer.
Grzegorz Gorski
Curs - Administrator Training for Apache Hadoop
Tradus de catre o masina
I mostly liked the trainer giving real live Examples.
Simon Hahn
Curs - Administrator Training for Apache Hadoop
Tradus de catre o masina