Schița de curs
Introducere
- Introducere în Cloud Computing și soluții Big Data
- Prezentare generală a caracteristicilor și arhitecturii Apache Hadoop
Configurarea Hadoop
- Planificarea unui cluster Hadoop (on-premise, cloud, etc.)
- Selectarea sistemului de operare și a distribuției Hadoop
- Provizionarea resurselor (hardware, rețea, etc.)
- Descărcarea și instalarea software-ului
- Dimensionarea clusterului pentru flexibilitate
Lucrul cu HDFS
- Înțelegerea Hadoop Distributed File System (HDFS)
- Prezentare generală a referinței de comenzi HDFS
- Accesarea HDFS
- Efectuarea operațiilor de bază cu fișiere pe HDFS
- Utilizarea S3 ca complement la HDFS
Prezentare generală a MapReduce
- Înțelegerea fluxului de date în cadrul MapReduce
- Map, Shuffle, Sort și Reduce
- Demo: Calculul salariilor maxime
Lucrul cu YARN
- Înțelegerea managementului resurselor în Hadoop
- Lucrul cu ResourceManager, NodeManager, Application Master
- Planificarea job-urilor sub YARN
- Planificarea pentru un număr mare de noduri și clustere
- Demo: Planificarea job-urilor
Integrarea Hadoop cu Spark
- Configurarea stocării pentru Spark (HDFS, Amazon, S3, NoSQL, etc.)
- Înțelegerea Resilient Distributed Datasets (RDDs)
- Crearea unui RDD
- Implementarea transformărilor RDD
- Demo: Implementarea unui program de căutare text pentru titluri de filme
Gestionarea unui cluster Hadoop
- Monitorizarea Hadoop
- Securizarea unui cluster Hadoop
- Adăugarea și eliminarea nodurilor
- Efectuarea unui test de performanță
- Optimizarea performanței unui cluster Hadoop
- Planificarea backup-ului, recuperării și continuității afacerii
- Asigurarea disponibilității ridicate (HA)
Actualizarea și migrarea unui cluster Hadoop
- Evaluarea cerințelor de sarcină de lucru
- Actualizarea Hadoop
- Mutarea de la on-premise la cloud și invers
- Recuperarea din defecțiuni
Depanare
Rezumat și concluzii
Cerințe
- Experiență în administrarea sistemelor
- Experiență cu linia de comandă Linux
- Înțelegerea conceptelor de big data
Publicul țintă
- Administratori de sistem
- DBAs
Mărturii (3)
Mi-a plăcut că a fost practic. Am adorat să aplic cunoștințele teoretice cu exemple practice.
Aurelia-Adriana - Allianz Services Romania
Curs - Python and Spark for Big Data (PySpark)
Tradus de catre o masina
Faptul că am reușit să ne luăm cu noi majoritatea informațiilor/cursului/prezentării/exercițiilor realizate, astfel încât să le putem examina și eventual să refacem ceea ce nu am înțeles inițial sau să îmbunătățim ceea ce deja am făcut.
Raul Mihail Rat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina