Schița de curs
Introducere
- Introducere în Cloud Computing și soluții Big Data
- Prezentare generală a caracteristicilor și arhitecturii Apache Hadoop
Configurarea Hadoop
- Planificarea unui cluster Hadoop (on-premise, cloud, etc.)
- Selectarea sistemului de operare și distribuției Hadoop
- Provizionarea resurselor (hardware, rețea, etc.)
- Descărcarea și instalarea software-ului
- Dimensionarea clusterului pentru flexibilitate
Lucrul cu HDFS
- Înțelegerea Hadoop Distributed File System (HDFS)
- Prezentare generală a Referinței de Comenzi HDFS
- Accesarea HDFS
- Efectuarea operațiunilor de bază pe fișiere în HDFS
- Utilizarea S3 ca complement pentru HDFS
Prezentare generală a MapReduce
- Înțelegerea fluxului de date în cadrul MapReduce
- Map, Shuffle, Sort și Reduce
- Demo: Calculul salariilor maxime
Lucrul cu YARN
- Înțelegerea gestionării resurselor în Hadoop
- Lucrul cu ResourceManager, NodeManager, Application Master
- Programarea job-urilor sub YARN
- Programarea pentru numere mari de noduri și clustere
- Demo: Programarea job-urilor
Integrarea Hadoop cu Spark
- Configurarea stocării pentru Spark (HDFS, Amazon, S3, NoSQL, etc.)
- Înțelegerea Resilient Distributed Datasets (RDDs)
- Crearea unui RDD
- Implementarea transformărilor RDD
- Demo: Implementarea unui program de căutare text pentru titluri de filme
Gestionarea unui cluster Hadoop
- Monitorizarea Hadoop
- Securizarea unui cluster Hadoop
- Adăugarea și eliminarea nodurilor
- Efectuarea unui benchmark de performanță
- Optimizarea performanței unui cluster Hadoop
- Backup, recuperare și planificare a continuității afacerii
- Asigurarea disponibilității ridicate (HA)
Actualizarea și migrarea unui cluster Hadoop
- Evaluarea cerințelor de lucru
- Actualizarea Hadoop
- Trecerea de la on-premise la cloud și invers
- Recuperarea din defecțiuni
Depanare
Rezumat și concluzii
Cerințe
- Experiență în administrarea sistemelor
- Experiență cu linia de comandă Linux
- Înțelegerea conceptelor de big data
Publicul țintă
- Administratori de sistem
- DBAs
Mărturii (5)
Exemplele live
Ahmet Bolat - Accenture Industrial SS
Curs - Python, Spark, and Hadoop for Big Data
Tradus de catre o masina
foarte interactiv...
Richard Langford
Curs - SMACK Stack for Data Science
Tradus de catre o masina
Suficient de practic, instrucționarul este căpățan
Chris Tan
Curs - A Practical Introduction to Stream Processing
Tradus de catre o masina
Învățați spark streaming, Databricks și AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curs - Apache Spark in the Cloud
Tradus de catre o masina
aspecte practice de lucru, precum și teoria au fost prezentate bine de Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Curs - Hadoop Administration on MapR
Tradus de catre o masina