Schița de curs

Introducere

  • Introducere în Cloud Computing și soluții Big Data
  • Prezentare generală a caracteristicilor și arhitecturii Apache Hadoop

Configurarea Hadoop

  • Planificarea unui cluster Hadoop (on-premise, cloud, etc.)
  • Selectarea sistemului de operare și distribuției Hadoop
  • Provizionarea resurselor (hardware, rețea, etc.)
  • Descărcarea și instalarea software-ului
  • Dimensionarea clusterului pentru flexibilitate

Lucrul cu HDFS

  • Înțelegerea Hadoop Distributed File System (HDFS)
  • Prezentare generală a Referinței de Comenzi HDFS
  • Accesarea HDFS
  • Efectuarea operațiunilor de bază pe fișiere în HDFS
  • Utilizarea S3 ca complement pentru HDFS

Prezentare generală a MapReduce

  • Înțelegerea fluxului de date în cadrul MapReduce
  • Map, Shuffle, Sort și Reduce
  • Demo: Calculul salariilor maxime

Lucrul cu YARN

  • Înțelegerea gestionării resurselor în Hadoop
  • Lucrul cu ResourceManager, NodeManager, Application Master
  • Programarea job-urilor sub YARN
  • Programarea pentru numere mari de noduri și clustere
  • Demo: Programarea job-urilor

Integrarea Hadoop cu Spark

  • Configurarea stocării pentru Spark (HDFS, Amazon, S3, NoSQL, etc.)
  • Înțelegerea Resilient Distributed Datasets (RDDs)
  • Crearea unui RDD
  • Implementarea transformărilor RDD
  • Demo: Implementarea unui program de căutare text pentru titluri de filme

Gestionarea unui cluster Hadoop

  • Monitorizarea Hadoop
  • Securizarea unui cluster Hadoop
  • Adăugarea și eliminarea nodurilor
  • Efectuarea unui benchmark de performanță
  • Optimizarea performanței unui cluster Hadoop
  • Backup, recuperare și planificare a continuității afacerii
  • Asigurarea disponibilității ridicate (HA)

Actualizarea și migrarea unui cluster Hadoop

  • Evaluarea cerințelor de lucru
  • Actualizarea Hadoop
  • Trecerea de la on-premise la cloud și invers
  • Recuperarea din defecțiuni

Depanare

Rezumat și concluzii

Cerințe

  • Experiență în administrarea sistemelor
  • Experiență cu linia de comandă Linux
  • Înțelegerea conceptelor de big data

Publicul țintă

  • Administratori de sistem
  • DBAs
 35 Ore

Numărul de participanți


Pret per participant

Mărturii (5)

Cursuri viitoare

Categorii înrudite