Schița de curs

Big Data Prezentare generală:

  • Ce este Big Data
  • De ce Big Data câștigă popularitate
  • Big Data Studii de caz
  • Big Data Caracteristici
  • Soluții pentru a lucra pe Big Data.

Hadoop și componentele sale:

  • Ce este Hadoop și care sunt componentele sale.
  • Hadoop Arhitectura și caracteristicile sale privind datele pe care le poate gestiona/procesa.
  • Scurtă prezentare a istoriei Hadoop, a companiilor care o utilizează și a motivelor pentru care au început să o utilizeze.
  • Hadoop Cadrul de lucru și componentele sale - explicat în detaliu.
  • Ce este HDFS și citirile - scrierile în Hadoop Distributed File System.
  • Cum se configurează clusterul Hadoop în diferite moduri - Stand- alone/Pseudo/Multi Node cluster.

(Aceasta include configurarea unui cluster Hadoop în VirtualBox/KVM/VMware, configurații de rețea care trebuie examinate cu atenție, rularea demonilor Hadoop și testarea clusterului).

  • Ce este cadrul de lucru Map Reduce și cum funcționează acesta.
  • Executarea lucrărilor Map Reduce pe clusterul Hadoop.
  • Înțelegerea replicării, oglindirii și conștientizării rack-ului în contextul clusterelor Hadoop.

Planificarea clusterelor Hadoop:

  • Cum să vă planificați clusterul hadoop.
  • Înțelegerea hardware-software pentru a vă planifica clusterul hadoop.
  • Înțelegerea volumelor de lucru și planificarea clusterului pentru a evita eșecurile și a obține performanțe optime.

Ce este MapR și de ce MapR :

  • Prezentare generală a MapR și a arhitecturii sale.
  • Înțelegerea și funcționarea MapR Control System, MapR Volumes , snapshots & Mirrors.
  • Planificarea unui cluster în contextul MapR.
  • Compararea MapR cu alte distribuții și Apache Hadoop.
  • Instalarea MapR și desfășurarea clusterului.

Configurarea și administrarea clusterului:

  • Gestionarea serviciilor, nodurilor, instantaneelor, volumelor oglindă și clusterelor la distanță.
  • Înțelegerea și gestionarea nodurilor.
  • Înțelegerea componentelor Hadoop, instalarea componentelor Hadoop alături de serviciile MapR.
  • [Introducerea datelor în cluster, inclusiv prin NFS Gestionarea serviciilor și a nodurilor.
  • Gestionarea datelor prin utilizarea volumelor, gestionarea utilizatorilor și grupurilor, gestionarea și atribuirea de roluri nodurilor, punerea în funcțiune și scoaterea din funcțiune a nodurilor, administrarea clusterului și monitorizarea performanțelor, configurarea/analizarea și monitorizarea metricilor pentru monitorizarea performanțelor, configurarea și administrarea securității MapR.
  • Înțelegerea și lucrul cu M7- Native storage pentru tabelele MapR.
  • Configurarea și reglarea clusterului pentru performanțe optime.

Actualizarea clusterelor și integrarea cu alte configurații:

  • Actualizarea versiunii software a MapR și tipurile de actualizare.
  • Configurarea clusterului Mapr pentru a accesa clusterul HDFS.
  • Configurarea clusterului MapR pe Amazon Elastic Mapreduce.

Toate subiectele de mai sus includ demonstrații și sesiuni de practică pentru ca cursanții să aibă o experiență practică a tehnologiei.

Cerințe

  • Cunoștințe de bază de Linux FS
  • Cunoștințe de bază Java
  • Cunoștințe de Apache Hadoop (recomandat)
 28 ore

Numărul de participanți


Pret per participant

Mărturii (1)

Upcoming Courses

Categorii înrudite