Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Schița de curs
Big Data Prezentare generală:
- Ce este Big Data
- De ce Big Data câștigă popularitate
- Big Data Studii de caz
- Big Data Caracteristici
- Soluții pentru a lucra pe Big Data.
Hadoop și componentele sale:
- Ce este Hadoop și care sunt componentele sale.
- Hadoop Arhitectura și caracteristicile sale privind datele pe care le poate gestiona/procesa.
- Scurtă prezentare a istoriei Hadoop, a companiilor care o utilizează și a motivelor pentru care au început să o utilizeze.
- Hadoop Cadrul de lucru și componentele sale - explicat în detaliu.
- Ce este HDFS și citirile - scrierile în Hadoop Distributed File System.
- Cum se configurează clusterul Hadoop în diferite moduri - Stand- alone/Pseudo/Multi Node cluster.
(Aceasta include configurarea unui cluster Hadoop în VirtualBox/KVM/VMware, configurații de rețea care trebuie examinate cu atenție, rularea demonilor Hadoop și testarea clusterului).
- Ce este cadrul de lucru Map Reduce și cum funcționează acesta.
- Executarea lucrărilor Map Reduce pe clusterul Hadoop.
- Înțelegerea replicării, oglindirii și conștientizării rack-ului în contextul clusterelor Hadoop.
Planificarea clusterelor Hadoop:
- Cum să vă planificați clusterul hadoop.
- Înțelegerea hardware-software pentru a vă planifica clusterul hadoop.
- Înțelegerea volumelor de lucru și planificarea clusterului pentru a evita eșecurile și a obține performanțe optime.
Ce este MapR și de ce MapR :
- Prezentare generală a MapR și a arhitecturii sale.
- Înțelegerea și funcționarea MapR Control System, MapR Volumes , snapshots & Mirrors.
- Planificarea unui cluster în contextul MapR.
- Compararea MapR cu alte distribuții și Apache Hadoop.
- Instalarea MapR și desfășurarea clusterului.
Configurarea și administrarea clusterului:
- Gestionarea serviciilor, nodurilor, instantaneelor, volumelor oglindă și clusterelor la distanță.
- Înțelegerea și gestionarea nodurilor.
- Înțelegerea componentelor Hadoop, instalarea componentelor Hadoop alături de serviciile MapR.
- [Introducerea datelor în cluster, inclusiv prin NFS Gestionarea serviciilor și a nodurilor.
- Gestionarea datelor prin utilizarea volumelor, gestionarea utilizatorilor și grupurilor, gestionarea și atribuirea de roluri nodurilor, punerea în funcțiune și scoaterea din funcțiune a nodurilor, administrarea clusterului și monitorizarea performanțelor, configurarea/analizarea și monitorizarea metricilor pentru monitorizarea performanțelor, configurarea și administrarea securității MapR.
- Înțelegerea și lucrul cu M7- Native storage pentru tabelele MapR.
- Configurarea și reglarea clusterului pentru performanțe optime.
Actualizarea clusterelor și integrarea cu alte configurații:
- Actualizarea versiunii software a MapR și tipurile de actualizare.
- Configurarea clusterului Mapr pentru a accesa clusterul HDFS.
- Configurarea clusterului MapR pe Amazon Elastic Mapreduce.
Toate subiectele de mai sus includ demonstrații și sesiuni de practică pentru ca cursanții să aibă o experiență practică a tehnologiei.
Cerințe
- Cunoștințe de bază de Linux FS
- Cunoștințe de bază Java
- Cunoștințe de Apache Hadoop (recomandat)
28 ore
Mărturii (1)
practical things of doing, also theory was served good by Ajay