Schița de curs

Introducere

  • Introducere în Cloud Computing și soluții Big Data
  • Prezentați caracteristicile și arhitectura Apache Hadoop

  • Configurarea Hadoop

    • Planificarea unui cluster Hadoop (local, cloud, etc.)
    • Selectarea OS-ului și distribuția Hadoop
    • Alocarea resurselor (hardware, rețea, etc.)
    • Descărcarea și instalarea software-ului
    • Determinarea dimensiunii clusterului pentru flexibilitate

    • Lucrul cu HDFS

      • Înțelegerea Sistemului de Fișiere Distribuit Hadoop (HDFS)
      • Prezentați referința de comandă HDFS
      • Accesarea HDFS
      • Efectuarea operațiilor de bază cu fișiere pe HDFS
      • Folosirea S3 ca complement la HDFS

      • Prezentați MapReduce

        • Înțelegerea fluxului de date în cadrul framework-ului MapReduce
        • Map, Shuffle, Sort și Reduce
        • Demo: Calcularea celor mai mari salarii

        • Lucrul cu YARN

          • Înțelegerea gestionării resurselor în Hadoop
          • Lucrul cu ResourceManager, NodeManager, Application Master
          • Programarea sarcinilor sub YARN
          • Programarea pentru un număr mare de noduri și clustere
          • Demo: Programarea sarcinilor

          • Integrarea Hadoop cu Spark

            • Setați stocarea pentru Spark (HDFS, Amazon S3, NoSQL, etc.)
            • Înțelegeți Seturile Distribuite Reziliente (RDDs)
            • Creați un RDD
            • Implementați transformările RDD
            • Demo: Implementarea unui program de căutare text pentru titluri de filme

            • Gestionarea unui cluster Hadoop

              • Monitorizarea Hadoop
              • Sigurarea unui cluster Hadoop
              • Adăugarea și eliminarea nodurilor
              • Executarea unui benchmark de performanță
              • Potrivirea unui cluster Hadoop pentru optimizarea performanței
              • Copierea, recuperarea și planificarea continuității afacerii
              • Asigurarea disponibilității ridicate (HA)

              • Actualizarea și migrarea unui cluster Hadoop

                • Evaluarea cerințelor de sarcină de lucru
                • Actualizarea Hadoop
                • Mutarea de la local la cloud și invers
                • Recuperarea după eșuieri

                • Soluționarea problemelor

                  Rezumat și concluzie

Cerințe

  • Experiență în administrarea sistemelor
  • Experiență cu linia de comandă Linux
  • O înțelegere a conceptelor de Big Data

  • Audiență

    • Administratori de sisteme
    • DBA-uri (Administrați Baze de Date)

 35 ore

Numărul de participanți


Pret per participant

Mărturii (5)

Cursuri viitoare

Categorii înrudite