Schița de curs

  1. Fundamentele Big Data
    • Big Data și rolul său în lumea corporatistă
    • Fazele de dezvoltare a unei strategii de Big Data într-o corporație
    • Explicarea rațiunii din spatele unei abordări holistice a Big Data
    • Componentele necesare într-o platformă de Big Data
    • Soluții de stocare a datelor mari
    • Limitele tehnologiilor tradiționale
    • Prezentare generală a tipurilor de baze de date
    • Cele patru dimensiuni ale Big Data
  2. Impactul Big Data asupra afacerilor
    • Importanța Big Data pentru afaceri
    • Provocări în extragerea datelor utile
    • Integrarea Big Data cu datele tradiționale
  3. Tehnologii de stocare a datelor mari
    • Prezentare generală a tehnologiilor de date mari
      • Modele de stocare a datelor
      • Hadoop
      • Hive
      • Cassandra
      • MongoDB
    • Alegerea tehnologiei potrivite pentru date mari
  4. Prelucrarea datelor mari
    • Conectarea și extragerea datelor din baze de date
    • Transformarea și pregătirea datelor pentru procesare
    • Utilizarea Hadoop MapReduce pentru procesarea datelor distribuite
    • Monitorizarea și executarea job-urilor Hadoop MapReduce
    • Blocuri de construcție ale sistemului de fișiere distribuit Hadoop
    • MapReduce și Yarn
    • Prelucrarea datelor de flux cu Spark
  5. Instrumente și tehnologii de analiză a datelor mari
    • Programarea Hadoop cu limbajul Pig Latin
    • Interogarea datelor mari cu Hive
    • Explorarea datelor cu Mahout
    • Instrumente de vizualizare și raportare
  6. Big Data în afaceri
    • Gestionarea și stabilirea nevoilor de Big Data
    • Importanța Big Data pentru afaceri
    • Selectarea instrumentelor potrivite de Big Data pentru problema dată

Concepte de Data Warehousing

  • Ce este un Data Warehouse?
  • Diferența dintre OLTP și Data Warehousing
  • Achiziția datelor
  • Extragerea datelor
  • Transformarea datelor.
  • Încărcarea datelor
  • Data Marts
  • Data Mart dependent vs independent
  • Proiectarea bazei de date

Concepte de Testare ETL:

  • Introducere.
  • Ciclul de viață al dezvoltării software.
  • Metodologii de testare.
  • Procesul de flux de lucru al testării ETL.
  • Responsabilitățile de testare ETL în Data Stage.       

Fundamentele Big Data

  • Big Data și rolul său în lumea corporatistă
  • Fazele de dezvoltare a unei strategii de Big Data într-o corporație
  • Explicarea rațiunii din spatele unei abordări holistice a Big Data
  • Componentele necesare într-o platformă de Big Data
  • Soluții de stocare a datelor mari
  • Limitele tehnologiilor tradiționale
  • Prezentare generală a tipurilor de baze de date

Baze de date NoSQL

Hadoop

Map Reduce

Apache Spark

Cerințe

Participanții ar trebui să aibă cunoștințe și o oarecare experiență în utilizarea instrumentelor de stocare, precum și să fie familiarizați cu manipularea seturilor mari de date.

 14 Ore

Numărul de participanți


Pret per participant

Mărturii (1)

Cursuri viitoare

Categorii înrudite