Schița de curs

Arhitectura Greenplum

  • Preprocesarea paralelă și multiprocessorizarea simetrică
  • Rolurile segmentelor și configurarea clusterului
  • Scalabilitatea și mișcarea datelor
  • Arhitectura Greenplum Data Warehouse

Structurile de tabel Greenplum

  • Tabele distribuite vs. tabele atribuite aleatoriu
  • Tabele heap vs. tabele append-only
  • Formate de stocare pe randuri vs. formate de stocare pe coloane
  • Tabele particionate și clusterizate

Distribuirea datelor și hashing-ul

  • Logica de hashing și cheile de distribuție
  • Gestionarea skew-ului și impactul asupra performanței
  • Hărți hash și strategii de plasare a randurilor

Indicii și optimizarea performanței

  • Indici clusterizați și necusterizați
  • Utilizarea indiciilor B-tree și bitmap
  • Scanare de indici și comportamentul de stocare

Design fizic al bazei de date

  • Normalizarea și designul modelului logic
  • Strategii de acces utilizator și analiza distribuției datelor
  • Demograficul datelor și deciziile de indexare

Tehnici de denormalizare

  • Date derivate, tabele de rezumat și pre-join-uri
  • Tabele coloane ca partionare verticală
  • Data marts și vizualizări materializate

SQL avansat și execuția interogărilor

  • Strategii de join și redistribuirea datelor
  • OLAP și funcțiile de fereaștră (window)
  • Tabele temporare, subinterogări și tabele derivate

Planuri EXPLAIN și optimizarea interogărilor

  • Citirea și interpretarea ieșirii EXPLAIN
  • Analiza costurilor și optimizarea planului
  • Mișcarea de join și operațiunile locale segmentate

Utilitățile Greenplum și cele mai bune practici

  • ANALYZE și VACUUM
  • Încărcarea datelor și mișcarea acestora cu Nexus
  • Securitate, permisiuni și sfaturi de performanță

Rezumat și următorii pași

Cerințe

  • O înțelegere a bazelor de date relaționale și SQL
  • Experiență cu depozitele de date sau sistemele analitice
  • Familiaritate cu operațiunile pe linia de comandă Linux

Audiență

  • Arhitecți și ingineri de date
  • Administratori de baze de date și lideri tehnici
  • Dezvoltatori BI și specialiști analitici care lucrează cu Greenplum
 21 ore

Numărul de participanți


Pret per participant

Mărturii (1)

Cursuri viitoare

Categorii înrudite