Schița de curs

Introducere

  • Baze de date grafice și biblioteci

Înțelegerea Datelor în Grafuri

  • Graful ca structură de date
  • Folosirea vârfurilor (puncte) și muchiilor (linii) pentru a modela scenarii din lumea reală

Utilizarea Bazelor de Date Grafice pentru a Modela, Persista și Procesa Date în Grafuri

  • Algoritmi/parcurgeri locale în grafuri
  • neo4j, OrientDB și Titan

Exercițiu: Modelarea Datelor în Grafuri cu neo4j

  • Modelarea datelor pe tablă albă

Dincolo de Bazele de Date Grafice: Calculul pe Grafuri

  • Înțelegerea grafului de proprietăți
  • Modelarea în grafuri a diferitelor scenarii (graful software, graful discuțiilor, graful conceptelor)

Rezolvarea Problemelor din Lumea Reală cu Parcurgeri

  • Parcurgere algoritmică/dirijată a grafului
  • Determinarea dependențelor circulare

Studiu de Caz: Clasificarea Contribuitorilor la Discuții

  • Clasificare după numărul și adâncimea discuțiilor contribuite
  • O notă despre analiza sentimentelor și a conceptelor

Calculul pe Grafuri: Instrumente Locale, In-Memory

  • Analiză și vizualizare a grafului
  • JUNG, NetworkX și iGraph

Exercițiu: Modelarea Datelor în Grafuri cu NetworkX

  • Folosirea NetworkX pentru a modela un sistem complex

Calculul pe Grafuri: Framework-uri de Procesare în Loturi

  • Utilizarea Hadoop pentru stocare (HDFS) și procesare (MapReduce)
  • Prezentare generală a algoritmilor iterativi
  • Hama, Giraph și GraphLab

Calculul pe Grafuri: Calcul Paralel pe Grafuri

  • Unificarea ETL, analizei exploratorii și calculului iterativ pe grafuri într-un singur sistem
  • GraphX

Configurare și Instalare

  • Hadoop și Spark

Operatori GraphX

  • Proprietăți, structuri, îmbinări, agregare de vecinătate, stocare în cache și eliminare din cache

Iterare cu API Pregel

  • Transmiterea argumentelor pentru trimitere, primire și calcul

Construirea unui Graf

  • Folosirea vârfurilor și muchiilor într-un RDD sau pe disc

Proiectarea Algoritmilor Scalabili

  • Optimizarea GraphX

Accesarea Algoritmilor Adiționali

  • PageRank, Componente Conexe, Numărarea Triunghiurilor

Exercițiu: Page Rank și Top Utilizatori

  • Construirea și procesarea datelor în grafuri folosind fișiere text ca intrare

Implementarea în Producție

Observații Finale

Cerințe

  • Cunoștințe de programare în Java și framework-uri
  • O înțelegere generală a Python este utilă, dar nu este obligatorie
  • O înțelegere generală a conceptelor de bază de date

Publicul țintă

  • Dezvoltatori
 28 Ore

Numărul de participanți


Pret per participant

Mărturii (3)

Cursuri viitoare

Categorii înrudite