Intrati in legatura

Schița de curs

Elemente de bază ale NiFi și Fluxului de Date

  • Date în mișcare vs date în repaus: concepte și provocări
  • Arhitectura NiFi: nuclee, controler de flux, proveniență și buletin
  • Componente cheie: procesoare, conexiuni, controlere și proveniență

Contextul Big Data și Integrarea

  • Rolul NiFi în ecosistemele Big Data (Hadoop, Kafka, stocare în cloud)
  • Prezentare generală a HDFS, MapReduce și alternativelor moderne
  • Cazuri de utilizare: ingestie de fluxuri, transport de loguri, conducte de evenimente

Instalare, Configurare și Setare Clustere

  • Instalarea NiFi pe un singur nod și în modul cluster
  • Configurarea clusterului: roluri ale nodurilor, Zookeeper și echilibrarea sarcinii
  • Orchestrarea implementărilor NiFi: utilizarea Ansible, Docker sau Helm

Proiectarea și Gestionarea Fluxurilor de Date

  • Rutarea, filtrarea, divizarea, unirea fluxurilor
  • Configurarea procesorului (InvokeHTTP, QueryRecord, PutDatabaseRecord, etc.)
  • Gestionarea operațiilor de schemă, îmbogățire și transformare
  • Gestionarea erorilor, relații de reîncercare și backpressure

Scenarii de Integrare

  • Conectarea la baze de date, sisteme de mesagerie, API-uri REST
  • Streaming către sisteme de analiză: Kafka, Elasticsearch sau stocare în cloud
  • Integrare cu Splunk, Prometheus sau conducte de logare

Monitorizare, Recuperare și Proveniență

  • Utilizarea interfeței NiFi, metricilor și vizualizatorului de proveniență
  • Proiectarea recuperării autonome și gestionarea grațioasă a defecțiunilor
  • Backup, versionare a fluxurilor și gestionarea schimbărilor

Optimizarea Performanței

  • Reglarea JVM, heap, pool-uri de fire și parametri de cluster
  • Optimizarea designului fluxului pentru a reduce punctele de blocare
  • Izolarea resurselor, priorizarea fluxurilor și controlul debitului

Bune Practici și Guvernanță

  • Documentarea fluxurilor, standarde de denumire, design modular
  • Securitate: TLS, autentificare, controlul accesului, criptarea datelor
  • Controlul schimbărilor, versionare, acces bazat pe roluri, urme de audit

Depanare și Răspuns la Incidente

  • Probleme comune: blocaje, scurgeri de memorie, erori ale procesorului
  • Analiza logurilor, diagnosticarea erorilor și investigarea cauzelor rădăcină
  • Strategii de recuperare și revenire la fluxurile anterioare

Laborator Practic: Implementarea unei Conducte Realiste de Date

  • Construirea unui flux de la cap la cap: ingestie, transformare, livrare
  • Implementarea gestionării erorilor, backpressure și scalării
  • Testarea și optimizarea performanței conductei

Rezumat și Pași Următori

Cerințe

  • Experiență cu linia de comandă Linux
  • Înțelegere de bază a rețelelor și sistemelor de date
  • Expunere la concepte de streaming de date sau ETL

Publicul țintă

  • Administratori de sisteme
  • Ingineri de date
  • Dezvoltatori
  • Profesioniști DevOps
 21 Ore

Numărul de participanți


Pret per participant

Mărturii (7)

Cursuri viitoare

Categorii înrudite