
Programele de instruire live, instruite live Apache Spark demonstrează prin practica de manevră modul în care Spark se încadrează în ecosistemul Big Data și cum se utilizează Spark pentru analiza datelor Programa Apache Spark este disponibilă ca "formare live la fața locului" sau "instruire live la distanță" Training-ul live la fața locului poate fi efectuat la fața locului la sediul clientului Moldova sau în centrele de formare corporativa NobleProg din Moldova Instruirea live la distanță este realizată printr-un desktop interactiv, la distanță NobleProg Furnizorul dvs de formare locală.
Machine Translated
Mărturii
Richard este foarte calm și metodic, cu o perspectivă analitică - exact calitățile necesare pentru a prezenta acest tip de curs.
Kieran Mac Kenna
Curs: Spark for Developers
Machine Translated
share diagramă concept și de asemenea, eșantion pentru mâinile murdare
Mark Yang - FMR
Curs: Spark for Developers
Machine Translated
Scenarii și cazuri aplicabile
zhaopeng liu - Fmr
Curs: Spark for Developers
Machine Translated
Analiza cazurilor
国栋 张
Curs: Spark for Developers
Machine Translated
toate părțile din această sesiune
Eric Han - Fmr
Curs: Spark for Developers
Machine Translated
Știm mai multe despre întregul mediu.
John Kidd
Curs: Spark for Developers
Machine Translated
Formatorul a făcut clasa interesantă și amuzantă, ceea ce ajută destul de mult cu antrenamentul de zi.
Ryan Speelman
Curs: Spark for Developers
Machine Translated
Cred că antrenorul a avut un stil excelent de a combina umorul și povestirile din viața reală pentru a face subiecții la îndemână foarte accesibili. Aș recomanda acest profesor în viitor.
Curs: Spark for Developers
Machine Translated
Ernesto a făcut o treabă excelentă explicând conceptele de nivel înalt de utilizare a lui Spark și a diferitelor sale module.
Michael Nemerouf
Curs: Spark for Developers
Machine Translated
Acesta este unul dintre cele mai bune practici cu cursuri de programare a exercițiilor pe care le-am luat vreodată.
Laura Kahn
Curs: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
Aceasta este una dintre cele mai bune calificări online de calitate pe care le-am făcut vreodată în cariera mea de 13 ani. Păstrați marea lucrare !.
Curs: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
Richard a fost foarte dispus să se abată când vroiam să adresăm întrebări semi-corelate despre lucruri care nu se refereau la programa școlară. Explicațiile au fost clare și el a fost în față cu privire la avertismente în orice sfat ne-a dat.
ARM Limited
Curs: Spark for Developers
Machine Translated
VM mi-a placut foarte mult Profesorul a fost foarte informat cu privire la subiect, precum și alte subiecte, el a fost foarte frumos și prietenos Mi-a plăcut facilitatea din Dubai.
Safar Alqahtani - Elm Information Security
Curs: Big Data Analytics in Health
Machine Translated
sarcini practice
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curs: Python and Spark for Big Data (PySpark)
Machine Translated
Ajay a fost foarte prietenos, de ajutor și, de asemenea, cunoscut despre subiectul pe care l-a discutat.
Biniam Guulay - ICE International Copyright Enterprise Germany GmbH
Curs: Spark for Developers
Machine Translated
Exerciții de laborator. Aplicarea teoriei din prima zi în zilele următoare.
Dell
Curs: A Practical Introduction to Stream Processing
Machine Translated
Profesorul a adaptat programul de pregătire la nevoile noastre actuale.
EduBroker Sp. z o.o.
Curs: Python and Spark for Big Data (PySpark)
Machine Translated
Făcând exerciții similare diferite moduri ajută într-adevăr să înțelegem ce poate face fiecare componentă ( Hadoop / Spark, standalone / cluster) de la sine și împreună. Mi-a dat idei cu privire la modul în care ar trebui să-mi testez aplicația pe mașina mea locală atunci când mă dezvolt vs când este implementată pe un cluster.
Thomas Carcaud - IT Frankfurt GmbH
Curs: Spark for Developers
Machine Translated
atenția individuală.
ARCHANA ANILKUMAR - PPL
Curs: Python and Spark for Big Data (PySpark)
Machine Translated
A fost minunat pentru a obține o înțelegere a ceea ce se întâmplă sub capota de Spark. Știind ce se întâmplă sub capota ajută pentru a înțelege mai bine de ce codul este sau nu face ceea ce vă așteptați să facă. O mulțime de formare a fost mâinile pe care este întotdeauna mare și secțiunea privind optimizările a fost extrem de relevante pentru munca mea actuală, care a fost frumos.
Intelligent Medical Objects
Curs: Apache Spark in the Cloud
Machine Translated
Cred că antrenorul a avut un stil excelent de a combina umorul și povestirile din viața reală pentru a face subiecții la îndemână foarte accesibili. Aș recomanda acest profesor în viitor.
Curs: Spark for Developers
Machine Translated
Aceasta este una dintre cele mai bune calificări online de calitate pe care le-am făcut vreodată în cariera mea de 13 ani. Păstrați marea lucrare !.
Curs: Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Machine Translated
Spark Subcategories
Spark Course Outlines
Această formare directă (online sau on-site) este destinată dezvoltatorilor care doresc să utilizeze și să integreze Spark, Hadoop, și Python pentru a procesa, analiza și transforma seturi de date mari și complexe.
La sfârșitul cursului, participanții vor putea:
Configurați mediul necesar pentru a începe prelucrarea datelor mari cu Spark, Hadoop, și Python. Înțelegeți caracteristicile, componentele de bază și arhitectura Spark și Hadoop. Aflați cum să integrați Spark, Hadoop, și Python pentru prelucrarea datelor mari. Explorați instrumentele din ecosistemul Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka și Flume). Construiți sisteme de recomandare de filtrare colaborative similare cu Netflix, YouTube, Amazon, Spotify și Google. Utilizați Apache Mahout pentru a scala algoritmele de învățare cu mașină.
Formatul cursului
Lecții și discuții interactive. Multe exerciții și practici. Implementarea pe mâini într-un mediu live-lab.
Opțiuni de personalizare
Pentru a solicita o pregătire personalizată pentru acest curs, vă rugăm să ne contactați pentru a organiza.
By the end of this training, participants will be able to:
- Learn how to use Spark with Python to analyze Big Data.
- Work on exercises that mimic real world cases.
- Use different tools and techniques for big data analysis using PySpark.
Acest curs va prezenta Apache Spark . Studenții vor afla cum Spark se încadrează în ecosistemul Big Data și cum să folosească Spark pentru analiza datelor. Cursul acoperă shell-ul Spark pentru analiza interactivă a datelor, Spark intern, API-uri Spark, Spark SQL , Spark streaming, și învățare automată și graficX.
AUDIENCE:
Dezvoltatori / analisti de date
Acest instruire în direct (la fața locului sau la distanță), condus de instructor, introduce Hortonworks Data Platform (HDP) și parcurge participanții prin implementarea soluției Spark + Hadoop .
Până la sfârșitul acestui antrenament, participanții vor putea:
- Folosiți Hortonworks pentru a rula în mod sigur Hadoop la scară largă.
- Unificați capacitățile de securitate, guvernare și operațiuni ale lui Hadoop cu fluxurile de lucru analitice agile Spark.
- Folosiți Hortonworks pentru a investiga, valida, certifica și susține fiecare componentă dintr-un proiect Spark.
- Procesați diferite tipuri de date, inclusiv structurate, nestructurate, în mișcare și în repaus.
Formatul cursului
- Prelegeri și discuții interactive.
- O mulțime de exerciții și practică.
- Implementarea practică într-un mediu de laborator live.
Opțiuni de personalizare a cursului
- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
Această pregătire directă, condusă de instructori, introduce conceptele și abordările de implementare a analizei geospatiale și marchează participanții prin crearea unei aplicații de analiză predictivă folosind Magellan pe Spark.
La sfârșitul cursului, participanții vor putea:
Întreabă eficient, parsează și aderează seturile de date geospatiale la scară Implementarea datelor geospatiale în inteligența de afaceri și aplicațiile de analiză predictivă Utilizați context spațial pentru a extinde capacitățile dispozitivelor mobile, a senzorilor, a logurilor și a dispozitivelor de purtare
Formatul cursului
Lecții și discuții interactive. Multe exerciții și practici. Implementarea pe mâini într-un mediu live-lab.
Opțiuni de personalizare
Pentru a solicita o pregătire personalizată pentru acest curs, vă rugăm să ne contactați pentru a organiza.
În această instruire condusă de instructori, cursuri live, participanții vor învăța cum să utilizeze Alluxio pentru a purta diferite cadre de calcul cu sisteme de stocare și pentru a gestiona în mod eficient datele de scară multi-petabyte pe măsură ce trec prin crearea unei aplicații cu Alluxio.
La sfârșitul cursului, participanții vor putea:
Dezvoltați o aplicație cu Alluxio Conectați sistemele de date mari și aplicațiile în timp ce păstrați un spațiu de nume Extrage eficient valoarea din datele mari în orice format de stocare Îmbunătățirea performanței sarcinii de lucru Dezvoltați și gestionați Alluxio independent sau clusterat
Audienţă
Știință de date Dezvoltatori Administratorul sistemului
Formatul cursului
Lecții parțiale, discuții parțiale, exerciții și practici grele
- pentru a executa interogări SQL .
- pentru a citi datele dintr-o instalație Hive existentă.
În cadrul acestui training, instruit în direct (la fața locului sau la distanță), participanții vor învăța cum să analizeze diverse tipuri de seturi de date folosind Spark SQL .
Până la sfârșitul acestui antrenament, participanții vor putea:
- Instalați și configurați Spark SQL .
- Efectuați analiza datelor utilizând Spark SQL .
- Seturi de date de interogare în diferite formate.
- Vizualizați datele și rezultatele interogării.
Formatul cursului
- Prelegeri și discuții interactive.
- O mulțime de exerciții și practică.
- Implementarea practică într-un mediu de laborator live.
Opțiuni de personalizare a cursului
- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
În cadrul acestui training, instruit în direct (la fața locului sau la distanță), participanții vor învăța cum să configureze și să integreze diferite cadre de Stream Processing fluxurilor cu sistemele de stocare de date mari existente și aplicațiile software și microserviciile aferente.
Până la sfârșitul acestui antrenament, participanții vor putea:
- Instalați și configurați diferite cadre de Stream Processing fluxurilor, cum ar fi Spark Streaming și Kafka Streaming.
- Înțelegeți și selectați cadrul cel mai potrivit pentru job.
- Procesarea datelor în mod continuu, concomitent și într-o manieră record-by-record.
- Integrați soluțiile de Stream Processing fluxurilor cu bazele de date existente, depozite de date, lacuri de date etc.
- Integrați cea mai potrivită bibliotecă de procesare a fluxurilor cu aplicații de întreprindere și microservicii.
Public
- Dezvoltatori
- Arhitecți software
Formatul cursului
- Partea de prelegere, o discuție parțială, exerciții și practici practice
notițe
- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
Industria sănătății are cantități masive de date medicale și clinice eterogene complexe. Aplicarea analizelor de date mari asupra datelor de sănătate prezintă un potențial imens în obținerea unor perspective pentru îmbunătățirea furnizării asistenței medicale. Cu toate acestea, enormitatea acestor seturi de date prezintă provocări mari în analize și aplicații practice într-un mediu clinic.
În cadrul acestui instruire, instruit în direct (de la distanță), participanții vor învăța cum să efectueze analize de date mari în sănătate, în timp ce parcurg o serie de exerciții practice în laborator live.
Până la sfârșitul acestui antrenament, participanții vor putea:
- Instalați și configurați instrumente de analiză a datelor mari precum Hadoop MapReduce și Spark
- Înțelegeți caracteristicile datelor medicale
- Aplicați tehnici de date mari pentru a trata datele medicale
- Studiați sisteme de date mari și algoritmi în contextul aplicațiilor pentru sănătate
Public
- Dezvoltatori
- Oamenii de știință de date
Formatul cursului
- Partea de prelegere, o discuție parțială, exerciții și practici practice.
Notă
- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
PUBLIC:
Inginer de date, DevOps , Data Scientist
Acest training, instruit în direct (la fața locului sau la distanță), se adresează inginerilor de software care doresc să transmită date mari cu Spark Streaming și Scala .
Până la sfârșitul acestui antrenament, participanții vor putea:
- Creați aplicații Spark cu limbajul de programare Scala .
- Utilizați Spark Streaming pentru a procesa fluxuri continue de date.
- Procesați fluxuri de date în timp real cu Spark Streaming.
Formatul cursului
- Prelegeri și discuții interactive.
- O mulțime de exerciții și practică.
- Implementarea practică într-un mediu de laborator live.
Opțiuni de personalizare a cursului
- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
Această formare directă, condusă de instructori (online sau on-site) este destinată cercetătorilor de date care doresc să utilizeze stack-ul SMACK pentru a construi platforme de prelucrare a datelor pentru soluții de date mari.
La sfârșitul cursului, participanții vor putea:
Implementarea unei arhitecturi de pipeline de date pentru prelucrarea datelor mari. Dezvoltarea unei infrastructuri cluster cu Apache Mesos și Docker. Analiza datelor cu Spark și Scala. Gestionarea datelor neconstrucționate cu Apache Cassandra.
Formatul cursului
Lecții și discuții interactive. Multe exerciții și practici. Implementarea pe mâini într-un mediu live-lab.
Opțiuni de personalizare
Pentru a solicita o pregătire personalizată pentru acest curs, vă rugăm să ne contactați pentru a organiza.
Această formare directă, condusă de instructori (online sau on-site) este destinată inginerilor care doresc să implementeze un sistem pentru prelucrarea unor cantități foarte mari de date.
La sfârșitul cursului, participanții vor putea:
Instalare şi configurare Apache Spark. Înțelegeți diferența dintre Apache Spark și Hadoop MapReduce și când să utilizați care. Citiți rapid în și analiza seturi de date foarte mari. Integrați Apache Spark cu alte instrumente de învățare automată.
Formatul cursului
Lecții și discuții interactive. Multe exerciții și practici. Implementarea pe mâini într-un mediu live-lab.
Opțiuni de personalizare
Pentru a solicita o pregătire personalizată pentru acest curs, vă rugăm să ne contactați pentru a organiza.
Această formare directă, condusă de instructori (online sau on-site) este destinată dezvoltatorilor care doresc să efectueze analiza datelor mari folosind Apache Spark în aplicațiile lor.NET.
La sfârșitul cursului, participanții vor putea:
Instalați și configurați Apache Spark. Înțelegeți cum.NET implementează API-urile Spark, astfel încât acestea să poată fi accesate dintr-o aplicație.NET. Dezvoltați aplicații de prelucrare a datelor folosind C# sau F#, capabile să gestioneze seturi de date ale căror dimensiuni sunt măsurate în terabite și pedabite. Dezvoltați caracteristicile de învățare a mașinii pentru o aplicație.NET folosind abilitățile Apache Spark. Executați analiza exploratorie folosind SQL întrebări pe seturile de date mari.
Formatul cursului
Lecții și discuții interactive. Multe exerciții și practici. Implementarea pe mâini într-un mediu live-lab.
Opțiuni de personalizare
Pentru a solicita o pregătire personalizată pentru acest curs, vă rugăm să ne contactați pentru a organiza.
Această formare directă, condusă de instructori (online sau on-site) este destinată administratorilor de sistem care doresc să învețe cum să stabilească, să implementeze și să gestioneze Hadoop clustere în cadrul organizației lor.
La sfârșitul cursului, participanții vor putea:
Instalați și configurați Apache Hadoop. Înțelegeți cele patru componente principale ale ecosistemului Hadoop: HDFS, MapReduce, YARN și Hadoop Common. Utilizați sistemul de fișiere distribuit (HDFS) pentru a măsura un cluster la sute sau mii de noduri. • Instalați HDFS pentru a funcționa ca un motor de stocare pentru descărcările on-premise Spark. Setarea Spark pentru a accesa soluții alternative de stocare, cum ar fi Amazon S3 și NoSQL sisteme de bază de date, cum ar fi Redis, Elasticsearch, Couchbase, Aerospike, etc. Executați sarcini administrative, cum ar fi furnizarea, gestionarea, monitorizarea și securizarea unui cluster Apache Hadoop.
Formatul cursului
Lecții și discuții interactive. Multe exerciții și practici. Implementarea pe mâini într-un mediu live-lab.
Opțiuni de personalizare
Pentru a solicita o pregătire personalizată pentru acest curs, vă rugăm să ne contactați pentru a organiza.
By the end of this training, participants will be able to:
- Set up the necessary development environment to start building NLP pipelines with Spark NLP.
- Understand the features, architecture, and benefits of using Spark NLP.
- Use the pre-trained models available in Spark NLP to implement text processing.
- Learn how to build, train, and scale Spark NLP models for production-grade projects.
- Apply classification, inference, and sentiment analysis on real-world use cases (clinical data, customer behavior insights, etc.).
Se împarte în două pachete:
-
spark.mllib conține API original construit pe partea de sus RDDs.
-
spark.ml furnizează API de nivel superior construit pe partea de sus a DataFrames pentru construirea conductelor ML.
Public
Acest curs este adresat inginerilor și dezvoltatorilor care încearcă să utilizeze o mașină de bibliotecă construită pentru Apache Spark
Last Updated: