Cursuri de pregatire Big Data Analiză în sănătate
Analiza datelor mari implică procesul de examinare a unor cantități mari de seturi de date variate pentru a descoperi corelații, tipare ascunse și alte informații utile.
Industria sănătății are cantități masive de date medicale și clinice eterogene complexe. Aplicarea analizelor de date mari asupra datelor de sănătate prezintă un potențial imens în obținerea unor perspective pentru îmbunătățirea furnizării asistenței medicale. Cu toate acestea, enormitatea acestor seturi de date prezintă provocări mari în analize și aplicații practice într-un mediu clinic.
În cadrul acestui instruire, instruit în direct (de la distanță), participanții vor învăța cum să efectueze analize de date mari în sănătate, în timp ce parcurg o serie de exerciții practice în laborator live.
Până la sfârșitul acestui antrenament, participanții vor putea:
- Instalați și configurați instrumente de analiză a datelor mari precum Hadoop MapReduce și Spark
- Înțelegeți caracteristicile datelor medicale
- Aplicați tehnici de date mari pentru a trata datele medicale
- Studiați sisteme de date mari și algoritmi în contextul aplicațiilor pentru sănătate
Public
- Dezvoltatori
- Oamenii de știință de date
Formatul cursului
- Partea de prelegere, o discuție parțială, exerciții și practici practice.
Notă
- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
Schița de curs
Introducere în Big Data Analytics în sănătate
Prezentare generală a Big Data Tehnologii de analiză
- Apache Hadoop MapReduce
- Apache Spark
Instalarea și configurarea Apache Hadoop MapReduce
Instalare și configurare Apache Spark
Utilizarea modelării predictive pentru datele de sănătate
Utilizarea Apache Hadoop MapReduce pentru date de sănătate
Efectuarea fenotipării și grupării pe date de sănătate
- Măsuri de evaluare a clasificării
- Metode de ansamblu de clasificare
Folosind Apache Spark pentru datele de sănătate
Lucrul cu ontologia medicală
Utilizarea analizei grafice asupra datelor de sănătate
Reducerea dimensionalității datelor de sănătate
Lucrul cu valorile de similitudine ale pacienților
Depanare
Rezumat și Concluzie
Cerințe
- O înțelegere a conceptelor de învățare automată și de minerit de date
- Experiență avansată de programare (Python, Java, Scala) .
- Cunoștințe în domeniul datelor și al proceselor ETL .
Cursurile publice necesita 5+ participanti
Cursuri de pregatire Big Data Analiză în sănătate - Booking
Cursuri de pregatire Big Data Analiză în sănătate - Enquiry
Big Data Analiză în sănătate - Cerere de consultanta
Cerere de consultanta
Mărturii (1)
Maquina virtual pe care o apreciez foarte mult Profesorul era foarte cunoscut cu privire la subiect, precum și cu privire la alte subiecte, el a fost foarte drăguț și prietenos Am apreciat facilitățile din Dubai.
Safar Alqahtani - Elm Information Security
Curs - Big Data Analytics in Health
Tradus de catre o masina
Upcoming Courses
Cursuri înrudite
Inteligența artificială - cele mai aplicate lucruri - Data Analysis + Inteligență artificială distribuită + NLP
21 oreAceastă cursă este adresată dezvoltatorilor și știincțificilor ai datelor care doresc să înțeleagă și să implementeze inteligența artificială în aplicațiile lor. Se acoperă mai ales analiza datelor, inteligenta artificială distribuită și procesarea limbajului natural.
Introducere în Calculul cu Grafuri
28 oreÎn cadrul acestei formări live cu instructor în Moldova, participanții vor învăța despre ofertele tehnologice și abordările de implementare pentru prelucrarea datelor grafice. Scopul este de a identifica obiecte din lumea reală, caracteristicile și relațiile acestora, apoi de a modela aceste relații și de a le prelucra ca date utilizând o abordare Graph Computing (cunoscută și sub denumirea de Graph Analytics). Vom începe cu o prezentare generală și ne vom concentra pe instrumente specifice pe măsură ce parcurgem o serie de studii de caz, exerciții practice și implementări live.
Până la sfârșitul acestui curs, participanții vor fi capabili să:
- Să înțeleagă modul în care datele grafice sunt păstrate și parcurse.
- Să selecteze cel mai bun cadru pentru o anumită sarcină (de la baze de date grafice la cadre de procesare pe loturi).
- Să implementeze Hadoop, Spark, GraphX și Pregel pentru a efectua calculul grafurilor pe mai multe mașini în paralel.
- Vizualizarea problemelor reale legate de big data în termeni de grafuri, procese și traversări.
Platforma de Date Hortonworks (HDP) pentru Administratori
21 oreAceastă instruire live, condusă de un instructor în Moldova (online sau la fața locului) prezintă Hortonworks Data Platform (HDP) și conduce participanții prin implementarea soluției Spark + Hadoop.
Până la sfârșitul acestui training, participanții vor fi capabili să:
- Să utilizeze Hortonworks pentru a rula fiabil Hadoop la scară largă.
- Unifice capacitățile de securitate, guvernanță și operațiuni ale Hadoop cu fluxurile de lucru analitice agile ale Spark.
- Utilizați Hortonworks pentru a investiga, valida, certifica și sprijini fiecare dintre componentele unui proiect Spark.
- Procesați diferite tipuri de date, inclusiv structurate, nestructurate, în mișcare și în repaus.
Analiză de Date cu Hive/HiveQL
7 oreAcest curs acoperă modul de utilizare a limbajului SQL Hive (AKA: Hive HQL, SQL on Hive , Hive QL) pentru persoanele care extrag date din Hive
Impala pentru Inteligența Biznesului
21 oreCloudera Impala este un motor de interogare SQL de procesare masiv paralelă (MPP) cu sursă deschisă pentru clustere Apache Hadoop.
Impala permite utilizatorilor să emită interogări SQL cu latență redusă pentru datele stocate în Hadoop Distributed File System și Apache Hbase fără a necesita deplasarea sau transformarea datelor.
Audiență
Acest curs se adresează analiștilor și cercetătorilor de date care efectuează analize asupra datelor stocate în Hadoop prin intermediul instrumentelor Business Intelligence sau SQL.
După acest curs, delegații vor fi capabili să
- Să extragă informații semnificative din clusterele Hadoop cu Impala.
- Scrie programe specifice pentru a facilita Business Intelligence în Impala SQL dialect.
- Să rezolve problemele Impala.
O Introducere Practică în Procesarea de Fluxuri
21 oreÎn cadrul acestui curs de instruire live, condus de un instructor în Moldova (la fața locului sau la distanță), participanții vor învăța cum să configureze și să integreze diferite cadre Stream Processing cu sistemele de stocare de date mari existente și cu aplicațiile software și microserviciile aferente.
La sfârșitul acestui curs de formare, participanții vor fi capabili să:
- Instalați și configurați diferite cadre Stream Processing, cum ar fi Spark Streaming și Kafka Streaming.
- Înțelegeți și selectați cel mai potrivit cadru pentru treaba respectivă. .
- Procesați date în mod continuu, simultan și în mod înregistrare cu înregistrare. .
- Integrați Stream Processing soluțiile cu bazele de date existente, depozitele de date, lacurile de date, etc. .
- Integrați cea mai potrivită bibliotecă de procesare a fluxurilor cu aplicații de întreprindere și microservicii.
SMACK Stack pentru Cercetarea Datelor
14 oreAcest curs de instruire live, condus de un instructor în Moldova (online sau la fața locului) se adresează oamenilor de știință care doresc să utilizeze stiva SMACK pentru a construi platforme de procesare a datelor pentru soluții de date mari.
La sfârșitul acestui curs de formare, participanții vor fi capabili să:
- Implementați o arhitectură de conducte de date pentru procesarea datelor mari.
- Dezvoltați o infrastructură de cluster cu Apache Mesos și Docker. .
- Analizați datele cu Spark și Scala. .
- Gestionați datele nestructurate cu Apache Cassandra. .
Fundamentele Apache Spark
21 oreAcest curs de instruire live, condus de un instructor în Moldova (online sau la fața locului) se adresează inginerilor care doresc să configureze și să implementeze un sistem Apache Spark pentru procesarea unor cantități foarte mari de date.
La sfârșitul acestui curs de formare, participanții vor fi capabili să:
- Instalați și configurați Apache Spark.
- Procesați și analizați rapid seturi de date foarte mari. .
- Înțelegeți diferența dintre Apache Spark și Hadoop MapReduce și când să folosiți fiecare. .
- Integrați Apache Spark cu alte instrumente de învățare automată. .
Apache Spark în Cloud
21 oreCurba de învățare a lui Apache Spark crește încet la început, are nevoie de mult efort pentru a obține primul randament. Acest curs își propune să sară prin prima parte grea. După ce au luat acest curs, participanții vor înțelege elementele de bază ale lui Apache Spark , vor diferenția clar RDD de DataFrame, vor învăța API-ul Python și Scala , vor înțelege executorii și sarcinile etc. De asemenea, urmând cele mai bune practici, acest curs se concentrează puternic pe implementare cloud, baze de date și AWS. De asemenea, studenții vor înțelege diferențele dintre AWS EMR și AWS Glue, unul dintre ultimele servicii Spark ale AWS.
PUBLIC:
Inginer de date, DevOps , Data Scientist
Spark pentru Developeri
21 oreOBIECTIV:
Acest curs va prezenta Apache Spark . Studenții vor afla cum Spark se încadrează în ecosistemul Big Data și cum să folosească Spark pentru analiza datelor. Cursul acoperă shell-ul Spark pentru analiza interactivă a datelor, Spark intern, API-uri Spark, Spark SQL , Spark streaming, și învățare automată și graficX.
AUDIENCE:
Dezvoltatori / analisti de date
Python și Spark pentru Date Mari (PySpark)
21 oreÎn cadrul acestui curs de formare live, condus de un instructor în Moldova, participanții vor învăța cum să utilizeze Python și Spark împreună pentru a analiza date mari, pe măsură ce lucrează la exerciții practice.
Până la sfârșitul acestui training, participanții vor fi capabili să:
- Să învețe cum să utilizeze Spark cu Python pentru a analiza Big Data.
- Să lucreze la exerciții care imită cazuri din lumea reală.
- Să utilizeze diferite instrumente și tehnici pentru analiza datelor mari utilizând PySpark.
Apache Spark SQL
7 ore Spark SQL este modulul Apache Spark pentru lucrul cu date structurate și nestructurate. Spark SQL oferă informații despre structura datelor, precum și despre calculul efectuat. Aceste informații pot fi utilizate pentru a realiza optimizări. Două utilizări comune pentru Spark SQL sunt:
- pentru a executa interogări SQL .
- pentru a citi datele dintr-o instalație Hive existentă.
În cadrul acestui training, instruit în direct (la fața locului sau la distanță), participanții vor învăța cum să analizeze diverse tipuri de seturi de date folosind Spark SQL .
Până la sfârșitul acestui antrenament, participanții vor putea:
- Instalați și configurați Spark SQL .
- Efectuați analiza datelor utilizând Spark SQL .
- Seturi de date de interogare în diferite formate.
- Vizualizați datele și rezultatele interogării.
Formatul cursului
- Prelegeri și discuții interactive.
- O mulțime de exerciții și practică.
- Implementarea practică într-un mediu de laborator live.
Opțiuni de personalizare a cursului
- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
Apache Spark MLlib
35 oreMLlib este biblioteca Spark de învățare automată (ML). Scopul său este de a face învățarea practică a mașinilor scalabilă și ușoară. Se compune din algoritmi și utilități comune de învățare, inclusiv clasificarea, regresia, gruparea, filtrarea colaborativă, reducerea dimensiunilor, precum și primitivele de optimizare la nivel inferior și API-urile de conducte de nivel superior.
Se împarte în două pachete:
spark.mllib conține API original construit pe partea de sus RDDs.
spark.ml furnizează API de nivel superior construit pe partea de sus a DataFrames pentru construirea conductelor ML.
Public
Acest curs este adresat inginerilor și dezvoltatorilor care încearcă să utilizeze o mașină de bibliotecă construită pentru Apache Spark
Stratio: Modulele Rocket și Intelligence cu PySpark
14 oreStratio este o platformă centrată pe date care integrează big data, inteligența artificială și guvernanța într-o singură soluție. Modulele Rocket și Intelligence permit explorarea rapidă a datelor, transformarea și analize avansate în mediul enterprise.
Această formare condușă de instrucțoare (online sau pe locație) este destinată profesionalilor intermediari care doresc să utilizeze eficient modulele Rocket și Intelligence din Stratio cu PySpark, concentrându-se pe structuri de buclă, funcții definite de utilizator și logică de date avansată.
La finalul acestei forme de instruire, participanții vor putea:
- Navigați și lucrați în platforma Stratio folosind modulele Rocket și Intelligence.
- Aplicați PySpark în contextul ingestionării, transformării și analizei datelor.
- Utilizați bucle și logica condițională pentru a controla fluxurile de date și sarcinile de inginerie a caracteristicilor.
- Creați și gestionați funcții definite de utilizator (UDFs) pentru operațiuni reutilizabile cu date în PySpark.
Format al cursului
- Lectură interactivă și discuție.
- Multe exerciții și practică.
- Implementare directă într-un mediu de laborator live.
Opțiuni de personalizare a cursului
- Pentru a solicita o formare personalizată pentru acest curs, vă rugăm să ne contactați pentru a organiza.