Schița de curs
Introducere în platforma Stratio
- Prezentare de la arhitectură și modulul principal al Stratio
- Rolul lui Rocket și Intelligence în ciclul vieții datelor
- Conectarea și navigarea în interfața de utilizator a Stratio
Lucrul cu modulul Rocket
- Ingrijirea datelor și crearea pipeline-urilor
- Conectarea surselor de date și configurarea transformărilor
- Utilizarea lui PySpark pentru sarcinile de preprocesare în Rocket
Elementele esențiale ale utilizatorilor Stratio cu PySpark
- Structuri și operațiuni de date în PySpark
- Constructe repetitive: folosirea for, while, if/else
- Scrierea funcțiilor personalizate cu def și aplicarea acestora
Utilizare avansată a lui Rocket cu PySpark
- Ingrijirea în timp real și transformările
- Folosirea buclelor și funcțiilor în scenarii de loturi și timp real
- Cele mai bune practici pentru performanță în pipeline-urile PySpark
Explorarea modulului Intelligence
- Prezentare de la funcțiile de modelare și analiză a datelor
- Selectarea, transformarea și explorarea caracteristicilor
- Rolul lui PySpark în analiza personalizată și obținerea de perspective
Crearea de fluxuri avansați de analize
- Crearea funcțiilor definite de utilizator (UDFs) în Intelligence
- Aplicarea condițională și buclelor pentru logica datelor
- Cazuri de utilizare: segmentare, agregare și previziuni
Implementarea și Collaboration
- Salvarea, exportarea și reutilizarea fluxurilor de lucru
- Colaborarea cu membrii echipei în Stratio
- Revizuirea iesirii și integrarea cu instrumentele din fluxul continuu
Rezumat și următoarele pași
Cerințe
- Experiență cu programarea Python
- Înțelegere a conceptelor de analiză a datelor sau procesare Big Data
- Cunoașteri de bază despre Apache Spark și calcul distribuit
Publiculțintă
- Inginerii de date care lucrează pe platformele bazate pe Stratio
- Analiști sau dezvoltatori care folosesc modulele Rocket și Intelligence
- Echipe tehnice care se mută către fluxuri de lucru PySpark în cadrul Stratio
Mărturii (5)
Exemplele practice ne au permis să obținem o senzație reală de cum funcționează programul. Explicațiile detaliate și integrarea conceptelor teoretice și modul în care sunt legate de aplicațiile practice.
Ian - Archeoworks Inc.
Curs - ArcGIS Fundamentals
Tradus de catre o masina
Toate temele pe care le-a abordat, inclusiv exemplele. De asemenea, le-a explicat cum sunt utile în munca noastră zilnică.
madduri madduri - Boskalis Singapore Pte Ltd
Curs - QGIS for Geographic Information System
Tradus de catre o masina
Mi-a plăcut stilul lui Pablo, faptul că a abordat o mulțime de subiecte, de la proiectarea rapoartelor, personalizarea cu html până la implementarea unor algoritmi ML simpli. Good bilanț informații teoretice / exerciții. Pablo a acoperit cu adevărat toate subiectele care m-au interesat și a dat răspunsuri complete la întrebările mele.
Cristian Tudose - SC Automobile Dacia SA
Curs - Advanced Data Analysis with TIBCO Spotfire
Tradus de catre o masina
Aplicarea practică a lui Spotfire și toate funcțiile de bază.
Michael Capili - STMicroelectronics, Inc.
Curs - Introduction to Spotfire
Tradus de catre o masina
Cel mai mult mi-a plăcut despre antrenament organizarea și locația
Hamid Tuama - Ability with Innovation General Contracting (DMCC Branch)
Curs - ArcGIS for Spatial Analysis
Tradus de catre o masina