Schița de curs

Introducere

    Data Science Rolurile și responsabilitățile de proces ale unui Data Scientist

Pregătirea mediului de dezvoltare

    Biblioteci, cadre, limbi și instrumente Dezvoltare locală Dezvoltare colaborativă bazată pe web

Colectare de date

    Diferite tipuri de date Structurate Baze de date locale Conectori baze de date Formate comune: xlxs, XML, Json, csv, ...
Clicuri nestructurate, cenzori, smartphone-uri
  • API-uri
  • Internet of Things (IoT)
  • Documente, imagini, videoclipuri, sunete
  • Studiu de caz: Colectarea continuă a unor cantități mari de date nestructurate
  • Stocare a datelorBaze de date relaționale Baze de date non-relaționale Hadoop: Sistem de fișiere distribuite (HDFS) Spark: Resilient Distributed Dataset (RDD) Stocare în cloud
  • Pregătirea datelor
  • Ingestie, selecție, curățare și transformare Asigurarea calității datelor - corectitudine, semnificație și securitate Rapoarte de excepție

      Languages utilizat pentru Pregătire, Procesare și Analiză

    Limbajul R Introducere în R Manipularea datelor, calcul și afișare grafică

      Python Introducere în Python

    Manipularea, procesarea, curățarea și analizarea datelor

      Analiza datelor
    Analiză exploratorie Statistici de bază Vizualizări schițe Înțelegerea datelor
  • Cauzalitate
  • Caracteristici și transformări
  • Machine Learning Supravegheat vs nesupravegheat

      Când să folosești ce model
    Natural Language Processing (NLP)
  • Data Visualization
  • Cele mai bune practici Selectarea diagramei potrivite pentru datele potrivite Palete de culori Trecerea la nivelul următor Tablouri de bord Vizualizări interactive
  • Povestirea cu date
  • Rezumat și Concluzie
  • Cerințe

    • O înțelegere generală a conceptelor de baze de date
    • O înțelegere de bază a statisticilor
      35 ore
     

    Mărturii (2)

    Cursuri înrudite

    QGIS for Geographic Information System

      21 ore

    Categorii înrudite