Schița de curs

Ziua Unu: Fundamentele Limbajului

  • Introducere în curs
  • Despre știința datelor
    • Definiția științei datelor
    • Procesul realizării științei datelor.
  • Introducere în limbajul R
  • Variabile și tipuri de date
  • Structuri de control (bucles / condiționale)
  • Scalars, vectori și matrice R
    • Definirea vectorilor R
    • Matrici
  • Manipularea șirurilor și a textului
    • Tipul de date character
    • Operări I/O pe fișiere
  • Liste
  • Funcții
    • Introducere în funcții
    • Closures
    • Funcțiile lapply/sapply
  • DataFrames
  • Laboratoare pentru toate secțiunile

Ziua Două: Programare R Intermediar

  • DataFrames și operațiuni I/O
  • Citirea datelor din fișiere
  • Pregătirea datelor
  • Seturi de date integrate
  • Vizualizare
    • Pachetul Graphics
    • plot() / barplot() / hist() / boxplot() / scatter plot
    • Heat Map
    • Pachetul ggplot2 (qplot(), ggplot())
  • Explorație cu dplyr
  • Laboratoare pentru toate secțiunile

Ziua Trei: Programare Avansată cu R

  • Modelare statistică cu R
    • Funcții statistice
    • Gestionarea valorilor NA
    • Distribuții (Binomial, Poisson, Normal)
  • Regresie
    • Introducere în regresia liniară
  • Recomandări
  • Prelucrarea textului (pachetul tm / Wordclouds)
  • Clustering
    • Introducere în clustering
    • KMeans
  • Clasificare
    • Introducere în clasificare
    • Naive Bayes
    • Decision Trees
    • Antrenament folosind pachetul caret
    • Evaluarea algoritmilor
  • R și Big Data
    • Conectarea la baze de date cu R
    • Ecosistemul Big Data
  • Laboratoare pentru toate secțiunile

Cerințe

  • Se preferă o cunoaștere de bază a programării

Configurare

  • Un laptop modern
  • Ultima versiune a R Studio și a mediului R instalate

 21 ore

Numărul de participanți


Pret per participant

Mărturii (7)

Cursuri viitoare

Categorii înrudite