Schița de curs

I. Introducere și preliminarii

1. Prezentare generală

  • Facilitarea utilizării lui R, R și interfețele grafice disponibile
  • Rstudio
  • Software și documentație conexe
  • R și statistica
  • Utilizarea interactivă a lui R
  • O sesiune introductivă
  • Obținerea de ajutor pentru funcții și caracteristici
  • Comenzi R, sensibilitate la majuscule etc.
  • Reamintire și corectare a comenzilor anterioare
  • Executarea comenzilor din sau redirecționarea ieșirii către un fișier
  • Permanența datelor și eliminarea obiectelor
  • Practici bune de programare: Scripturi autonome, lizibilitate bună, de ex. scripturi structurate, documentație, markdown
  • Instalarea pachetelor; CRAN și Bioconductor

2. Citirea datelor

  • Fișiere txt (read.delim)
  • Fișiere CSV

3. Manipulări simple; numere și vectori + tablouri

  • Vectori și atribuire
  • Aritmetica vectorilor
  • Generarea de secvențe regulate
  • Vectori logici
  • Valori lipsă
  • Vectori de caractere
  • Vectori de index; selectarea și modificarea subgrupurilor de date
    • Tablouri
  • Indexarea tablourilor. Subsecțiuni ale unui tablou
  • Matrice de index
  • Funcția array() + operații simple pe tablouri, de ex. înmulțire, transpunere
  • Alte tipuri de obiecte

4. Liste și cadre de date

  • Liste
  • Construirea și modificarea listelor
    • Concatenarea listelor
  • Cadre de date
    • Crearea cadrelor de date
    • Lucrul cu cadre de date
    • Atasarea listelor arbitrare
    • Gestionarea căii de căutare

5. Manipularea datelor

  • Selectarea, subsetarea observațiilor și variabilelor
  • Filtrarea, gruparea
  • Recodificare, transformări
  • Agregare, combinarea seturilor de date
  • Formarea matricelor partitionate, cbind() și rbind()
  • Funcția de concatenare, (), cu tablouri
  • Manipularea caracterelor, pachetul stringr
  • Introducere scurtă în grep și regexpr

6. Mai multe despre citirea datelor

  • Fișiere XLS, XLSX
  • Pachetele readr și readxl
  • Date în formate SPSS, SAS, Stata,… și alte formate
  • Exportul datelor în formate txt, csv și alte formate

6. Gruparea, bucle și execuție condiționată

  • Expresii grupate
  • Instrucțiuni de control
  • Execuție condiționată: instrucțiuni if
  • Execuție repetitivă: bucle for, repeat și while
  • Introducere în apply, lapply, sapply, tapply

7. Funcții

  • Crearea funcțiilor
  • Argumente opționale și valori implicite
  • Număr variabil de argumente
  • Domeniul de aplicare și consecințele sale

8. Grafică simplă în R

  • Crearea unui grafic
  • Grafice de densitate
  • Grafice cu puncte
  • Grafice cu bare
  • Grafice liniare
  • Grafice circulare
  • Boxploturi
  • Grafice de dispersie
  • Combinarea graficelor

II. Analiza statistică în R

1. Distribuții de probabilitate

  • R ca un set de tabele statistice
  • Examinarea distribuției unui set de date

2. Testarea ipotezelor

  • Teste despre media unei populații
  • Testul raportului de verosimilitate
  • Teste pe un eșantion și pe două eșantioane
  • Testul Chi-Square de bunătate a potrivirii
  • Statistica Kolmogorov-Smirnov pentru un eșantion
  • Testul Wilcoxon Signed-Rank
  • Testul pe două eșantioane
  • Testul Wilcoxon Rank Sum
  • Testul Mann-Whitney
  • Testul Kolmogorov-Smirnov

3. Testarea multiplă a ipotezelor

  • Eroare de tip I și FDR
  • Curbe ROC și AUC
  • Proceduri de testare multiplă (BH, Bonferroni etc.)

4. Modele de regresie liniară

  • Funcții generice pentru extragerea informațiilor din modele
  • Actualizarea modelelor ajustate
  • Modele liniare generalizate
    • Familii
    • Funcția glm()
  • Clasificare
    • Regresia logistică
    • Analiza discriminantă liniară
  • Învățare nesupervizată
    • Analiza componentelor principale
    • Metode de clustering (k-means, clustering ierarhic, k-medoids)

5. Analiza supraviețuirii (pachetul survival)

  • Obiecte de supraviețuire în R
  • Estimarea Kaplan-Meier, testul log-rank, regresia parametrică
  • Benzi de încredere
  • Analiza datelor cenzurate (cenzurate pe intervale)
  • Modele Cox PH, covariante constante
  • Modele Cox PH, covariante dependente de timp
  • Simulare: Compararea modelelor (Compararea modelelor de regresie)

6. Analiza varianței

  • ANOVA unidirecțională
  • Clasificare bidirecțională a ANOVA
  • MANOVA

III. Probleme rezolvate în bioinformatică

  • Scurtă introducere în pachetul limma
  • Flux de lucru pentru analiza datelor de microarray
  • Descărcarea datelor de pe GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Prelucrarea datelor (QC, normalizare, expresie diferențială)
  • Graficul Vulcan
  • Exemple de clustering + heatmaps
 28 Ore

Numărul de participanți


Pret per participant

Mărturii (5)

Cursuri viitoare

Categorii înrudite