Intrati in legatura

Schița de curs

I. Introducere și preliminarii

1. Prezentare generală

  • Facilitarea utilizării R, R și interfețele grafice disponibile
  • Rstudio
  • Software și documentație asociate
  • R și statistică
  • Utilizarea interactivă a R
  • Sesiune introductivă
  • Obținerea de ajutor pentru funcții și caracteristici
  • Comenzi R, sensibilitatea la majuscule etc.
  • Reamintirea și corectarea comenzilor anterioare
  • Executarea comenzilor din sau redirecționarea ieșirii către un fișier
  • Permanența datelor și eliminarea obiectelor
  • Bune practici de programare: Scripturi autonome, lizibilitate bună, de ex. scripturi structurate, documentare, markdown
  • Instalarea pachetelor; CRAN și Bioconductor

2. Citirea datelor

  • Fișiere Txt (read.delim)
  • Fișiere CSV

3. Manipulări simple; numere și vectori + tablouri

  • Vectori și atribuire
  • Aritmetica vectorilor
  • Generarea de secvențe regulate
  • Vectori logici
  • Valori lipsă
  • Vectori de caractere
  • Vectori de index; selectarea și modificarea subseturilor unui set de date
    • Tablouri
  • Indexarea tablourilor. Subsecțiuni ale unui tablou
  • Matrici de index
  • Funcția array() + operații simple pe tablouri, de ex. înmulțire, transpunere
  • Alte tipuri de obiecte

4. Liste și cadre de date

  • Liste
  • Construirea și modificarea listelor
    • Concatenarea listelor
  • Cadre de date
    • Crearea cadrelor de date
    • Lucrul cu cadre de date
    • Atasarea listelor arbitrare
    • Gestionarea căii de căutare

5. Manipularea datelor

  • Selectarea, subsetarea observațiilor și variabilelor
  • Filtrarea, gruparea
  • Recodificarea, transformări
  • Agregare, combinarea seturilor de date
  • Formarea matricilor partitionate, cbind() și rbind()
  • Funcția de concatenare, (), cu tablouri
  • Manipularea caracterelor, pachetul stringr
  • Introducere scurtă în grep și regexpr

6. Mai multe despre citirea datelor

  • Fișiere XLS, XLSX
  • Pachetele readr și readxl
  • Date în formate SPSS, SAS, Stata,… și altele
  • Exportul datelor în formate txt, csv și altele

6. Gruparea, bucle și execuție condiționată

  • Expresii grupate
  • Instrucțiuni de control
  • Execuție condiționată: instrucțiuni if
  • Execuție repetitivă: bucle for, repeat și while
  • Introducere în apply, lapply, sapply, tapply

7. Funcții

  • Crearea funcțiilor
  • Argumente opționale și valori implicite
  • Număr variabil de argumente
  • Domeniul de aplicare și consecințele sale

8. Grafică simplă în R

  • Crearea unui grafic
  • Grafice de densitate
  • Grafice punctuale
  • Grafice cu bare
  • Grafice liniare
  • Grafice circulare
  • Boxploturi
  • Grafice de dispersie
  • Combinarea graficelor

II. Analiza statistică în R

1. Distribuții de probabilitate

  • R ca un set de tabele statistice
  • Examinarea distribuției unui set de date

2. Testarea ipotezelor

  • Teste despre o medie a populației
  • Testul raportului de verosimilitate
  • Teste pe un eșantion și pe două eșantioane
  • Testul Chi-Square de bunătate a potrivirii
  • Statistica Kolmogorov-Smirnov pe un eșantion
  • Testul Wilcoxon Signed-Rank
  • Test pe două eșantioane
  • Testul Wilcoxon Rank Sum
  • Testul Mann-Whitney
  • Testul Kolmogorov-Smirnov

3. Testarea multiplă a ipotezelor

  • Eroare de tip I și FDR
  • Curbe ROC și AUC
  • Proceduri de testare multiplă (BH, Bonferroni etc.)

4. Modele de regresie liniară

  • Funcții generice pentru extragerea informațiilor din modele
  • Actualizarea modelelor ajustate
  • Modele liniare generalizate
    • Familii
    • Funcția glm()
  • Clasificare
    • Regresie logistică
    • Analiza discriminantă liniară
  • Învățare nesupervizată
    • Analiza componentelor principale
    • Metode de clustering (k-means, clustering ierarhic, k-medoids)

5. Analiza supraviețuirii (pachetul survival)

  • Obiecte de supraviețuire în R
  • Estimarea Kaplan-Meier, testul log-rank, regresie parametrică
  • Benzi de încredere
  • Analiza datelor cenzurate (cenzurate pe interval)
  • Modele Cox PH, covariate constante
  • Modele Cox PH, covariate dependente de timp
  • Simulare: Compararea modelelor (Compararea modelelor de regresie)

6. Analiza varianței

  • ANOVA unidirecțională
  • Clasificare bidirecțională a ANOVA
  • MANOVA

III. Probleme rezolvate în bioinformatică

  • Introducere scurtă în pachetul limma
  • Flux de lucru pentru analiza datelor de microarray
  • Descărcarea datelor din GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Prelucrarea datelor (QC, normalizare, expresie diferențială)
  • Grafic Volcano
  • Exemple de clustering + heatmaps
 28 Ore

Numărul de participanți


Pret per participant

Mărturii (2)

Cursuri viitoare

Categorii înrudite