Schița de curs
I. Introducere și preliminarii
1. Prezentare generală
- R mai prietenos, R și interfețele grafice disponibile
- Rstudio
- Software și documentație conexe
- R și statisticile
- Utilizarea interactivă a R
- O sesiune introductivă
- Obținerea de ajutor cu funcții și caracteristici
- Comenzile R, sensibilitatea la majuscule, etc.
- Reamintirea și corectarea comenzilor anterioare
- Executarea comenzilor dintr-un fișier sau redirecționarea rezultatelor către un fișier
- Permanența datelor și eliminarea obiectelor
- Good practică de programare: scripturi autoconținute, bună lizibilitate, de exemplu scripturi structurate, documentație, markdown
- instalarea pachetelor; CRAN și Bioconductor
2. Citirea datelor
- Fișiere Txt (read.delim)
- Fișiere CSV
3. Manipulări simple; numere și vectori + matrici
- Vectori și atribuire
- Aritmetica vectorială
- Generarea secvențelor regulate
- Vectori logici
- Valori lipsă
- Vectori de caractere
- Vectori index; selectarea și modificarea subansamblurilor unui set de date
- Array-uri
- Indexarea matricei. Subsecțiuni ale unui array
- Matrici de indexare
- Funcția array() + operații simple asupra array-urilor, de exemplu înmulțire, transpunere
- Alte tipuri de obiecte
4. Liste și cadre de date
- Liste
- Construirea și modificarea listelor
- Concatenarea listelor
- Cadre de date
- Crearea cadrelor de date
- Lucrul cu cadre de date
- Atașarea de liste arbitrare
- Gestionarea căii de căutare
5. Manipularea datelor
- Selectarea, subgrupul de observații și variabile
- Filtrare, grupare
- Recodare, transformări
- Agregarea, combinarea seturilor de date
- Formarea matricelor partiționate, cbind() și rbind()
- Funcția de concatenare, (), cu matrici
- Manipularea caracterelor, pachetul stringr
- scurtă introducere în grep și regexpr
6. Mai multe despre citirea datelor
- Fișiere XLS, XLSX
- pachetele readr și readxl
- Date SPSS, SAS, Stata,... și alte formate
- Exportul datelor în format txt, csv și alte formate
6. Gruparea, buclele și execuția condiționată
- Expresii grupate
- Instrucțiuni de control
- Execuție condiționată: instrucțiuni if
- Execuție repetitivă: bucle for, repeat și while
- Introducere în apply, lapply, sapply, tapply
7. Funcții
- Crearea funcțiilor
- Argumente opționale și valori implicite
- Numărul variabil de argumente
- Domeniul de aplicare și consecințele acestuia
8. Grafice simple în R
- Crearea unui grafic
- Diagrame de densitate
- Diagrame cu puncte
- Diagrame cu bare
- Diagrame de linii
- Diagrame plăcintă
- Diagrame boxplot
- Diagrame Scatter
- Combinarea diagramelor
II. Analiza statistică în R
1. Distribuții de probabilitate
- R ca set de tabele statistice
- Examinarea distribuției unui set de date
2. Testarea ipotezelor
- Teste privind media unei populații
- Testul raportului de verosimilitate
- Teste cu unul și două eșantioane
- Testul Goodness-of-Fit Chi-Square
- Statistica Kolmogorov-Smirnov pentru o singură probă
- Testul Wilcoxon Signed-Rank
- Test cu două eșantioane
- Testul Wilcoxon Rank Sum
- Testul Mann-Whitney
- Testul Kolmogorov-Smirnov
3. Testarea multiplă a ipotezelor
- Eroarea de tip I și FDR
- Curbe ROC și AUC
- Proceduri de testare multiplă (BH, Bonferroni etc.)
4. Modele de regresie liniară
- Funcții generice pentru extragerea informațiilor despre model
- Actualizarea modelelor ajustate
- Modele liniare generalizate
- Familii
- Funcția glm()
- Clasificare
- Regresia logistică
- Analiza discriminantă liniară
- Învățare nesupravegheată
- Analiza componentelor principale
- Metode de clusterizare (k-means, clusterizare ierarhică, k-medoids)
5. Analiza supraviețuirii (pachetul survival)
- Obiecte de supraviețuire în r
- Estimarea Kaplan-Meier, testul log-rank, regresia parametrică
- Benzile de încredere
- Analiza datelor cenzurate (cenzurate prin intervale)
- Modele Cox PH, covariate constante
- Modele Cox PH, covariate dependente de timp
- Simulare: Compararea modelelor (compararea modelelor de regresie)
6. Analiza varianței
- ANOVA într-o singură direcție
- Clasificarea ANOVA pe două căi
- MANOVA
III. Probleme de lucru în bioinformatică
- Scurtă introducere în pachetul limma
- Flux de lucru pentru analiza datelor microarray
- Descărcarea datelor din GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
- Prelucrarea datelor (QC, normalizare, expresie diferențială)
- Grafic vulcanic
- Exemple Custering + heatmaps
Mărturii (5)
cum antrenează instructorul cunoștințele sale în domeniul pe care îl învață
john ernesto ii fernandez - Philippine AXA Life Insurance Corporation
Curs - Data Vault: Building a Scalable Data Warehouse
Tradus de catre o masina
Discuție deschisă cu formatorul
Tomek Danowski - GE Medical Systems Polska Sp. Z O.O.
Curs - Process Mining
Tradus de catre o masina
Foarte util deoarece mă ajută să înțeleg ce putem face cu datele în contextul nostru. De asemenea, va fi de ajutor pentru mine
Nicolas NEMORIN - Adecco Groupe France
Curs - KNIME Analytics Platform for BI
Tradus de catre o masina
M-am bucurat cu adevărat de exercițiile cu trimiterea mânii.
Yunfa Zhu - Environmental and Climate Change Canada
Curs - Foundation R
Tradus de catre o masina
Timpul era perfect și atmosfera relaxantă a făcut ca candidați să se simtă la echipaj pentru a pune întrebări. (Note: There seems to be a slight error in the original sentence where "at ease" might have been intended as "at ease," which translates to "la echipaj" in Romanian. However, a more natural translation would use "într-o poziție confortabilă" or simply adjust for better flow: "candidații să se simtă la fel de confortabili pentru a pune întrebări.") For a more natural and accurate translation: Timpul era perfect și atmosfera relaxantă a făcut ca candidați să se simtă într-o poziție confortabilă pentru a pune întrebări.
Rhian Hughes - Public Health Wales NHS Trust
Curs - Introduction to Data Visualization with Tidyverse and R
Tradus de catre o masina