Charles Explorer logo
🇬🇧

Seminar in data analysis

Class at Faculty of Science |
MB120S20

This text is not available in the current language. Showing version "cs".Annotation

Předmět je určen pro studenty magisterského a doktorského studia.

Seminář se koná každou středu v 10,00 ráno v pracovně Tomáše Herbena (Benátská 2, 2. patro)

Kurs chceme zaměřit především na složitější jednorozměrné techniky, které nejsou součástí základního statistického kursu (Biostatistika a plánování ekologických pokusů, Janovský et al., MB120P163). Probírané techniky samozřejmě budou záležet hodně na typech dat, které si účastníci přinesou, ale představujeme si zejména tyto skupiny analýz:

• data s hierarchicky strukturovanými úrovněmi variability, které je třeba analyzovat různými typy smíšených modelů;

• data s korelovanými chybami (prostorová nebo fylogenetická data), které je třeba analyzovat pomocí generalized least squares (GLS);

• data, kde závislé proměnné nelze modelovat pomocí normálního rozdělení a je třeba použít zobecněné lineární modely (GLM), nebo zobecněné aditivní modely (GAM);

• obecné (nelinearizovatelné) regresní závislosti.

V kursu se nechceme věnovat analýze sekvenačních dat a konstrukci fylogenetických stromů (zde odkazujeme na specializované bioinformatické kursy), pokud možno se nechceme věnovat ani datům s mnohorozměrnými závislými proměnnými (které obvykle slouží spíš k vytváření hypotéz než k jejich testování; zde odkazujeme na kurs

Biostatistika 2).

Kurs bude probíhat seminární formou. Na začátku běhu budou jednotliví účastníci prezentovat, jakou otázku si kladli, cíl, s jakým sbírali data, a popíšou strukturu dat, jež chtějí v kursu analyzovat. Na základě toho rozdělíme data (a jejich majitele) do skupin s podobnou strukturou dat. V následující části kursu budeme postupně procházet jednotlivé typy datových struktur a praktikovým způsobem zkoumat možnosti jejich analýzy, společně je analyzovat a interpretovat získané výsledky.

Podmínkou účasti v kursu jsou nasbíraná a uspořádaná data pro analýzu a dobrá otázka, kterou je možno těmito daty zodpovědět. Kurs bude probíhat v prostředí jazyka R, čili také předpokládáme alespoň základní znalost tohoto jazyka a prostředí.