(intended topics - a given topis is designed to take two to four practicals)
- Descriptive statistics. Averages and variability. Measures of association. Graphical data representation.
- Introduction to probability. Random variable. Selected probabilistic distributions.
- Confidence intervals. Introduction to inferential statistics. Parametric and nonparametric tests of inference. Interpretation of results and appropriate graphical visualization.
- Analysis of variance (ANOVA). Univariate and multivariate linear regression. Interpretation of results and appropriate graphical visualization.
- Logistic binary regression. Multinomial logistic regression. Interpretation of results and appropriate graphical visualization.
- Mixed-effects model. Hierarchical models. Interpretation of results and appropriate graphical visualization.
- Introduction to time series. Introduction to survival analysis. Interpretation of results and appropriate graphical visualization.
- Selected advanced statistical methods in R, both linear and nonlinear. Cluster analysis. Discriminant analysis. Jackknife. Bootstrap. Interpretation of results and appropriate graphical visualization.
- Selected methods of machine learning in R. Naïve Bayes classifier. Support Vector Machine (SVM). Cross-Validation (CV). Principal Component Analysis (PCA). Decision trees. Random forests. Neural networks. Association rules. Interpretation of results and appropriate graphical visualization.
Statistika je doposud nejefektivnějším nástrojem, jak data a hypotézy v oblasti biomedicíny nejen zpracovávat, ale také interpretovat, čímž v medicíně významně pomáhá garantovat kvalitu vědeckého důkazu. Schopnost základních a aplikovaných konceptů biostatistiky a jejich využití při interpretaci statistických výsledků v odborných sděleních patří do penza vzdělání moderního lékaře. Obzvlášť v době, která produkuje obrovské množství publikačních výstupů obsahujících vysoce odborné a komplexní informace, které je nutné interpretovat pomocí řeči statistiky.
Doba covidu-19 a (ne)vědomé šíření chybných či zavádějících informací otestovala míru statistického a epidemiologického vzdělání lékařů i studentů medicíny a vytvořila prostor pro posílení zájmové výuky biostatistiky, například formou volitelného předmětu.
Předmět je doporučen všem pregraduálním studentům s ambicemi věnovat se v části nebo v celé své budoucí profesionální kariéře vědecké práci. Očekávanou audiencí jsou tedy (nejen) adepti budoucího doktorandského studia, eventuálně zájemci z řad postgraduálních studentů. Předmět je koncipován jako úvod pro začátečníky, předchozí znalosti statistiky ani statistického softwaru nejsou vyžadovány. Matematický aparát je omezen na nutné minimum a vychází pouze ze středoškolských znalostí matematiky. Student bude uveden do popisné statistiky, běžně používaných popisných ukazatelů a měr asociací, používaných v publikacích, dále do grafické vizualizace dat a vhodných grafických výstupů pro konkrétní datové vstupy. Velkou oblastí, která bude teoreticky vyučována a zejména prakticky cvičena, je testování hypotéz, včetně znalosti předpokladů hypotéz, parametrických i neparametrických (robustních) přístupů a schopnosti správně vybrat vhodný typ testování dle vstupních dat a hypotéz. Dále budou procvičeny lineární a nelineární regresní techniky umožňující modelovat spojitou proměnnou pomocí vysvětlujících proměnných, stejně tak i logistická regrese umožňující klasifikovat do kategorií pomocí prediktorů. Rovněž budou uvedeny komplexnější modely včetně hierarchických a analýzy přežívání. Praktická část, na kterou bude kladen adekvátní důraz, bude probíhat ve statistickém softwaru aplikovaném na reálná data – v open-source klikacím nástroji Jamovi, eventuálně i v dalších; v případě zájmu i v jazyce a prostředí R. Předmět je zakončen seminární prací, kde student prokáže schopnost data správně analyzovat a výsledky správně interpretovat. Kromě samotné práce s daty a statistickými koncepty a modely budou také diskutovány vhodné intepretace získaných statistických závěrů. Během předmětu i v rámci závěrečné seminární práce (projektu) si student současně osvojí přístup k reprodukovatelnému a transparentnímu vedení projektu a analýze dat. Obdobný předmět je v různých podobách nabízen, eventuálně již etablován i na ostatních pražských fakultách včetně lékařských. Na naší fakultě je předmět již vyučován v české jazykové mutaci.