- matematická pravděpodobnost, definice a její počítání, Bayesův vztah
- náhodná veličina (diskrétní i spojité) a její pravděpodobnostní rozdělení
- distribuční a kvantilová funkce, hustota
- statistická nezávislost
- střední hodnota a rozptyl
- vlastnosti binomického a normálního rozdělení
- náhodný výběr
- parametry rozdělení, odhadování parametrů, t-test
- statistické testování hypotéz, kritické hodnoty
- kontingenční tabulky a testy v kontingenčních tabulkách
- chi-kvadrát rozdělení a testy na něm založené
- entropie, podmíněná entropie, vzájemná informace
- základy programování v systému R (www.r-project.org)
Předmět je určen POUZE pro studenty v Programu EM LCT, viz http://ufal.mff.cuni.cz/lct.html. Cílem semináře je představit základní pravděpodobnostní a statistické principy, postupy a metody, které se prakticky využívají při řešení úloh komputační lingvistiky (zpracování přirozeného jazyka).
Podstatnou částí kurzu je aktivní práce s daty a seznámení s postupy pro vypracování úloh v R. Po dohodě může část semináře proběhnout čtením a studiem vybraných materiálů.