Charles Explorer logo
🇨🇿

Praktické základy pravděpodobnosti a statistiky pro komputační lingvistiku

Předmět na Matematicko-fyzikální fakulta |
NPFL081

Sylabus

- matematická pravděpodobnost, definice a její počítání, Bayesův vztah

- náhodná veličina (diskrétní i spojité) a její pravděpodobnostní rozdělení

- distribuční a kvantilová funkce, hustota

- statistická nezávislost

- střední hodnota a rozptyl

- vlastnosti binomického a normálního rozdělení

- náhodný výběr

- parametry rozdělení, odhadování parametrů, t-test

- statistické testování hypotéz, kritické hodnoty

- kontingenční tabulky a testy v kontingenčních tabulkách

- chi-kvadrát rozdělení a testy na něm založené

- entropie, podmíněná entropie, vzájemná informace

- základy programování v systému R (www.r-project.org)

Anotace

Předmět je určen POUZE pro studenty v Programu EM LCT, viz http://ufal.mff.cuni.cz/lct.html. Cílem semináře je představit základní pravděpodobnostní a statistické principy, postupy a metody, které se prakticky využívají při řešení úloh komputační lingvistiky (zpracování přirozeného jazyka).

Podstatnou částí kurzu je aktivní práce s daty a seznámení s postupy pro vypracování úloh v R. Po dohodě může část semináře proběhnout čtením a studiem vybraných materiálů.