- Motivace pro NLP. Základní pojmy pravděpodobnostního modelování a teorie informace.
- Jazykové modely a jejich vyhlazování.
- Skryté markovovské modely.
- Zdroje lingvistických dat, experiment v NLP.
- Morfologické značkování.
- Syntaktická analýza.
- Přehled přístupů ke strojovému překladu.
- Statistický strojový překlad.
- Lingvistické rysy ve strojovém překladu.
- Vyhledávání informací.
- Váhy termů.
- Klasifikace a shluková analýza dokumentů.
- Vektorové modely.
V předmětu se studenti seznámí se standardními, základními, převážně statistickými, metodami v oblasti zpracování přirozeného jazyka (NLP). Studenti si po teoretické i implementační stránce osvojí potřebné techniky a seznámí se jak se základními komponentami jako jsou korpusy a jazykové modely, tak s komplexními koncovými aplikacemi NLP, například strojovým překladem.