Probíraná témata:
1) Mluvený jazyk a jeho specifika
2) Vytváření mluvených korpusů
3) Typy korpusů mluveného jazyka , korpusy mluvené češtiny
4) Pořizování nahrávek, výběr mluvčích, anonymizace
5) Otázky transkripce (trankripční programy: Transcribere, ELAN, EXMERALDA)
6) Morfologická anotace mluvené češtiny
7) Světové korpusy mluveného jazyka
8) Práce s mluvenými korpusy (ORAL, ORTOFON, DIALEKT – korpusový manažer Kontext)
9) Mluvený jazyk v NLP
10) Specifické jevy mluvené češtiny
Kurs uvádí účastníky do problematiky budování a využívání korpusů mluveného jazyka. Účastníci se seznámí s korpusy mluvené češtiny i dalších jazyků, se způsoby sběru dat, jejich transkripcí a trankripčními programy. Naučí se pracovat s korpusy mluvené češtiny (ORAL, ORTOFON, DIALEKT, DIALOG) v rozhraní Kontext, dialogy.org a SyD.
Praktická část bude zaměřena na zkoumání jevů mluveného jazyka prostřednictvím korpusových dat. Nedílnou součástí kurzu je i diskuse nad vybranou odbornou literaturou.