Charles Explorer logo
🇨🇿

Korpusy mluveného jazyka

Předmět na Filozofická fakulta |
AMLV00042

Sylabus

Probíraná témata:

1)      Mluvený jazyk a jeho specifika

2)      Vytváření mluvených korpusů

3)      Typy korpusů mluveného jazyka , korpusy mluvené češtiny

4)      Pořizování nahrávek, výběr mluvčích, anonymizace

5)      Otázky transkripce (trankripční programy: Transcribere, ELAN, EXMERALDA)

6)      Morfologická anotace mluvené češtiny

7)      Světové korpusy mluveného jazyka

8)      Práce s mluvenými korpusy (ORAL, ORTOFON, DIALEKT – korpusový manažer Kontext)

9)      Mluvený jazyk v NLP

10)     Specifické jevy mluvené češtiny

Anotace

Kurs uvádí účastníky do problematiky budování a využívání korpusů mluveného jazyka. Účastníci se seznámí s korpusy mluvené češtiny i dalších jazyků, se způsoby sběru dat, jejich transkripcí a trankripčními programy. Naučí se pracovat s korpusy mluvené češtiny (ORAL, ORTOFON, DIALEKT, DIALOG) v rozhraní Kontext, dialogy.org a SyD.

Praktická část bude zaměřena na zkoumání jevů mluveného jazyka prostřednictvím korpusových dat. Nedílnou součástí kurzu je i diskuse nad vybranou odbornou literaturou.