Úvod – korpusová lingvistika, k čemu korpusy využívat
Český národní korpus
Slovenský národní korpus
Národní korpus polského jazyka
Národní korpus ruského jazyka
Korpusy ostatních slovanských jazyků (studentské prezentace)
Projekt
Obecně o paralelních korpusových zdrojích slovanských jazyků (IC, OPUS, PARASOL)
InterCorp
Srovnání národních tagsetů cs-pl, cs-ru, cs-sk,
Universal dependencies
Korpusový komparativní výzkum
Seminář je určen studentům slovanských jazyků a studentům filologických oborů se zájmem o slovanské jazyka a jejich zkoumání pomocí korpusů. Nepředpokládá se žádná předchozí zkušenost s korpusy.
Studenti se během kurzu dozvědí základní informace o korpusové lingvistice, národních korpusech slovanských jazyků a jejich uplatnění v praxi. Náplní semináře bude charakteristika českého, slovenského, polského a ruského národního korpusu a korpusových zdrojů dalších slovanských jazyků podle zájmů studentů.
Vyzkoušíme si i práci s každým z probraných korpusů. Dále se budeme věnovat slovanským zdrojům v rámci paralelních korpusů v kontextu srovnávání slovanských jazyků; zaprvé si ukážeme rozdílné přístupy k morfologickému popisu jednotlivých jazyků (rozdílné tagsety), zadruhé se budeme věnovat využití korpusového materiálu v komparativní lingvistice.