Rozpis témat
Následující témata budou při vyučování pokryta. Každý vyučující má individuální přístup k rozvržení hodin (pořadí témat) i v důrazu na jednotlivá témata.
· Co je korpus; korpusy ČNK
· Korpusová lingvistika
· Otázka reprezentativnosti psaných a mluvených korpusů, žánrová rozrůzněnost
· Značkování korpusu - lemmatizace a morfologické značkování; struktura korpusu
· Vyhledání a interpretace konkordance
· Frekvenční analýza (lemmat, slovních tvarů, žánrů, kontextu apod.)
· Pokročilé vyhledávání: CQL a regulární výrazy
· Kolokace, koligace, sémantická prozodie
· Korpusový materiál ve výzkumu jednotlivých jazykových rovin
· Základy zpracování dat (práce s Excelem, vytváření tabulek a grafů)
· Základy statistiky pro práci s korpusem
· Korpusové nástroje SyD, Morfio, KWords
· Specializované korpusy (Diakorp, InterCorp, autorské korpusy)
· Zpracování rozsáhlejšího lingvistického výzkumu (např. bakalářská/diplomová práce) na základě korpusových dat
Seminář je určen bohemistům a dalším zájemcům o práci s jazykovým korpusem. Po absolvování semináře budou studenti schopni samostatně využívat korpusy psané a mluvené češtiny pro svou vlastní lingvistickou práci. Naučí se pracovat s korpusovým manažerem KonText a dalšími nástroji pro práci s korpusem, seznámí se s jazykovým materiálem v korpusech ČNK (především se synchronními psanými a mluvenými korpusy). V rámci samostatného výzkumu dokážou vyhledat a interpretovat lingvistický jev.
Počet studentů v semináři je z kapacitních důvodů omezen na 10.
Požadavky k zápočtu: aktivní účast na seminářích, test, samostatné zpracování lingvistického jevu korpusovými metodami.