Charles Explorer logo
🇨🇿

Český jazyk a korpus

Předmět na Filozofická fakulta |
AMLV00008

Sylabus

Rozpis témat

Následující témata budou při vyučování pokryta. Každý vyučující má individuální přístup k rozvržení hodin (pořadí témat) i v důrazu na jednotlivá témata.

·         Co je korpus; korpusy ČNK

·         Korpusová lingvistika

·         Otázka reprezentativnosti psaných a mluvených korpusů, žánrová rozrůzněnost

·         Značkování korpusu - lemmatizace a morfologické značkování; struktura korpusu

·         Vyhledání a interpretace konkordance

·         Frekvenční analýza (lemmat, slovních tvarů, žánrů, kontextu apod.)

·         Pokročilé vyhledávání: CQL a regulární výrazy

·         Kolokace, koligace, sémantická prozodie

·         Korpusový materiál ve výzkumu jednotlivých jazykových rovin

·         Základy zpracování dat (práce s Excelem, vytváření tabulek a grafů)

·         Základy statistiky pro práci s korpusem

·         Korpusové nástroje SyD, Morfio, KWords

·         Specializované korpusy (Diakorp, InterCorp, autorské korpusy)

·         Zpracování rozsáhlejšího lingvistického výzkumu (např. bakalářská/diplomová práce) na základě korpusových dat

Anotace

Seminář je určen bohemistům a dalším zájemcům o práci s jazykovým korpusem. Po absolvování semináře budou studenti schopni samostatně využívat korpusy psané a mluvené češtiny pro svou vlastní lingvistickou práci. Naučí se pracovat s korpusovým manažerem KonText a dalšími nástroji pro práci s korpusem, seznámí se s jazykovým materiálem v korpusech ČNK (především se synchronními psanými a mluvenými korpusy). V rámci samostatného výzkumu dokážou vyhledat a interpretovat lingvistický jev.

Počet studentů v semináři je z kapacitních důvodů omezen na 10.

Požadavky k zápočtu: aktivní účast na seminářích, test, samostatné zpracování lingvistického jevu korpusovými metodami.