Charles Explorer logo
🇬🇧

Czech Language and Corpus

Class at Faculty of Arts |
APH510052

This text is not available in the current language. Showing version "cs".Syllabus

Rozpis témat

Následující témata budou při vyučování pokryta. Každý vyučující má individuální přístup k rozvržení hodin (pořadí témat) i v důrazu na jednotlivá témata.

- Co je korpus; korpusy ČNK

- Korpusová lingvistika

- Otázka reprezentativnosti psaných a mluvených korpusů, žánrová rozrůzněnost

- Značkování korpusu - lemmatizace a morfologické značkování; struktura korpusu

- Vyhledání a interpretace konkordance

- Frekvenční analýza (lemmat, slovních tvarů, žánrů, kontextu apod.)

- Pokročilé vyhledávání: CQL a regulární výrazy

- Kolokace, koligace, sémantická prozodie

- Korpusový materiál ve výzkumu jednotlivých jazykových rovin

- Základy zpracování dat (práce s Excelem, vytváření tabulek a grafů)

- Základy statistiky pro práci s korpusem

- Korpusové nástroje SyD, Morfio, KWords

- Specializované korpusy (Diakorp, InterCorp, autorské korpusy)

- Zpracování rozsáhlejšího lingvistického výzkumu (např. bakalářská/diplomová práce) na základě korpusových dat

This text is not available in the current language. Showing version "cs".Annotation

Seminář je určen zájemcům o práci s jazykovým korpusem. Po absolvování semináře budou studenti schopni samostatně využívat korpusy psané a mluvené češtiny pro svou vlastní lingvistickou práci. Naučí se pracovat s korpusovým manažerem KonText a dalšími nástroji pro práci s korpusem, seznámí se s jazykovým materiálem v korpusech ČNK (především se synchronními psanými a mluvenými korpusy). V rámci samostatného výzkumu dokážou vyhledat a interpretovat lingvistický jev.

Počet studentů v semináři je z kapacitních důvodů omezen na 10.

Požadavky k zápočtu: aktivní účast na seminářích, test, samostatné zpracování lingvistického jevu korpusovými metodami.