Charles Explorer logo
🇨🇿

Volitelný seminář - Korpusová lingvistika

Předmět na Filozofická fakulta |
ADE400214

Sylabus

1. Úvod do korpusové lingvistiky. Historie. Nejvýznamnější existující korpusy. Bližší seznámení s ČNK, s DeReKo.

2. DeReKo - klient COSMAS II. - základní korpusové prostředí, možnosti a nabízené funkce, zadávání dotazů a vyhodnocování výsledků, export

3. DeReKo - klient COSMAS II. - kookurenční analýza, její možnosti a meze, zadávání parametrů, vyhodnocování výsledků, export

4. CCDB - vyhledávání, srovnání s možnostmi kookurenční analýzy, vyhodnocování výsledků

5. možnosti analýzy jednotlivých lemat - diskuse nad zadanými analýzami

6. možnosti analýzy syntagmat - diskuse nad zadanými analýzami

7. možnosti analýzy ustálených syntagmat (frazémů) ? rozdíl corpus-based vs. corpus driven, diskuse nad zadanými analýzami

8. využití výsledků korpusových analýz pro lexikografické účely

9. ČNK - zadávání dotazů, nejpoužívanější funkce, hodnoty T-score, MI-score

10. Řešení základních sporných otázek - co lze a co nelze do/v korpusu zadat/najít, anotované a tagované korpusy - jejich výhody a nevýhody

11. Řešení základních sporných otázek - velikost korpusu, nabízené nástroje, usnadnění či úplné vyřešení lingvistických problémů

12. Diskuse nad vlastními analýzami studentů

13. Diskuse nad vlastními analýzami studentů - konkluze

Anotace

Cvičení určené pro oba cykly studia. Cílem je seznámit studenty se současným možnostmi využití korpusů a korpusových nástrojů pro práci s jazykem. Úvod bude věnován seznámení s korpusy a korpusovou lingvistikou jakožto moderním lingvistickým směrem.

Vlastní práce se zaměří na Český národní korpus (ČNK) a korpus němčiny (DeReKo - IDS Mannheim). Studenti získají náhled do vlastní práce s korpusy se strategií corpus-based (zadávání, vyhodnocování výsledků) a zároveň poznají možnosti ?corpus-driven? přístupu (kookurenční analýza, CCDB).

Po absolvování tohoto semináře by studenti měli být schopni jak ověřovat/vyvracet své vlastní jazykové domněnky a hypotézy na základě korpusu, tak vyhodnocovat analýzy zpracované mechanicky korpusovými nástroji. Obojí by jim mělo pomoci při dalším studiu germánské lingvistiky.