3. 10.: Úvod do korpusové lingvistiky (metody, nástroje, krátká historie KL, základy práce s ČNK prostřednictvím nástroje SyD), registrace do ČNK a DeReKa 10. 10.: ČNK - orientace v dostupných korpusech, jejich výběr a složení, regulární výrazy 17. 10.: ČNK - frekvenční distribuce, MI-score, t-score, problematika kolokací, kookurencí, koligací, princip jazykové ekonomie a Zipfovy zákony 24.10.: ČNK - mluvené a speciální korpusy 31.10.: ČNK - další nástroje (kalkulačka pro výběr vzorků, FRANTA - nástroj pro vyhledávání frazémů, nástroj pro hledání odvozenin od slovních základů) a představení možných témat ke zpracování 7.11.: CCDB - kookurenční databanka - metody: related collocation profiles, contrast near-synonyms, self organizing maps 14.11.: DeReKo - možnosti vyhledávání, webová aplikace, klient COSMAS II 21.11.: Dokončení analýzy synonym; DeReKo - kookurenční analýza, InterCorp - představení projektu 28.11.: InterCorp - práce s rozhraním Park, opakování regulárních výrazů 5.12.: InterCorp, ČNK a DeReKo - samostatná práce na tématech 12.12.: Prezentace výsledků samostatné práce 19.12.: Shrnutí semináře
Předmět je určen pro studenty bakalářského i magisterského studia se zájmem o počítačové nástroje využitelné při překladu a při kontrastivním zkoumání jazyka, především češtiny a němčiny. Těžištěm semináře bude paralelní mnohojazyčný korpus InterCorp a dále nejvýznamnější české a německé korpusy.
Studenti se naučí vyhledávat v korpusech pomocí různých nástrojů (především webového manažeru) a metod, důraz bude kladen na interpretaci jazykových dat a jejich použitelnost pro překlad (zohledňovány budou např. rozdíly v žánrech). Součástí semináře je i základní uvedení do elektronických slovníkových příruček a do statistických metod při výzkumu jazyka.