Methodologies: online interfaces (KonText, Annis, CQP, BYU, Google NGrams, LAEME)
POS/Syntactic tagging & Corpus Query Languages regular expressions
MS Excel & pivot tables
R for Multiple factor analysis, Multidimensional scaling & Principal Components Analysis
Visualisation in R, GoogleVis, Gephi
Předmět nabízí přehled anglických diachronních korpusů a vybraných metodologií včetně práce s materiálem, rozhraními a softwarovými nástroji. Ve spolupráci s ÚČNK představuje i diachronní část Českého národního korpusu. Předmět je koncipován jako workshop a po krátkém úvodu si studenti práci s korpusy i představené postupy při řešení konkrétních výzkumných úkolů přímo vyzkouší.
• Dictionary of Old English Corpus & York-Toronto-Helsinki Parsed Corpus of Old English Prose (DOEC &
YCOE, 450?-1100);
• Parsed versions of the Helsinki Corpora (HC, 730-1710);
• A Linguistic Atlas of Early Middle English (LAEME, 1150-1325) & Corpus of Narrative Etymologies and the Corpus of Change;
• Parsed Corpus of Early English Correspondence (PCEEC, 1400-1800);
• Early English Books Online (EEBO, 1470s-1810s);
• Corpus of English Dialogues (CED, 1560-1760);
• Old Bailey Corpus (OBC, 1720-1913);
• Corpus of Historical American English (COHA, 1810-2000);
• Google Books/NGrams (1500?-2012);
Diachronní složka ČNK (DiaKorp, 14.-15. stol.);
Předmět může být vyučován v angličtině, a to v závislosti na rozhodnutí garanta.