Methodologies: online interfaces (KonText, Annis, CQP, BYU, Google NGrams, LAEME)
POS/Syntactic tagging & Corpus Query Languages regular expressions
MS Excel & pivot tables
R for Multiple factor analysis, Multidimensional scaling & Principal Components Analysis
Visualisation in R, GoogleVis, Gephi
Předmět je primárně určen magisterským (případně pokročilým výzkumně orientovaným bakalářským) studentům nejen anglické lingvistiky se zájmem o kvantitativní a především korpusové metody v diachronní jazykovědě.
Nabízí přehled anglických diachronních korpusů a vybraných metodologií včetně práce s materiálem, rozhraními a softwarovými nástroji.
Ve spolupráci s ÚČNK představuje i diachronní část Českého národního korpusu.
Předmět je do koncipován jako workshop, po krátkém úvodu si studenti práci s korpusy i představené postupy při řešení konkrétn ích výzkumných úkolů přímo vyzkouší.
Studentům doporučujeme před zapsáním tohoto kurzu absolvovat kurzy Dějiny anglického jazyka, některý z úvodních kurzů do korpusové lingvistiky případně kurz Data processing, není to však nutné.
Absolventům kurzu doporučujeme rozvinout postupy, s nimiž se zde seznámili, a především výzkumné úkoly, které v kurzu řešili v návazném předmětu Research in English Diachrony.