Charles Explorer logo
🇬🇧

Introduction to English Diachronic Corpora

Class at Faculty of Arts |
AAA500190

Syllabus

Methodologies: online interfaces (KonText, Annis, CQP, BYU, Google NGrams, LAEME)  

POS/Syntactic tagging & Corpus Query Languages   regular expressions  

MS Excel & pivot tables  

R for Multiple factor analysis, Multidimensional scaling & Principal Components Analysis  

Visualisation in R, GoogleVis, Gephi

Annotation

 Předmět nabízí přehled anglických diachronních korpusů a vybraných metodologií včetně práce s materiálem, rozhraními a softwarovými nástroji. Ve spolupráci s ÚČNK představuje i diachronní část Českého národního korpusu. Předmět je koncipován jako workshop a po krátkém úvodu si studenti práci s korpusy i představené postupy při řešení konkrétních výzkumných úkolů přímo vyzkouší.

Dictionary of Old English Corpus & York-Toronto-Helsinki Parsed Corpus of Old English Prose (DOEC & YCOE, 450?-1100)

Parsed versions of the Helsinki Corpora (HC, 730-1710)

A Linguistic Atlas of Early Middle English (LAEME, 1150-1325) & Corpus of Narrative Etymologies and the Corpus of Change

Parsed Corpus of Early English Correspondence (PCEEC, 1400-1800)

Early English Books Online (EEBO, 1470s-1810s)

Corpus of English Dialogues (CED, 1560-1760)

Old Bailey Corpus (OBC, 1720-1913)

Corpus of Historical American English (COHA, 1810-2000)

Google Books/NGrams (1500?-2012)

Diachronní složka ČNK (DiaKorp, 14.-15. stol.)

Předmět může být vyučován v angličtině, a to v závislosti na rozhodnutí garanta.