Charles Explorer logo
🇨🇿

Korpus LINK

Publikace

Abstrakt

LINK (původně LIngvistův Narozeniový Korpus, který byl vytvořen u příležitosti životního jubilea prof. Františka Čermáka) je korpus sestavený pouze z lingvistických textů.

Jako takový je určen zejména pro výzkum specifik akademického jazyka (výzkum terminologie, jazyk lingvistiky apod.). Korpus obsahuje celkem 2 353 748 pozic, po odečtení interpunkce se tedy jedná o cca 1,8 mil. textových slov.

Korpus je lemmatizován a morfologicky označkován stejně jako jsou korpusy řady SYN, lemmatizace a značkování je zhruba na úrovni SYN2009PUB. Korpus LINK je sestaven z 258 odborných lingvistických textů z období let 1985 - 2010, velká většina textů je však z přelomu tisíciletí.

Korpus je tvořen jak většími lingvistickými pracemi (monografie, sborníky), tak články v odborných časopisech (zejm. Slovo a slovesnost, Naše řeč).