Charles Explorer logo
🇨🇿

Výhody komplexního více-rovinného anotačního schématu: Případ Pražského závislostního korpusu

Publikace na Matematicko-fyzikální fakulta |
2022

Abstrakt

V poslední době bylo vyvinuto mnoho korpusů, které obsahují více anotací různých jazykových jevů, od morfologických kategorií slov přes syntaktickou stavbu vět až po diskurz a koreferenční vztahy v textech. Probíhají diskuse o vhodném anotačním schématu pro velké množství různorodých informací.

V našem příspěvku vyjadřujeme přesvědčení, že vícevrstvé anotační schéma nabízí pohled na jazykový systém v jeho komplexnosti a v interakci jednotlivých jevů a že existují minimálně dva aspekty, které vícevrstvé anotační schéma podporují: (i) Vícevrstvé anotační schéma umožňuje použít anotaci jedné vrstvy k návrhu anotace další vrstvy (vrstev) jak koncepčně, tak ve formě předanotačního postupu nebo pravidel kontroly anotace. (ii) Vícevrstvé anotační schéma představuje spolehlivý základ pro korpusové studie založené na vlastnostech napříč vrstvami. Tyto aspekty jsou demonstrovány na případu Pražského závislostního korpusu.

Jeho více-rovinné anotační schéma obstálo ve zkoušce času a dobře poslouží i pro složité t