Charles Explorer logo
🇨🇿

Vztahy rozšířené koreference a bridging anafory v Pražském závislostním korpusu

Publikace na Matematicko-fyzikální fakulta |
2009

Abstrakt

Článek popisuje anotační schéma rozšířené jmenné koreference a bridging anafory v Pražském závislostním korpusu. Porovnáváme náš přístup s již existujícími přístupy ve vztahu k jazyku, pro který je to které schéma použito.

Jmenujeme anotační principy a ukazujeme jejich aplikaci na rozsáhlou anotaci českých textů. Dále uvádíme vlastní rozdělení typů koreferenčních a bridging vztahů a věnujeme se některým problematickým otázkám této oblasti.

Popisujeme rovněž automatickou předanotaci a několik pomocných vlastností anotačního nástroje, jako je zachovávání koreferenčních řetězců, zvýrazňování kandidátů pro antecedenty apod. Uvádíme řadu statistických údajů získaných na doposud anotované části Pražského závislostního korpusu.

Rovněž přinášíme první výsledky měření mezianotátorské shody a objasňujeme nejčastější případy neshody.