Charles Explorer logo
🇨🇿

Universal Dependencies pro treebanky AnCora

Publikace na Matematicko-fyzikální fakulta |
2016

Abstrakt

Tento článek popisuje konverzi katalánského a španělského treebanku AnCora do formalismu Universal Dependencies (univerzální závislosti). Popisujeme proces konverze a odhadujeme kvalitu výsledného treebanku nepřímo pomocí automatické syntaktické analýzy v jednojazykovém, mezijazykovém a mezidoménovém testu.

Převedené treebanky vykazují interní konzistenci srovnatelnou s původní distribucí AnCora pro CoNLL09. Od jiného, dříve vydaného španělského UD treebanku se liší zejména v repertoáru vyznačených víceslovných výrazů.

Tyto dva nově převedené treebanky budou vydány v Universal Dependencies verzi 1.3.