Charles Explorer logo
🇨🇿

Anotace časových vztahů v diskurzu

Publikace na Matematicko-fyzikální fakulta |
2006

Abstrakt

Předkládáme anotační schéma, které zachycuje obecné časové vztahy mezi ději vyjádřenými v diskurzu. Jeho cílem je přirozeně rozšířit existující rovinu tektogramatické anotace Pražského závislostního korpusu.

Představuje tak krok k zachycení obsahu diskurzu. Existence korpusu anotovaného pomocí předkládaného schématu umožní trénování a testování algoritmů automatické extrakce časových vztahů, což přispěje k řešení mnoha úkolů ve zpracování přirozeného jazyka jako je získávání znalostí a strojový překlad.

Celkem bylo zatím anotováno 233 vět českého překladu Wall Street Journalu (část Penn Treebanku). Překládáme informaci o statistickém rozdělení jednotlivých typů časových vztahů založenou na těchto prvních anotovaných datech a uvádíme též výsledek algoritmu pro automatické určování časových vztahů založeném na využití informace poskytované gramatikou.