Král lesů a buvol: Morfosyntaktická anotace Paňčatantry

Publikace na Matematicko-fyzikální fakulta |

2018

Abstrakt

Popisujeme první volně dostupný závislostní korpus sanskrtu. Je založen na textech z Paňčatantry, starověké indické sbírky bajek.

Zvolili jsme formalismus Universal Dependencies, který v současnosti představuje faktickou normu mezijazykově srovnatelné morfologické a syntaktické anotace. V článku probíráme obtíže se segmentací textu na slova, představujeme inventář morfologických kategorií, jakož i některé syntaktické konstrukce, které jsou zajímavé ve světle pravidel Universal Dependencies.

Dále popisujeme experiment s automatickou syntaktickou analýzou (parsingem).

Klíčová slova

král lesů buvol morfosyntaktická anotace paňčatantry