Charles Explorer logo
🇨🇿

Bohatá anotace ve frázovém strojovém překladu

Publikace na Matematicko-fyzikální fakulta |
2010

Abstrakt

Mezi nejúspì¹nìj¹í metody strojového pøekladu se v souèasné dobì øadí relativnì velmi jednoduchý frázový statistický pøeklad, který se opírá v podstatì pouze o posloupnosti slov bez ohledu na lingvistické rozbory. Z více dùvodù kvalita strojového pøekladu stále není uspokojivá a lze se domnívat, ¾e èást problémù by bylo mo¾né odstranit explicitním zapojením lingvistické anotace do frázového pøekladu.

Pro èe¹tinu a angliètinu jsou navíc rozsáhlá bohatì anotovaná paralelní data k dispozici. Cílem této práce je proto pøipravit nástroj usnadòující experimenty s bohatou lingvistickou anotací v relativnì jednoduchém prostøedí frázových statistických pøekladù.

Popisujeme formát dat i mo¾nosti implementovaného nástroje a souèasnì uvádíme výsledky prvních experimentù. ©iroký prostor mo¾ností, jak lingvistická data do modelu zapojit, je otevøen pro dal¹í výzkum.