Mezi nejúspì¹nìj¹í metody strojového pøekladu se v souèasné dobì øadí relativnì velmi jednoduchý frázový statistický pøeklad, který se opírá v podstatì pouze o posloupnosti slov bez ohledu na lingvistické rozbory. Z více dùvodù kvalita strojového pøekladu stále není uspokojivá a lze se domnívat, ¾e èást problémù by bylo mo¾né odstranit explicitním zapojením lingvistické anotace do frázového pøekladu.
Pro èe¹tinu a angliètinu jsou navíc rozsáhlá bohatì anotovaná paralelní data k dispozici. Cílem této práce je proto pøipravit nástroj usnadòující experimenty s bohatou lingvistickou anotací v relativnì jednoduchém prostøedí frázových statistických pøekladù.
Popisujeme formát dat i mo¾nosti implementovaného nástroje a souèasnì uvádíme výsledky prvních experimentù. ©iroký prostor mo¾ností, jak lingvistická data do modelu zapojit, je otevøen pro dal¹í výzkum.