Charles Explorer logo
🇨🇿

morfologické zpracování pro anglicky Tamil strojového překladu statistického

Publikace na Matematicko-fyzikální fakulta |
2012

Abstrakt

Různé experimenty z literatury naznačují, že ve statistickém strojového překladu (SMT), požádat buď pre-zpracování nebo post-processing se morfologicky bohaté jazyků vede k lepšímu kvality překladu. V této práci jsme se zaměřili na anglicky Tamil jazykový pár.

Realizujeme přípona-separačních pravidla pro oba jazyky a vyhodnotit dopad tohoto předzpracování na kvalitu překladu fráze-, tak na hierarchickém modelu, pokud jde o hodnocení Bleu a malé ruční vyhodnocení. Výsledky potvrzují, že náš jednoduchý přípona-based morfologické zpracování pomáhá získat lepší překlad výkon.Vedlejším produktem naší úsilí je nová paralelní korpus 190k věty párů shromáždili z webu.