Charles Explorer logo
🇨🇿

TectoMT jako nástroj pro předzpracování dat pro frázový statistický strojový překlad

Publikace na Matematicko-fyzikální fakulta |
2010

Abstrakt

Představujeme systematické srovnání předzpracovávacích metod pro dva jazykové páry: angličtina-čeština a angličtina-hindština. Přestože oba cílové jazyky patří do indoevropské jazykové rodiny, vykazují významné odlišnosti v tvarosloví, skladbě a slovosledu.

Popisujeme TectoMT, úspěšné prostředí pro analýzu a syntézu jazyka, a ukazujeme, jak ho lze využít pro předzpracování dat pro frázový systém strojového překladu.