Charles Explorer logo
🇨🇿

Problematika slovosledu při statistickém strojovém překladu z angličtiny do urdštiny

Publikace na Matematicko-fyzikální fakulta |
2011

Abstrakt

Zkoumáme frázový statistický strojový překlad mezi angličtinou a urdštinou, dvěma indoevropskými jazyky s výrazně odlišnými preferencemi slovosledu. Přeskládání slov a frází je tudíž nezbytnou součástí překladové procedury.

Zatímco lokální přeskládání lze ve frázových systémech modelovat elegantně, přesuny na velkou vzdálenost jsou problematické. Provádíme pokusy s překladovým systémem Moses a probíráme přeskládávací modely, kterými Moses disponuje.

Potom předkládáme náš nový, urdštiny znalý, avšak zobecnitelný přístup založený na přeskládávání frází v syntaktickém stromu zdrojové anglické věty. Naše metoda významně zlepšuje kvalitu anglicko-urdského překladu s Mosesem, měřeno jak automatickým BLEU skórem, tak subjektivním lidským hodnocením.