Charles Explorer logo
🇨🇿

Zpřesňování hodnocení strojového překladu z angličtiny do češtiny pomocí parafrází

Publikace na Matematicko-fyzikální fakulta |
2014

Abstrakt

Tato práce prezentuje možnost zpřesnění hodnocení strojového překladu českých vět. Náš algoritmus dostává na vstupu referenční větu a upravuje jí tak, aby byla bližší výstupu strojového překladu a současně si zachovala původní význam a gramatickou správnost.

Tu zajišťuje systém Depfix, který byl původně navržen pro post-editaci strojových překladů z angličtiny do češtiny, zde upravený pro opravu chyb specifických pro parafrázovaní. Kvůli šumu ve zdrojích parafrázích experimentujeme se zarovnáváním slov.

Ale jako nejlepší metoda se ukázala prostá hladová metoda s pouze jednoslovnými parafrázemi, díky jejich důkladnému filtrování. BLEU spočítané na nových referencích vykazuje významně vyšší korelaci s lidským hodnocením než skóre počítané na původních referencích.