Charles Explorer logo
🇨🇿

PhraseFix: Štatistická posteditácia systému TectoMT

Publikace na Matematicko-fyzikální fakulta |
2013

Abstrakt

V práci popisujeme dva anglicko-české prekladové systémy, ktoré boli odoslané do WMT 2013 shared tasku: TectoMT a PhraseFix. TectoMT je systém založený na syntaktickom preklade, PhraseFix používa štatistickú posteditáciu (SPE), ktorá je aplikovaná na výstup systému TectoMT.

V krátkom prehľade porovnáme SPE a ďalšie techniky kombinácie prekladových systémov - použijeme dáta, ktoré vznikli prekladom pomocou systému TectoMT, aby sme natrénovali štatistický prekladový systém (SMT). V práci ďalej potvrdíme hypotézu, že PhraseFix (SPE) zlepšuje výsledky TectoMT, zároveň však ukážeme, ze pridanie trénovacích dát do SMT je napriek tomu stále efektívnejšie.