Charles Explorer logo
🇨🇿

Využití paralelních rysů v parsingu strojově přeložených vět pro korekci gramatických chyb

Publikace na Matematicko-fyzikální fakulta |
2012

Abstrakt

Představujeme dvě metody pro trénování závislostního parseru vhodného pro parsing výstupů strojového překladu. Upravili jsme MST parser použitím dalších rysů ze zdrojového jazyka a zavedením umělých gramatických chyb do trénovacích dat parseru, takže tato více odpovídají výstupu storjového překladu.

Upravený parser evaluujeme na systému DEPFIX, který zlepšuje výstupy anglicko-českého strojového překladu automatickými opravami založenými na pravidlech. Obě úpravy parseru vedou ke zvýšení skóre BLEU; jejich kombinace byla evaluována manuálně a vykazuje statisticky signifikantní zlepšení kvality překladu.