Charles Explorer logo
🇨🇿

MonoTrans: Statistický strojový překlad z jednojazyčných dat

Publikace na Matematicko-fyzikální fakulta |
2017

Abstrakt

Představujeme MonoTrans, systém statistického strojového překladu, který používá pouze jednojazyčná data ve zdrojovém a cílovém jazyce, bez použití paralelních korpů nebo pravidel specifických pro konkrétní jazyk. Systém překládá každé zdrojové slovo cílovém slovem, které je mu nejpodobnější na základě kombinace míry řetězcové podobnosti a podobnosti četností slov.

Systém je určen pro překlad mezí blízkými jazyky v situaci kdy není k dispozici dostatek paralelních dat. Přestože MonoTrans dosahuje nízkých skóre, významně překonává baseline.