Charles Explorer logo
🇨🇿

CUNI Transformer - neuronový strojový překladač pro WMT18

Publikace na Matematicko-fyzikální fakulta |
2018

Abstrakt

Popisujeme náš neuronový překladač zaslaný do soutěže v překladu zpráv WMT2018. Náš systém je založen na modelu Transformer (Vaswani et al., 2017).

Používáme vylepšenou techniku zpětného překladu, kdy opakujeme proces překládání jednojazyčných dat jedním směrem a trénujeme model pro opačný směr pomocí syntetických paralelních dat. Aplikujeme jednoduché, ale účinné filtrování syntetických dat.

Na vstupní věty aplikujeme rozpoznávač koreference za účelem doplnění vypuštěných osobních zájmen. Na přeložený výstup aplikujeme dvě jednoduché substituce.

Náš systém je výrazně (p < 0,05) lepší než všechny ostatní anglicko-české a česko-anglické systémy ve WMT2018.