Charles Explorer logo
🇨🇿

Systém LMU Mnichov pro soutěžní úkol strojový překlad bez nebo velmi málo trénovacími daty na WMT21

Publikace na Matematicko-fyzikální fakulta |
2021

Abstrakt

Představujeme naše systémy pro soutěžní úkol v strojovém překladu bez paralelní dat a s velmi málo paralelními data na WMT21: mezi němčinou a hornolužickou srbštinou, němčinou a dolnolužickou srbštinou a ruštinou a čuvašštinou. Naše nízkozdrojové systémy (němčinaLEFT RIGHT ARROW hornolužická srbština, ruštinaLEFT RIGHT ARROW čuvaština) jsou předtrénovány na párech příbuzných jazyků s dostatkem data.

Tyto systémy jsme dotrénovali pomocí dostupných autentických paralelních dat a dále vylepšili opakovaným zpětným překladem. NěmeckoLEFT RIGHT ARROW dolnolužický systém je inicializován nejlepším hornolužickosrbským systémem a vylepšen opakovaným zpětným překladem pouze za použití jednojazyčných dat.