Charles Explorer logo
🇨🇿

CUNI systém pro jazyky s málo daty na WMT News 2019

Publikace na Matematicko-fyzikální fakulta |
2019

Abstrakt

Tento článek popisuje systém CUNI do News WMT 2019 pro jazyky s nedostatečnými zdroji: Gujarati-Angličtina a Kazakština-Angličtina. Zúčastnili jsme se na obou jazykových párech v obou směrech překladu.

Náš systém kombinuje přenos znalostí z jiného dvojice jazyků s vysokým množstvím paralelních dat, po kterém následuje trénování na zpětně přeložených jednojazyčných dat. Díky simultánnímu tréninku v obou směrech můžeme iterovat proces zpětného překladu.

Používáme Transformer model v constrained podmínkách.