Charles Explorer logo
🇨🇿

Strategie používání attention modelů ve vícezdrojovém sekvenčním učení

Publikace na Matematicko-fyzikální fakulta |
2017

Abstrakt

Attention modely ve vícezdrojovém neuronovém sekvenčním učení zůstávají poměrně neprobádanou oblastí, a to navzdory jeho užitečnosti v úkolech, které které využívají více zdrojových jazyků či modalit. Navrhujeme dvě nové strategie jak kombinovat výstupy attentiion modelu z různých vstupů, plochou a hierarchickou.

Navrhované metody porovnáváme se stávajícími a výsledky vyhodnocujeme na datech pro multimodální překlad a automatické post-editování překladu z WMT16. Navrhované metody dosažení konkurenceschopných výsledků na obou úlohách.