Charles Explorer logo
🇨🇿

Překlad dokumentů a překlad dotazů jako dva přístupy ve vícejazyčném vyhledávání informací

Publikace na Matematicko-fyzikální fakulta |
2020

Abstrakt

Porovnáváme dva základní přístupy k vícejazyčnému vyhledávání informací: překlad dokumentů (DT) a překlad dotazů (QT). Naše experimenty jsou prováděny na datech CLEF eHealth 2013-2015, které obsahují anglické dokumenty a dotazy v několika evropských jazycích.

S použitím Statistického strojového překladu (SMT) a Neurálního strojového překladu (NMT) a trénujeme několik systémů strojového překladu pro překlad neanglických dotazů do angličtiny (QT) a anglických dokumentů do jazyků dotazů (DT). Výsledky ukazují, že kvalita QT pomocí SMT je dostatečná k překonání výsledků vyhledávání s DT pro všechny jazyky.

NMT pak dále zvyšuje kvalitu překladu a kvalitu vyhledávání pro QT i DT pro většinu jazyků, QT ale stále poskytuje obecně lepší výsledky vyhledávání než DT.