Charles Explorer logo
🇨🇿

Výběr slov pro rozšíření dotazu ve mnohojazyčném systému získávání informací v medicínské doméně

Publikace na Matematicko-fyzikální fakulta |
2019

Abstrakt

Představujeme metodu automatického rozšíření dotazů pro vyhledávání informací mezi jazyky v oblasti medicíny. Metoda využívá strojový překlad dotazů ze zdrojového jazyka do jazyka dokumentu a lineární regresi k předvídání výkonu vyhledávání pro každý přeložený dotaz, který je rozšířen o kandidátský termín.

Kandidátské termíny (v jazyce dokumentu) pocházejí z více zdrojů: hypotézy pro překlad dotazů získané ze systému strojového překladu, články na Wikipedii a abstrakty PubMed. Rozšíření dotazu je použito pouze v případě, že model předpovídá skóre pro kandidátní termín přesahující vyladěnou hranici, která umožňuje rozšiřovat dotazy pouze se silně příbuznými termíny.

Naše experimenty jsou prováděny s využitím kolekce testů elektronického zdravotnictví CLEF 2013-2015 a vykazují významná zlepšení jak v mnohojazyčném, tak jednojazyčném nastavení.