Charles Explorer logo
🇨🇿

Studie podobnosti a příbuznosti slov s použitím distributivních přístupů a přístupů založených na WordNet

Publikace na Matematicko-fyzikální fakulta |
2009

Abstrakt

Tento článek předkládá a srovnává přístupy pro měření podobnosti slov založené na distributivních metodách a WordNet metodách. Článek obsahuje diskuzi o výhodách a nevýhodách obou přístupů při odhadování podobnosti a příbuznosti slov a prezentuje kombinaci obou metod. Každá z našich metod nezávisle dosahuje nejlepších výsledků ve své třídě na datech RG a WordSim353, přičemž jejich kombinace dosahuje nejlepších zatím publikovaných výsledků na obou množinách dat.

Na závěr předkládáme metodu pro měření podobnosti napříč jazyky a ukazujeme, že naše metody lze snadno rozšířit na vícejazyčné úkoly pouze s malou ztrátou úspěšnosti.