Charles Explorer logo
🇨🇿

Detekce a výběr valenčního rámce v čestině a angličtině

Publikace na Matematicko-fyzikální fakulta |
2014

Abstrakt

Prezentujeme metodu strojového učení („s učitelem“) pro detekci a výběr slovesných valenčních rámců, tj. specifický druh desambiguace významu sloves založený na informacích o subkategorizaci; odpovídá to detekci zmínek o událostech v textu. Používáme bohaté závislostní informace z Pražských závislostních korpusů češtiny a angličtiny a několika dříve vyvinutých nástrojů (taggery, parsery).

Výběr rámce je založen na slovnících ručně sestavených pro tyto korpusy – PDT-Vallexu pro češtinu a EngVallexu pro angličtinu. Výsledky ukazují, že detekce predikátů je snažší v češtině, ale při výběr správného rámce jsme dosáhli lepších výsledků v angličtině.