Charles Explorer logo
🇨🇿

Pozor na díry: Obohacování dat pro závislostní analýzu eliptických konstrukcí

Publikace na Matematicko-fyzikální fakulta |
2018

Abstrakt

Popisujeme pokusy s několika přístupy k automatickému rozšíření trénovacích dat pro závislostní syntaktické analyzátory s využitím velkých webových korpusů. Jedna sada metod je obecná, inspiruje se samotrénováním a trojtrénováním a přidává nový algoritmus, který napodobuje strukturální složitost původního treebanku.

Metody ve druhé sadě se více zaměřují na eliptické konstrukce. Pokusy vyhodnocujeme na 5 jazycích: češtině, angličtině, finštině, ruštině a slovenštině.