Charles Explorer logo
🇨🇿

Parsování Universal Dependency korpusů pomocí neuronových sítí a prohledávacího orákula

Publikace na Matematicko-fyzikální fakulta |
2015

Abstrakt

V článku popisujeme přechodový neprojektivní závislostní parser používající klasifikátor založený na neuronových sítích, který nevyžaduje tvorbu rysů. Dále představujeme nové přechodové orákulum, které zvyšuje úspěšnost parseru porovnatelně s dynamickým orákulem, ale je použitelné pro každý přechodový systém, jako například neprojektivní systém s operací swap.

Parser je velmi rychlý, jeho modely kompaktní, přičemž dosahuje vysoké úspěšnosti bez potřeby dalších zdrojů jako například korpusů s čistým textem. Parser jsme otestovali na všech 19 korpusech z projektu Universal Dependencies.

Implementaci parseru v jazyce C++ uvolňujeme jako open-source.