Charles Explorer logo
🇨🇿

In-House: Soubor dříve existujících parserů z dílny poskytovatelů dat

Publikace na Matematicko-fyzikální fakulta |
2014

Abstrakt

Podmnožina organizátorů Úlohy 8 na SemEvalu 2014 se pokusila použít k řešení úlohy parsery, které byly již dříve vyvinuty pro jednotlivé datové formáty využité v této úloze. Kombinace výstupů těchto parserů byla zařazena jako samostatné řešení otevřené části úlohy (open track).

Použité systémy byly typicky vyvíjeny souběžně s anotací dat, konkrétně (a) pro formát DM jde o parser nad ručně sestavenou English Resource Grammar; (b) pro formát PAS jde o systém Enju s pravděpodobnostní HPSG, získanou lingvistickou projekcí PTB; a (c) pro formát PCEDT jde o scénář anglické tektogramatické analýzy v prostředí Treex, zahrnující statistický závislostní analyzátor a řadu cílených zpracovacích bloků, které převádějí stromy z analytické na tektogramatickou rovinu.