Charles Explorer logo
🇨🇿

Zvícejazyčnění sémantické ontologie

Publikace na Matematicko-fyzikální fakulta |
2022

Abstrakt

Představujeme rozšíření ontologie typu události SynSemClass, původně koncipované jako dvojjazyčný česko-anglický zdroj. Do tříd představujících koncepty ontologie jsme přidali německé záznamy.

Vzhledem k tomu, že jsme měli jiný výchozí bod než původní práce (neoznačený paralelní korpus bez odkazů na valenční lexikon a samozřejmě různé existující lexikální zdroje), bylo náročné přizpůsobit pokyny pro anotaci, datový model a nástroje použité pro původní verzi. Popisujeme proces a výsledky práce v takovém nastavení.

Dále ukazujeme další kroky k úpravě procesu anotace, datové struktury a formáty a nástroje nezbytné k tomu, aby přidání nového jazyka v budoucnu bylo plynulejší a efektivnější a případně aby různé týmy mohly pracovat na rozšíření SynSemClass do mnoha jazyků současně. představujeme nejnovější verzi, která obsahuje výsledky přidání němčiny, volně dostupné ke stažení i pro online přístup.