Charles Explorer logo
🇨🇿

Tvorba morfologické sítě pro perštinu na základě morfematicky segmentovaného slovníku

Publikace na Matematicko-fyzikální fakulta |
2019

Abstrakt

Představujeme nový ručně anotovaný morfematicky segmentovaný slovník pro perštinu, a dále algoritmus, který s využitím tohoto slovníku zkonstruuje morfologickou síť. Výsledná síť zachycuje jak derivační, tak flektivní vztahy mezi slovními formami.

Algoritmus pro tvorbu sítě aproximuje rozdíl mezi kořenovými a afixovými morfémy na základě frekvenční informace o morfémech. Vyhodnocujeme kvalitu (ve smyslu lingvistické správnosti) výsledné sítě v konfiguraci s ručně označenými nekořenovými morfémy.

V další části naší práce vyhodnocujeme různé strategie pro přidání nových (ve slovníku dosud nezachycených) do sítě s využitím systému MORFESSOR (v řízené i neřízené verzi). Experimenty potvrzují, že navržený postup lze použít pro přidávání dosud nepokrytých slov s přijatelnou úspěšností.