Charles Explorer logo
🇨🇿

Částečně řízená detekce hranic mezi morfémy v českých slovech s využitím slovotvorné sítě

Publikace na Matematicko-fyzikální fakulta |
2020

Abstrakt

Tento článek se zabývá automatickou morfologickou segmentací českých lemmat obsažených v derivační síti DeriNet. Popis derivačních vztahů mezi základními a odvozenými lemmaty, a dělení lemmat na sekvence morfémů, jsou dva blízce propojené formální modely popisující vznik slov.

Proto navrhujeme novou segmentační metodu, která využívá existence derivační sítě. Naše řešení překonává dosavadní metody segmentace pro češtinu.