Charles Explorer logo
🇨🇿

Agregáty a varianty ve dvou českých morfologických projektech

Publikace na Matematicko-fyzikální fakulta |
2019

Abstrakt

Existuje několik morfologických slovníků pro češtinu. Liší se pouze řešením komplikovaných morfologických rysů.

Byly učiněny různé pokusy o sjednocení jejich přístupů, ale jen některé z nich byly realizovány. Dokument se zabývá několika takovými rysy a porovnává jejich řešení přijatá ve dvou různých projektech, konkrétně příprava nového vydání PDT (Prague Dependency Treebank) a NovaMorf.

Charakteristickými rysy prezentovanými v tomto dokumentu jsou: agregáty (slovní formy bez jasné části řeči, např. užs, oč, naň) a varianty - flektivní (více slovní formy pro konkrétní kombinaci lemmy a morfologické značky) i globální (zejména ortografické varianty vyjádřené ve všech slovních formách paradigmatu).