Charles Explorer logo
🇨🇿

Word Formation Analyzer for Czech: Automatické rozpoznávání základových slov a klasifikace slovotvorných procesů

Publikace na Matematicko-fyzikální fakulta |
2022

Abstrakt

Představujeme nástroj vytvořený na bázi hlubokého učení nazvaný Word Formation Analyzer for Czech, který na základě vstupního lexému vrátí lemma nebo lemmata, jež tvoří jeho základ. Této úloze říkáme rozpoznávání základových slov.

Na základě počtu slov ve výstupní sekvenci a jejím srovnání se vstupem lze pak vstup klasifikovat do jedné ze tří kategorií: kompozitum, derivát, nebo nemotivované. Této úloze říkáme slovotvorná klasifikace.

V rozpoznávání základových slov dosáhl Word Formation Analyzer for Czech accuracy 71%, v klasifikaci slovotvorných procesů pak 87%.