Charles Explorer logo
🇨🇿

Levný tagger pro staročeštinu

Publikace na Matematicko-fyzikální fakulta |
2011

Abstrakt

Článek popisuje tagger pro staročeštinu (1200-1500 AD), flektivní jazyk s bohatou morfologií. Praktická omezení (žádní rodilí mluvčí, limitované korpusy a slovníky, limitované možnosti financování) dělají ze staročeštiny ideální objekt metody vývoje morfologických taggerů nenáročných na zdroje, kterou vyvíjíme (např.

Hana et al., 2004; Feldman and Hana, 2010). Jako aproximaci neexistujících staročeských zdrojů používáme zdroje pro současnou češtinu.