Charles Explorer logo
🇨🇿

GramatiKat

Publikace

Abstrakt

GramatiKat poskytuje informace o hodnotách gramatických kategorií v rámci vybraného slovního druhu (např. který pád se u substantiv používá nejvíce a který nejméně apod.) i pro jednotlivá lemmata (vytváření gramatických profilů). Nástroj je určen primárně k výzkumu gramatických kategorií a také k lexikologickému a lexikografickému zkoumání, ale najde své uplatnění např. i při výuce češtiny.

V současné chvíli jsou k dispozici informace o českých substantivech, do budoucna počítáme i se zpracováním adjektiv a sloves. Všechna data jsou přebírána z korpusů ČNK, konkrétně z korpusů SYN2015 a ORALv4.

Pracujeme pouze se substantivy, která se v daném korpusu vyskytnou alespoň 100krát. Procentuální rozložení jednotlivých tvarů je založeno na rozložení tvarů v jednotlivých lemmatech - každé lemma má tedy při výpočtech stejnou váhu, bez ohledu na frekvenci.

Tím zajistíme, aby extrémně frekventovaná lemmata nezkreslovala celkové výsledky.