Soubor dílčích analýz sémanticky a formálně-gramaticky vymezených skupin lexémů patřících k frekvenční špičce mluvené, či psané češtiny. Za tu byl stanoven dataset 3000 nejčastějších lemmat v korpusech ORAL v1 a ORTOFON v1, resp.
SYN2015; v rozdílech obou množin lze spatřovat projev diglosie v češtině na lexikální úrovni. Blíže analyzovány jsou tyto skupiny slov: adverbia, deiktika, numeralia, propria, deminutiva, přechýlená jména a univerbizáty.