Charles Explorer logo
🇨🇿

Lists: Prohlížeč frekvenčních seznamů

Publikace

Abstrakt

Prohlížeč frekvenčních seznamů Lists umožňuje procházet frekvenční seznamy různých jednotek (lemma, word a lc) v reprezentativních korpusech psané češtiny (SYN2000, SYN2005, SYN2010, SYN2015) a v korpusu spontánní mluvené češtiny Oral v1. Pro každý korpus psané češtiny jsou navíc kromě celkových údajů k dispozici i dílčí frekvenční informace o třech jeho subkorpusech (beletrie, oborová literatura a publicistika).

Frekvenční seznamy obsahují pouze jednotky, které se skládají výhradně z alfabetických znaků a z pomlčky a které mají v každém z korpusů SYN2000, SYN2005, SYN2010 a SYN2015 nenulovou frekvenci (u korpusu ORAL v1 navíc přistupuje podmínka nenulovosti frekvence v tomto korpusu). Při prohlížení seznamů podle korpusů (první záložka) jsou ke každé jednotce uvedeny 4 frekvenční údaje: absolutní frekvence, relativní frekvence (IPM), průměrná redukovaná četnost (ARF) a průměrná redukovaná četnost normalizovaná na milion slov (ARFn).