Charles Explorer logo
🇨🇿

Analýza statistických dat při korpusovém výzkumu víceslovných předložkových jednotek s místním významem (na materiálu korpusu SYN2010)

Publikace na Matematicko-fyzikální fakulta |
2014

Abstrakt

Tento příspěvek se věnuje analýze statistických dat získaných korpusovou sondou doposud téměř nepopsané skupiny víceslovných předložkových jednotek. Jedná se o víceslovné jednotky složené z místních příslovcí a primárních předložek, které se v řeči vyskytují jako jeden celek ve funkci místní předložky.

Takovými jednotkami jsou např. blízko k komu/čemu, blízko u koho/čeho, daleko od koho/čeho, nedaleko od koho/čeho, vysoko nad kým/čím aj. Způsobem excerpce z dosavadních českých mluvnic a příruček byl sestaven seznam místních příslovcí, která by potenciálně mohla být komponenty zkoumaných víceslovných útvarů.

Tento pracovní seznam v současné době čítá 111 příslovcí. Dále pomocí vyhledávácího systému korpusu SYN2010 bylo ověřeno, zda se vyskytují nebo nevyskytují spojení daných příslovcí a primárních předložek a v případě jejich výskytů bylo zjištěno, s jakými předložkami se daná příslovce pojí a zda jsou tato spojení náhodným sběhem slov nebo ustáleným slovním spojením.

Tímto způsobem byl získán soubor charakteristických místních předložkových jednotek typu příslovce + primární předložka, který momentálně obsahuje 80 jednotek. Zároveň byly získány údaje o jejich frekvenci a podílu výskytů hledaných spojení na celkovém počtu výskytů příslovcí zařazených do jejich struktury.

Dle těchto předpokladů byl systematizován výběr zkoumaných jednotek a tyto jednotky byly zanalyzovány z jejich kvantitativní stránky. Přehledné výstupy této analýzy jsou prezentovány v daném příspěvku.

Závěrem je posuzována hodnota kvantitativní analýzy ve výzkumu této skupiny předložkových jednotek.