Charles Explorer logo
🇨🇿

Anotovaný korpus textů o Šumavě

Publikace

Abstrakt

Stránka sumava-corpus je prostředím, které sdružuje různé typy textových bank sdílejících shodné téma "Šumava". Centrální bankou je MediaBank, která sestává z textů vzniklých v letech 1991 až 2010 a spadajících do shodného, mediálního (makro)žánru.

Převážná většina sebraných textů pochází z českých tištěných médií nebo jejich internetových verzí. Nejfrekventovanějšími zdroji jsou regionální mutace velkých deníků a částečně větší měsíčníky, v menší míře se zde vyskytují také tiskové zprávy a několik textů pocházejících z on-line blogů.

Korpus doplňují přepisy televizních a rozhlasových pořadů. Celkově obsahuje necelých 6800 textů o rozsahu 2,9 mil. slov.

Výběr textů do MediaBank byl podmíněn pouze nutným výskytem jednotky "Šumava. Výchozí materiál - v nejstarších obdobích novinové výstřižky, v těch mladších pak výsledky monitoringů médií - mi laskavě poskytl archiv Hnutí Duha; na zpracování materiálu se podíleli převážně studenti FF UK, jejichž práce byla hrazena prostřednictvím účelového stipendia, které mi FF UK na tvorbu korpusu poskytla.

Webovou stránku realizoval Michal Mocňák a je součástí projektu Narra. PrefBank je souborem předmluv, doslovů a částečně také kapitol týkajících se obecné charakteristiky pohoří vypsaných z průvodců, fotografických publikací, memoárů a dalších pramenů týkajících se Šumavy.

Sestává z 64 textů vzniklých mezi roky 1883 a 2013. Účelem PrefBank je zastávat funkci referenčního materiálu MediaBank a zároveň reprezentovat materiál reflektující problematiku Šumavy dávno před vznikem národního parku. KlosterBank je souborem předmluv a doslovů k především beletristickým dílům Karla Klostermanna.

Celkem 23 textů odráží vývoj vnímání Šumavy od počátku 20. století. Stejně jako v případě PrefBank plní KlosterBank důležitou funkci referenčního materiálu.