Charles Explorer logo
🇨🇿

Skript 2015: Akviziční korpus češtiny rodilých mluvčích - přepisy písemných prací žáků základních a středních škol

Publikace

Abstrakt

Obsahuje písemné práce žáků, rodilých mluvčích češtiny, na různých jazykových úrovních, včetně mluvčích romského etnolektu, celkem 2582 textů a 380 tisíc tokenů. Žáci ve věku 10-15 let pocházejí ze ZŠ, ZŠP, ZŠS, SOŠ a gymnázií (včetně víceletých) a jsou ve věku 10-15 let. Texty lze prohledávat a prohlížet prostřednictvím korpusového nástroje TEITOK nebo KonText a jsou vybaveny metadaty a faksimilii.

U textů byla provedena ruční transkripce včetně záznamu oprav pisatele a ruční anonymizace. Texty byly ručně i automaticky anotovány a ručně revidovány.

Výsledky obsahují: a) ruční emendaci na více rovinách: pravopis a morfematika, morfosyntax, slovník, b) automatickou morfologickou analýzu původního textu a všech oprav, c) automatickou identifikaci typu pravopisné a morfématické chyby.