Charles Explorer logo
🇨🇿

FicTree : syntakticky anotovaný korpus české beletrie

Publikace

Abstrakt

Závislostní korpus FicTree je syntakticky anotovaný korpus české beletrie. Obsahuje 135 000 slov (166 000 tokenů).

Lematizace, morfologická a syntaktická anotace byly provedeny manuálně. Korpus je přístupný jednak jako anotovaný korpus v řadě korpusů ČNK přes rozhraní KonText, jednak jako data ke stažení, zamíchaná (kvůli autorským právům), dostupná ve standardu Pražského závislostního korpusu (a-rovina) i ve standardu Universal Dependencies.