Charles Explorer logo
🇨🇿

Srovnání žánrů v korpusu na základě syntaktických funkcí substantiv

Publikace na Filozofická fakulta |
2013

Abstrakt

Synchronní textové korpusy Českého národního korpusu jsou budovány jako reprezentativní: obsahují vyvážené objemy textů různých stylů, které jsou rozděleny do tří základních žánrových subkorpusů: beletrie, odborné literatury a publicistiky. Tyto subkorpusy byly již srovnávány na fonologické a morfologické úrovni, v tomto článku představuji rozdíly mezi žánry na povrchově syntaktické úrovni.

Korpus SYN2005 jsem opatřil syntaktickým značkováním ve formalismu Pražského závislostního korpusu (PDT) s využitím vlastního nastavení stochastického parseru. Srovnávám frekvence syntaktických funkcí substantiv ve třech výše zmíněných žánrech v korpusu SYN2005.

Představuji také podrobnější analýzu čtyř syntaktických jevů: rozbor podtypů neshodného přívlastku; frekvence shodných nominálních skupin typu pan Novák; frekvence funkce