Charles Explorer logo
🇨🇿

O segmentaci českých vět

Publikace na Matematicko-fyzikální fakulta |
2006

Abstrakt

Příspěvek zavádí pojem (větného) segmentu, jednotky, která je lingvisticky motivovaná a přitom snadno automaticky rozpoznatelná. Rozpoznání segmentů umožňuje určovat segmentační strukturu věty (reprezentovanou segmentačním schématem), na jejímž základě lze vymezit jednotlivé klauze souvětí a jejich vzájemný vztah, a tím i syntaktickou strukturu souvětí.

Metoda segmentace je navržena pro automatické zpracování češtiny, jazyka s relativně velmi volným slovosledem. V příspěvku je dále popsána sada jednoduchých pravidel, která je využita pro budování segmentačních schémat.

Výsledky segmentace jsou vyhodnoceny vzhledem k malému ručně anotovanému korpusu českých vět.

Klíčová slova