Charles Explorer logo
🇨🇿

Homonymní příslovce a předložky a problematika jejich disambiguace v Českém národním korpusu

Publikace

Abstrakt

Příspěvek je zaměřen na homonymní příslovce a předložky jako např. blízko, dovnitř, vstříc aj. V příspěvku je uveden jejich seznam, je zde analyzována distribuce těchto homonym v korpusu SYN2010 a úspěšnost jejich automatické disambiguace v tomto korpusu a jsou zde systematizovány a analyzovány chyby, které se vyskytují v korpusové disambiguaci daných jednotek.

Příspěvek také ukazuje, že problematika automatické disambiguace homonymních příslovcí a předložek vzniká na pozadí rozsáhlé morfologické homonymie v češtině a často se komplikuje homonymií pádových tvarů jmen. Prezentovaný výzkum je základem pro následné vypracování konkrétních lingvistických pravidel, která by mohla úspěšnost disambiguace daných jednotek v Českém národním korpusu zvýšit.