Charles Explorer logo
🇨🇿

Identifikace nevyjádřených subjektů v češtině

Publikace na Matematicko-fyzikální fakulta |
2011

Abstrakt

V tomto článku se snažíme automaticky identifikovat subjekty, které nejsou vyjádřeny ale přesto rozuměny v českých větách. Náš systém využívá metodu maximální entropie k rozeznání různých druhů nevyjádřených subjektů.

Systém byl trénován a testován na Pražském závislostním korpusu. Výsledky našich experimentů přináší dále úvahu nad vhodností vybraného korpusu pro naši úlohu.