Charles Explorer logo
🇨🇿

Morfologie češtiny znovu a lépe

Publikace na Matematicko-fyzikální fakulta |
2008

Abstrakt

Nový systém morfologie, který zde prezentujeme, vychází ze současného pražského systému. Kromě nové implementace stávajícího slovníku pomocí konečného automatu přidává algoritmy na rozpoznání neznámých tvarů.

V současné fázi je to především využití seznamu předpon, které lidé připojují bez větších omezení ke slovům a činí je tak pro automatické metody nerozpoznatelnými. Stačí předponu rozpoznat, odtrhnout a analyzovat zbylý řetězec.

Výsledky této analýzy lze pak jednoduše aplikovat na původní tvar s předponou. K rozpoznání neznámých vlastních jmen používáme heuristiku.

V příspěvku stručně popíšeme stávající pražský systém a použitý zárodek guessru.

Klíčová slova