Charles Explorer logo
🇨🇿

Slovotvorná síť pro češtinu

Publikace na Matematicko-fyzikální fakulta |
2014

Abstrakt

V příspěvku popisujeme vývoj lexikální sítě DeriNet, která zachycuje slovotvorné vztahy mezi zhruba 266 tisíci českými lexémy. Síť je v současné době omezena na procesy odvozování, které je v české slovotvorbě nejčastější a také nejproduktivnější.

Toto omezení je reflektováno v architektuře sítě: každý lexém smí být spojen pouze s jedním základovým slovem; skládání a kombinované slovotvorné procesy (kompozice s derivací) nejsou do sítě zahrnuty. Po krátkém shrnutí teoretického popisu derivace v češtině a prací věnujících se české derivaci z komputačního hlediska popisujeme lingvistická rozhodnutí, ze kterých návrh sítě vychází, a následně formální strukturu sítě a poloautomatickou anotaci.

Klíčová slova