Charles Explorer logo
🇨🇿

Když nemáte ani kus Bible: učení delexikalizovaných POS taggerů

Publikace na Matematicko-fyzikální fakulta |
2016

Abstrakt

Značkování slovními druhy (POS tagging) se v počítačovém zpracování přirozeného jazyka někdy považuje za téměř vyřešený problém. Standardní řízené přístupy často dosahují úspěšnosti přes 95 %, pokud je k dispozici dostatek ručně anotovaných trénovacích dat (typicky několik set tisíc tokenů nebo více).

My si nicméně myslíme, že je stále užitečné studovat polořízené a neřízené přístupy.