Charles Explorer logo
🇨🇿

K efektivitě manuální a poloautomatické excerpce neologismů

Publikace na Matematicko-fyzikální fakulta, Filozofická fakulta |
2019

Abstrakt

Článek prezentuje jednoduchou metodu poloautomatické excerpce neologismů: jednoduchý skript v jazyce Python zpracuje textový soubor, přičemž využije český morfologický tagger, a všechna slova, která tagger nerozezná, označí jako potenciální neologismy. Seznam potenciálních neologismů musí být zkontrolován ručně.

Tato metoda byla aplikována na soubor textů, které byly rovněž vyexcerpovány ručně, tj. v současnosti uplatňovanou metodou, při níž excerptor pročítá text a označuje výrazy, které považuje za potenciální neologismy. Srovnání výsledků ruční a poloautomatické excerpce jasně ukazuje, že skript pro poloautomatickou excerpci vykazuje výrazně lepší výsledky než excerpce ruční, a to jak z hlediska rychlosti práce, tak z hlediska její efektivity.