Anotace přisuzování v článcích českého zpravodajského serveru

Publikace na Matematicko-fyzikální fakulta, Fakulta sociálních věd |

2022

Abstrakt

Tato práce se zaměřuje na detekci zdrojů v českých článcích publikovaných na zpravodajském serveru Českého veřejnoprávního rozhlasu. Hledáme zejména přiřazení ve větách a rozeznáváme přiřazené zdroje a jejich větný kontext(signály).

Zorganizovali jsme crowdsourcingovou anotační úlohu, jejímž výsledkem byl datový soubor 2 167 článků s ručně rozpoznanými signály a zdroji. Zdroje byly navíc zařazeny do kategorií jmenovaných a nejmenovaných zdrojů.

Klíčová slova

anotace přisuzování článcích českého zpravodajského serveru