Rozšiřování ontologie: přidávání sloves a tříd s použitím LLM

Publikace na Matematicko-fyzikální fakulta |

2023

Abstrakt

V tomto projektu jsme zkoumali využití pokročilých metod strojového učení, konkrétně vyladěných velkých jazykových modelů, pro předanotační data pro úlohu lexikálního rozšíření, konkrétně přidání popisných slov (sloves) do existující (ale zatím neúplné) ontologie typů událostí. Zaměřili jsme se na několik výzkumných otázek, od zkoumání možných heuristik pro poskytnutí alespoň náznaků anotátorům, která slovesa zahrnout a která jsou mimo současnou verzi ontologie, až po možné využití automatických skóre pro pomoc anotátorům, aby byli efektivnější při hledání prahu pro identifikaci sloves, která nemohou být přiřazena do žádné existující třídy, a proto mají být použita jako semena pro novou třídu.

Pečlivě jsme také zkoumali korelaci automatických skóre s lidskou anotací. I když se korelace ukázala jako silná, její vliv na vlastní anotaci je vzhledem k její téměř linearitě skromný, i když pouhý fakt takové pre-anotace vede k relativně krátkým časům anotace.

Klíčová slova

ontologie slovesa třídy LLM