Charles Explorer logo
🇨🇿

Rekurentní neuronové sítě pro sledování dialogového stavu

Publikace na Matematicko-fyzikální fakulta |
2016

Abstrakt

Tento článek se zabývá modely pro sledování stavu dialogu pomocí rekurentních neuronových sítí (RNN). Představujeme pokusy na datové sadě, DSTC2.

Na jedné straně, RNN modely dosahují vynikajících výsledků. Na druhou stranu většina state-of-the-art modelů jsou "turn-based" a vyžadují specifické předzpracování (např pro data z DSTC2) k dosažení vynikajících výsledků.

Představili jsme dvě architektury, které mohou být použity v inkrementálních nastavení a nevyžadují téměř žádnou předzpracování. V članku porovnáváme jejich výkonnost na referenčních hodnotách pro DSTC2 a diskutujeme jejich vlastnosti.

S pouze triviální předzpracováním se výkon našich modelů blíží k výsledkům state-of-the-art.