Charles Explorer logo
🇨🇿

Dataset konverzací mezi operátorem a klientem zarovaný s dotazy do databáze pro end-to-end trénovaní

Publikace na Matematicko-fyzikální fakulta |
2016

Abstrakt

Tento článek prezentuje novou datovou sadu pro výcvik end-to-end úkol orientovaně konverzační agentů. Obsahuje rozhovory mezi operátorem - odborníkem na danou doménu, a klientem, který hledá informace o úloze.

Spolu s konverzační přepisy zaznamenáme databázová volání prováděné operátorem, které zachycují význam dotazu uživatele. Očekáváme, že se snadno získatelné databázová volání nám umožní trénovat end-to-end dialog agenty se s výrazně méně tréninkových dat.

Datová sada je sbírána pomocí crowdsourcing a rozhovory pokrývají dobře známé restaurace doménu. Kvalita dat je vynucováno vzájemné kontroly mezi přispěvateli.

Datový soubor je k dispozici ke stažení pod licencí Creative Commons 4.0 BY-SA licencí.