Charles Explorer logo
🇨🇿

Těžké trénování, lehké doladění: Multilinguální denoising pro generování textu z RDF

Publikace na Matematicko-fyzikální fakulta |
2020

Abstrakt

Popisujeme náš systém pro generování textu z RDF pro soutěž WebNLG Challenge 2020. Svůj přístup zakládáme na modelu mBART, který je předtrénován pro vícejazyčný denoising.

To nám umožňuje použít jednoduchý, identický end-to-end přístup pro angličtinu i ruštinu. S minimálními nároky specifickými pro konkrétní jazyk nebo úlohu se náš model umístil v první třetině žebříčku pro angličtinu a na prvním nebo druhém místě pro ruštinu v automatických metrikách.

Podle lidského hodnocení se dostal do nejlepší nebo druhé nejlepším skupiny systémů.