Charles Explorer logo
🇨🇿

Dvojjazyčné stromy založené na Universal Dependencies ve strojovém překladu

Publikace na Matematicko-fyzikální fakulta |
2016

Abstrakt

V tomto příspěvku představujeme náš nový experimentální systém sloučení závislost reprezentace dvou rovnoběžných vět do jednoho strom závislostí. Všechny vnitřní uzly v závislosti stromu představují zdroj-cílové páry slovy, další slova jsou ve formě koncové uzly.

Používáme Univerzální Závislosti anotace styl, ve kterém funkční slova, jejichž použití se často liší mezi jazyky, jsou zaznamenány jako listy. Paralelní korpus je analyzován v minimálně dohlíží způsobem.

Nezarovnaný slova jsou zde automaticky tlačil na povrch listů. Představujeme jednoduchý systém překladu vyškoleného na takových sloučených stromech a vyhodnocovat jej WMT 2016 anglicko-to-český a česko-to-anglický překlad úloh.

I přesto, že model je doposud velmi jednoduché a byl používán žádný jazykový model a model word-li řazení varianta Český k angličtině dosáhl podobného Bleu skóre jako další zavedeného systému stromu bázi.