Pojmenované entity z Wikipedie ve strojovém překladu

Publikace na Matematicko-fyzikální fakulta |

2011

Abstrakt

V článku představujeme pokus o zlepšení strojového překladu pojmenovaných entit s využitím Wikipedie. Pojmenované entity rozpoznáváme na základě kategorií anglických článků Wikipedie, následně extrahujeme jejich potenciální překlady z odpovídajících českých článků a přidáváme je jako nové možnosti překladu do statistického systému pro strojový překlad.

Automatická metrika kvality překladu značí její zhoršení, avšak podle ruční anotace se naše překlady jeví jako lepší. Docházíme k závěru, že tento přístup vede v řadě chyb v překladu a měl by být proto vždy kombinován se standardním statistickým překladovým modelem.

Měla by mu také být přiřazena přiměřená váha.

Klíčová slova

pojmenované entity wikipedie strojovém překladu