Charles Explorer logo
🇨🇿

Vylepšenie štatistického automatického prekladu pomocou paralelných dát blízkych jazykov

Publikace na Matematicko-fyzikální fakulta |
2012

Abstrakt

Množstvo trénovacích dát je pre kvalitu štatistického strojového prekladu rozhodujúce. V článku popisujeme, akým spôsobom je možné zlepšiť kvalitu prekladu pre daný jazykový pár pomocou využitia paralelných dát v príbuznom jazyku.

Konkrétne sme vylepšili en→sk preklad pomocou využitia veľkého česko-anglického paralelného korpusu a cs→sk prekladového systému založeného na pravidlách. Preskúmaných je niekoľko možností konfigurácie použitých systémov.