Vylepšenie štatistického automatického prekladu pomocou paralelných dát blízkych jazykov

Publikace na Matematicko-fyzikální fakulta |

2012

Abstrakt

Množstvo trénovacích dát je pre kvalitu štatistického strojového prekladu rozhodujúce. V článku popisujeme, akým spôsobom je možné zlepšiť kvalitu prekladu pre daný jazykový pár pomocou využitia paralelných dát v príbuznom jazyku.

Konkrétne sme vylepšili en→sk preklad pomocou využitia veľkého česko-anglického paralelného korpusu a cs→sk prekladového systému založeného na pravidlách. Preskúmaných je niekoľko možností konfigurácie použitých systémov.

Klíčová slova

vylepšenie štatistického automatického prekladu pomocou paralelných blízkych jazykov

Vylepšenie štatistického automatického prekladu pomocou paralelných dát blízkych jazykov

Abstrakt

Klíčová slova

Osoby