Strojový překlad do tvaroslovně bohatých jazyků představuje složitý problém. Prestože pokrytí na úrovni lemmat může být dostatečné, řada jejich tvaroslovných variant se z trénovacích dat nedá získat.
Představujeme statistický překladový systém, který tyto tvaroslovné varinaty dokáže generovat. Na rozdíl od dřívějších prací nerozdělujeme modelování tvarosloví a lexikální volbu na dva navazující kroky.
Náš postup je integrován přímo v dekódování a využívá informace z konextu jak na zdrojové, tak na cílové straně.