Využití strojového učení při dekódování hypotéz v rozpoznávání textu z fotografií

Publikace na Matematicko-fyzikální fakulta |

2015

Abstrakt

Cílem Rozpoznávání textu z fotografií (STR) je právně lokalizovat a přespat text zachycený na fotografii z reálného prostředí. Rostoucí úspěšnost rozpoznávání zároveň dělá z těchto textů zajímavý zdroj dat pro zpracování přirozeného jazyka a zároveň přináší nové problémy, které jsou specifické právě pro texty, které se na fotografiích vyskytují.

V tomto článku představujeme učení dekódování textových řetězců v systému STR pomocí metod strukturní predikce, které se využívají při dekódování v rozpoznávání řeči a strojovém překladu. Model při učení využívá jazykové a typografické rysy.

Navržená metoda je evaluována na standardní datové sadě a zvyšuje úspěšnost rozpoznávání znaků i rozpoznávání celých slov.

Klíčová slova

využití strojového učení dekódování hypotéz rozpoznávání textu fotografií