Charles Explorer logo
🇨🇿

Spolupráce komunity a ASR na webu

Publikace na Matematicko-fyzikální fakulta |
2012

Abstrakt

Článek prezentuje systém pro kombinování lidských přepisů s automatickým rozpoznáváním řeči pro vytvoření kvalitního přepisu velkého korpusu v dobrém čase. Systém používá web jako rozhraní pro přehrávání audia, synchronní zobrazování automaticky získaného přepisu a umožnění uživateli opravovat chyby v přepisu.

Lidmi zaslané opravy jsou poté použity ve statistickém rozpoznávání mluvené řeči pro zdokonalení akustického i jazykového modelu a přegenerování celého přepisu. Systém je v současnosti vyvíjen. Článek prezentuje návrh systému, zpracovaný korpus, jakož i možnosti použití systému na jiných datech.

Klíčová slova