Charles Explorer logo
🇨🇿

Řečový testset fiktivních firemních prezentací s dalšími relevantními materiály

Publikace na Matematicko-fyzikální fakulta |
2019

Abstrakt

Předkládáme testovací korpus audionahrávek a přepisů prezentací studentských firem spolu s jejich slidy a webovými stránkami. Korpus je určen k evaluaci automatického rozpoznávání řeči, primárně za podmínek, ve kterých je využitelná předchozí dostupnost terminologie a pojmenovaných entit z dané oblasti.

Korpus se zkládá z 39 prezentací v angličtině, každá trvá až 90 sekund. Řečníci jsou studenti středních škol z evropských zemí. Angličtina je jejich druhý jazyk.

Na korpusu testujeme tři základní modely pro automatické rozpoznávání řeči a ukazujeme jejich nedostatky.