Charles Explorer logo
🇨🇿

Coarse-to-fine a cross-linguálny ASR prenos

Publikace na Matematicko-fyzikální fakulta |
2021

Abstrakt

End-to-end neurální systémy automatického rozpoznávání řeči dosáhly v poslední době nejmodernějších výsledků, ale vyžadují velké datové sady a rozsáhlé výpočetní zdroje. Přenosové učení bylo navrženo k překonání těchto obtíží i napříč jazyky, např. německý ASR trénovaný podle anglického modelu.

Experimentujeme s mnohem méně příbuznými jazyky, přičemž pro české ASR znovu používáme anglický model. Pro zjednodušení převodu navrhujeme používat přechodnou abecedu, češtinu bez přízvuků, a dokládáme, že jde o vysoce efektivní strategii.

Technika je užitečná i na samotných českých datech, ve stylu tréninku "coarse-to-fine". Dosahujeme podstatného zkrácení doby tréninku a také word error rate (WER).