V článku zkoumáme audiomateriál shromážděný crowdsourcingovými metodami na české sekci portálu forvo.com, který je jako celek celosvětově jedinečný z hlediska počtu zastoupených jazyků, zvukových dokladů i uživatelů. Cílem je posoudit případnou reprezentativnost (tj. spisovnost a/nebo přirozenost) nahrávek pro fonetický výzkum a též pro účely cizojazyčných laických uživatelů.
Výběrově se zaměřujeme na percepčně nápadné, většinou hyperkorektní odchylky od přirozené výslovnosti (nerealizace asimilace znělosti a místa artikulace), ale věnujeme se i jevům, které jsou sice neortoepické, ale ve spontánní řeči etablované (frekventované fonetické redukce, desonorizace). Odchylky od přirozeného řečového chování lze přičíst zejména nepřirozené mluvní situaci, v níž se laický mluvčí při nahrávání nacházejí, a jejich lpění na psané podobě hesel určených k nahrávání.
Na základě provedených zjištění hodnotíme českou část portálu forvo.com jako spíše nepoužitelnou pro běžný fonetický výzkum a jako obezřetně použitelnou pro cizojazyčného laického uživatele, bez nároku na plnou reprezentativnost.