V první části příspěvku krátce představím specializované korpusy se zaměřením na korpusy mluveného jazyka. Tyto korpusy rozdělím do několika kategorií (akviziční, dialektální, publicistické, fonetické a "ostatní").
Jako východisko pro druhou část příspěvku bude sloužit krátký přehled historie emigrace z českých zemí - zaměřím se na dialektologicky zajímavá místa.V dnešní době se materiály pořízené i pořizované v těchto jazykových ostrovech zpracovávají a vznikají z nich unikátní dialektální korpusy češtiny v zahraničí (korpusy BANÁT, TCDA a další vznikající). Podrobněji se budeme věnovat korpusu BANÁT , který dokumentuje češtinu v jihozápadním Rumunsku.
Projdeme si jednotlivé fáze vzniku takového korpusu - od pořízení nahrávek v terénu až po zpracování v jazykový korpus. Na závěr bude možnost si ukázat jednoduchou analýzu na srovnání některého slovosledného jevu na banátské češtině a češtině na našem území.