Článek ukazuje a kategorizuje typy chyb, které se vyskytují v textech přicházejících do korpusu. Většinou jde o závady způsobené počítačovým zpracováním textu, ale diskutuje se i o tom, zda je vhodné do korpusu zařazovat některé záměrně nestandardní texty