Charles Explorer logo
🇬🇧

O problémech nerodilých mluvčích s kvantitou na základě analýzy korpusových dat

Publication at Faculty of Arts |
2018

This text is not available in the current language. Showing version "cs".Abstract

V posledních deseti letech zájem o využití korpusů ve výuce češtiny jako cizího jazyka nabírá na sile, nicméně dosud ještě nevznikla komplexní studie pojímající problematiku kvantity na základě korpusových dat. Proto v tomto příspěvku prezentujeme první snahu o uchopení nejčastějších obtíží cizinců s kvantitou na základě korpusového materiálu.

Navíc popisujeme postup při analýze dat a navrhujeme konkrétní cvičení pro studenty, jež lze využít přímo ve výuce. K identifikaci nejčastějších chyb v oblasti kvantity jsme použili subkorpus žákovského korpusu CZeSL-SGT, který obsahuje texty nerodilých mluvčích češtiny s automaticky provedenou anotací.

Zaměřili jsme se pouze na analýzu textů studentů se slovanským mateřským jazykem. Celková velikost subkorpusu činí 769 126 pozic, z čehož 99 825 pozic bylo automatickou chybovou analýzou označeno za chybné.

Pozornost však byla věnována pouze první nejfrekventovanější chybě v diakritice, kde chyběla čárka nad vokálem (37 574 tokenů; 37,64 % z celkového počtu chyb v subkorpusu). Ke korpusové výuce lze přistupovat přímo i nepřímo, proto v rámci tohoto příspěvku budeme prezentovat obě možnosti.

Je třeba zdůraznit, že korpusový přístup ve výuce může být pouze doplňkem tradiční výuky nebo může být realizován vedle tradiční výuky v rámci seminářů plně zaměřených na korpusový přístup.