Česká republika se již od poloviny devadesátých let minulého století účastní několika mezinárodních vzdělávacích studií, zejména TIMSS, PIRLS, PISA, ICCS, PIAAC a ICILS. Po ukončení jednotlivých cyklů studie jsou vždy datové soubory za všechny účastnické země dostupné všem (Soukup, 2012).
Nicméně čeští pedagogičtí výzkumníci dosud tato data používají velice zřídka (spíše přejímají výsledky), ačkoli jsou velice bohatá a umožňují používání složitých statistických přístupů. Komplikace při práci s nimi vyplývají zejména z těchto skutečností: (a) data obsahují váhy, které zohledňují nestejné pravděpodobnosti vybírání jednotlivých respondentů, a tyto váhy je nutné užívat pro korektní odhady populačních parametrů; (b) data pocházejí z vícestupňových náhodných výběrů a je nutné upravovat standardní chyby odhadů pro výpočty statistických testů nebo intervalů spolehlivosti (využívají se replikační přístupy, nejčastěji jackknife); (c) mnohost dat na národní a mezinárodní úrovni (tj. reálně existují desítky datových souborů a jejich spojování není zcela triviální); (d) některé proměnné neměříme přímo (typicky výsledky v kognitivních testech) je třeba zohlednit chybu měření těchto latentních proměnných (využívá se IRT metodologie a tzv. plausible values).
Cílem textu bude na několika příkladech analytických procedur ukázat správné postupy práce s daty z mezinárodních vzdělávacích šetření a zároveň podat přehled dostupného softwaru pro zpracování těchto dat, aby je mohli čeští pedagogičtí výzkumníci zcela běžně využívat.