Charles Explorer logo
🇨🇿

Rozdělování datových vzorků

Publikace na Matematicko-fyzikální fakulta |
2010

Abstrakt

Metody křížové validace se ve strojovém učení využívají k verifikaci chování výpočetních modelů a k zlepšení jejich schopnosti zobecňovat extrahované znalosti. Vzorky dat pro tvorbu a testování modelů se ve většině aplikací vybírají náhodně s rovnoměrným rozložením.

Tento článek poskytuje přehled dalších samplovacích metod, které lze úspěšně využít při sofistikavaném výběru vzorků dat pro křížovou validaci. Vlastnosti těchto metod jsme experimentálně zhodnotili a srovnali na několika datových sadách.