V tomto článku se snažíme nahradit zpracování webových zdrojů lidmi za jejich strojové zpracování. Identifikujeme několik zdrojů neurčitosti, které tento automatický proces činí obtížný.
Ukazujeme, že tyto zdroje neurčitosti jsou spojeny s dolováním obsahu z webu a s dolováním uživatelských preferencí. Závěr obsahuje diskuzi dalšího možného vývoje standardů dolování dat.