Charles Explorer logo
🇨🇿

Statistické metody v systémech pro dobývání znalostí z dat

Předmět na Matematicko-fyzikální fakulta |
NDBI031

Sylabus

Dobývání znalostí z dat, které jako samostatná oblast na styku matematiky a informatiky existuje od první poloviny devadesátých let, spočívá metodologicky na strojovém učení, statistice a teorii databází. Zatímco metody strojového učení a databáze jsou náplní jiných přednášek, tento předmět je prvním ze dvou zabývajících se souvislostí dobývání znalostí z dat a statistiky. Podává přehled statistických metod implementovaných v klíčových příkladech tří hlavních typů komerčních systémů pro dobývání znalostí z dat, jakož i v jednom akademickém systému, používaném na několika vysokých školách, včetně MFF. V letním semestru na něj volně navazuje předmět DBI029: Statistické aspekty dobývání znalostí z dat.

- Dobývání znalostí z dat a jeho souvislost se statistikou

- Hlavní typy systémů pro dobývání znalostí z dat

- Statistické metody v Clementine, příkladu obecného systému pro dobývání znalostí z dat

- Statistické metody v DecisionSite, příkladu systému pro on-line podporu rozhodování pomocí dobývání znalostí z dat

- Systém Matlab jako příklad univerzálnějšího systému zahrnujícího metody pro dobývání znalostí z dat

- Popisné statistiky v systému Matlab

- Lineární regrese a její zobecnění v systému Matlab

- Mnohorozměrná statistická analýza v systému Matlab

- Testování hypotéz v systému Matlab

- 4FT-Miner - akademický systém pro dobývání znalostí z dat kombinující observační logiku a analýzu čtyřpolních tabulek

- Kvantifikátory observační logiky založené na odhadech parametrů

- Kvantifikátory observační logiky založené na testování hypotéz

Anotace

Dobývání znalostí z dat spočívá metodologicky na strojovém učení, statistice a teorii databází. Tento předmět je prvním ze dvou zabývajících se souvislostí dobývání znalostí z dat a statistiky.

Podává přehled statistických metod implementovaných v klíčových příkladech tří hlavních typů komerčních systémů pro dobývání znalostí z dat, jakož i v jednom akademickém systému, používaném na několika vysokých školách, včetně MFF. V letním semestru na něj volně navazuje předmět NAIL105 Internet a klasifikační metody.