Charles Explorer logo
🇨🇿

Data Science 2

Předmět na Matematicko-fyzikální fakulta |
NMFP436

Sylabus

Náplň předmětu:

• úvod do strojového učení, motivace, příklady využití

• obecné postupy ve strojovém učení: rozdělení dat do trénovací a validační množiny, over-fitting, regularizace

• metody využívající rozhodovací stromy: rozhodovací stromy, náhodné lesy, gradientní boosting

• metody požívající neuronové sítě: jednoduché neuronové sítě, konvoluční neuronové sítě, rekurentní neuronové sítě

• shluková analýza – supervised vs unsupervised

• ostatní klasifikační metody – metoda opěrných nadrovin, naivní bayseovský klasifikátor

Náplň cvičení:

• cvičení bude probíhat na počítačích a bude se využívat jazyk Python

• jednotlivé metody strojového učení budeme aplikovat v praxi na reálných datech

Anotace

Nedílnou součástí analýzy velkých dat je v dnešní době strojové učení. Strojové učení se hojně využívá a dosahuje

úspěchů při řešení komplexních úloh v mnoha oborech. Tento kurz slouží jako úvod do základních principů strojového učení a jeho využití. Představí několik nejpoužívanějších metod jako jsou rozhodovací stromy nebo neuronové sítě, které se následně budou implementovat na cvičení v programovacím jazyce Python. Důraz bude kladen na zpracování a analýzu reálných dat společně s interpretací výsledků.