Dopředné hluboké neuronové sítě
- Základní architektury a aktivační funkce
- Optimalizační algoritmy pro trénování hlubokých modelů
Regularizace hlubokých modelů
- Klasická regularizace využívající penalizaci normou parametrů
- Dropout
- Label smoothing
- Batch normalization
- Víceúlohové učení
Konvoluční neuronové sítě
- Konvoluční a slučující (pooling) vrstvy
- Architektury vhodné pro velmi hluboké konvoluční sítě
- Nejlepší známé modely pro rozpoznávání obrazu, detekci objektů a segmentaci obrazu
- Předtrénování a finetuning hlubokých neuronovách sítí
Rekurentní neuronové sítě
- Základní rekurentní sítě a problémy jejich trénování
- Long short-term memory
- Gated recurrent units
- Obousměrné a hluboké rekurentní sítě
- Enkodér-dekodér architektury typu věta na větu
Praktická metodika
- Výběr vhodné architektury
- Volba hyperparametrů
Zpracování přirozeného jazyka
- Distribuovaná reprezentace slov
- Reprezentace slov jako sekvence znaků
- Transformer architektura
- Nejlepší známé algoritmy pro morfologické značkování, rozpoznávání pojmenovaných entit, strojového překladu
Hluboké generativní modely
- Variační autoenkodéry
- Generativní protivnické (adversarial) sítě
- Difúzní modely
- Generování řeči
Strukturovaná predikce
- CTC loss a její aplikace v nejlepších známých algoritmech rozpoznání řeči
- sequence-to-sequence architektura
Úvod do hlubokého zpětnovazebního učení
V několika posledních letech byly hluboké neuronové sítě použity při řešení komplexních úloh strojového učení a dosáhly nejlepších známých výsledků v mnoha oblastech. Cílem přednášky je seznámení s hlubokými neuronovými sítěmi, od základů k nejnovějším technikám.
Přednáška se zaměří jak na teorii, tak na skutečné použití hlubokých neuronových sítí (studenti vytvoří a natrénují několik hlubokých sítí, které budou schopné dosáhnout nejlepších známých výsledků, např. v oblasti rozpoznávání obrazu, 3d objektů, řeči, generování obrazu či hraní her).