Stromy jako datová struktura (závislostní stromy, složkové stromy, slovosled a projektivita)
Závislostní a nezávislostní vztahy v jazyce (závislost, koordinace, apozice, parenteze)
Rodina Pražských závislostních korpusů - úvod a principy; funkční generativní popis jako teoretický základ
Universal Dependencies - úvod a principy
Stratifikační přístup k popisu přirozeného jazyka: morfologie a její zachycení v závislostních korpusech
(povrchová) syntax a její zachycení v závislostních korpusech
(hloubková) syntax a její zachycení v závislostních korpusech
Zachycení dalších vybraných jevů hloubkové syntaxe
Anotační schémata, formáty dat
Používané nástroje (TrEd, PML-TQ, Udapi)
Cílem předmětu je seznámit studenty se základy závislostního popisu přirozeného jazyka a s využitím principů závislostní gramatiky v morfologicky a syntakticky anotovaných korpusech. Hlavní pozornost je věnována projektu
Pražského závislostního korpusu a projektu Universal Dependencies – jejich východiskům, úrovním anotace a způsobům zachycení důležitých jazykových jevů. Důraz je kladen též na anotační schémata a formát dat, na seznámení s používanými nástroji a na praktické zvládnutí práce s korpusy. Předmět je určen studentům nejrůznějšího zaměření (informatika, aplikovaná lingvistika).