Stromy jako datová struktura (závislostní stromy, složkové stromy, slovosled a projektivita)
Závislostní a nezávislostní vztahy v jazyce (závislost, koordinace, apozice, parenteze)
Rodina Pražských závislostních korpusů - úvod a principy; funkční generativní popis jako teoretický základ
Universal Dependencies - úvod a principy
Stratifikační přístup k popisu přirozeného jazyka: morfologie a její zachycení v závislostních korpusech
(povrchová) syntax a její zachycení v závislostních korpusech
(hloubková) syntax a její zachycení v závislostních korpusech
Zachycení dalších vybraných jevů hloubkové syntaxe
Anotační schémata, formáty dat
Používané nástroje (TrEd, PML-TQ, Udapi)
Cílem předmětu je seznámit studenty se závislostním popisem přirozeného jazyka a využitím principů závislostní gramatiky v morfologicky a syntakticky anotovaných korpusech. Zásadní pozornost je věnována projektu Pražského závislostního korpusu a projektu Universal Dependencies – jejich východisky, úrovněmi anotace a způsobem zachycení důležitých jazykových jevů.
Důraz je kladen též na anotační schémata a formát dat, na seznámení s používanými nástroji a na praktické zvládnutí práce s korpusem. Předmět je určen studentům nejrůznějš ího zaměření (informatika, aplikovaná lingvistika).