Charles Explorer logo
🇨🇿

Závislostní gramatiky a korpusy

Předmět na Matematicko-fyzikální fakulta |
NPFL075

Sylabus

Stromy jako datová struktura (závislostní stromy, složkové stromy, slovosled a projektivita)

Závislostní a nezávislostní vztahy v jazyce (závislost, koordinace, apozice, parenteze)

Rodina Pražských závislostních korpusů - úvod a principy; funkční generativní popis jako teoretický základ

Universal Dependencies - úvod a principy

Stratifikační přístup k popisu přirozeného jazyka: morfologie a její zachycení v závislostních korpusech

(povrchová) syntax a její zachycení v závislostních korpusech

(hloubková) syntax a její zachycení v závislostních korpusech

Zachycení dalších vybraných jevů hloubkové syntaxe

Anotační schémata, formáty dat

Používané nástroje (TrEd, PML-TQ, Udapi)

Anotace

Cílem předmětu je seznámit studenty se základy závislostního popisu přirozeného jazyka a s využitím principů závislostní gramatiky v morfologicky a syntakticky anotovaných korpusech. Hlavní pozornost je věnována projektu

Pražského závislostního korpusu a projektu Universal Dependencies – jejich východiskům, úrovním anotace a způsobům zachycení důležitých jazykových jevů. Důraz je kladen též na anotační schémata a formát dat, na seznámení s používanými nástroji a na praktické zvládnutí práce s korpusy. Předmět je určen studentům nejrůznějšího zaměření (informatika, aplikovaná lingvistika).