Charles Explorer logo
🇨🇿

Závislostní gramatiky a korpusy

Předmět na Matematicko-fyzikální fakulta |
NPFX075

Sylabus

Stromy jako datová struktura (závislostní stromy, složkové stromy, slovosled a projektivita)

Závislostní a nezávislostní vztahy v jazyce (závislost, koordinace, apozice, parenteze)

Rodina Pražských závislostních korpusů - úvod a principy; funkční generativní popis jako teoretický základ

Universal Dependencies - úvod a principy

Stratifikační přístup k popisu přirozeného jazyka: morfologie a její zachycení v závislostních korpusech

(povrchová) syntax a její zachycení v závislostních korpusech

(hloubková) syntax a její zachycení v závislostních korpusech

Zachycení dalších vybraných jevů hloubkové syntaxe

Anotační schémata, formáty dat

Používané nástroje (TrEd, PML-TQ, Udapi)

Anotace

Cílem předmětu je seznámit studenty se závislostním popisem přirozeného jazyka a využitím principů závislostní gramatiky v morfologicky a syntakticky anotovaných korpusech. Zásadní pozornost je věnována projektu Pražského závislostního korpusu a projektu Universal Dependencies – jejich východisky, úrovněmi anotace a způsobem zachycení důležitých jazykových jevů.

Důraz je kladen též na anotační schémata a formát dat, na seznámení s používanými nástroji a na praktické zvládnutí práce s korpusem. Předmět je určen studentům nejrůznějšího zaměření (informatika, aplikovaná lingvistika).