Charles Explorer logo
🇨🇿

Paralelní korpus InterCorp po sedmi letech

Publikace na Filozofická fakulta |
2011

Abstrakt

Příspěvek představuje architekturu a současný stav paralelního korpusu InterCorp, včetně přehledu jeho vývoje a srovnání s jinými paralelními korpusy. Následuje popis způsobu sběru dat zahrnující kritéria pro výběr textů, formát dat, konverze, zarovnání, lemmatizaci a taggování.

Příspěvek také popisuje dva používané nástroje, InterText (on-line editor zarovnání) a Park (rozhraní pro paralelní vyhledávání v textech). Závěrečná diskuse se zabývá výhledy do budoucna.