Charles Explorer logo
🇬🇧

Computational tools for (diachronic) linguists

Class at Faculty of Arts |
ABO500898

This text is not available in the current language. Showing version "cs".Syllabus

Seminář se zaměří na několik základních oblastí:

- grafika (standard Unicode, počítačová písma, typografie, principy transliterace a transkripce, abecední třídění, OCR);

- elektronické edice (zpracování edice historického textu v textovém editoru; využití edic pro korpus, e-knihy, publikace na webu; specifika biblického textu, nástroje pro automatickou transkripci);

- mezinárodní standardy pro digitalizaci textů (XML, TEI, Zefania XML)

- programovací jazyky a programy využívané při zpracování jazykových dat (databáze, XSLT, XQuery, Java, Visual Basic for Application, C# aj.; Microsoft Word, Excel, TXM, BaseX aj.),

- vytváření korpusů a jejich značkování

This text is not available in the current language. Showing version "cs".Annotation

V rámci jednotlivých seminářů budou probírána dílčí témata, a to formou krátkého představení, diskuse a aplikace nabytých poznatků na konkrétních příkladech. Studenti budou mít k dispozici materiály pro předběžné i detailní seznámení s problematikou.

Kromě pevně vymezených témat bude k dispozici i prostor pro relevantní témata a problémy jednotlivých studentů. Výsledkem společné práce bude elektronická edice úryvku historického textu.