Seminář se zaměří na několik základních oblastí:
- grafika (standard Unicode, počítačová písma, typografie, principy transliterace a transkripce, abecední třídění, OCR);
- elektronické edice (zpracování edice historického textu v textovém editoru; využití edic pro korpus, e-knihy, publikace na webu; specifika biblického textu, nástroje pro automatickou transkripci);
- mezinárodní standardy pro digitalizaci textů (XML, TEI, Zefania XML)
- programovací jazyky a programy využívané při zpracování jazykových dat (databáze, XSLT, XQuery, Java, Visual Basic for Application, C# aj.; Microsoft Word, Excel, TXM, BaseX aj.),
- vytváření korpusů a jejich značkování
V rámci jednotlivých seminářů budou probírána dílčí témata, a to formou krátkého představení, diskuse a aplikace nabytých poznatků na konkrétních příkladech. Studenti budou mít k dispozici materiály pro předběžné i detailní seznámení s problematikou.
Kromě pevně vymezených témat bude k dispozici i prostor pro relevantní témata a problémy jednotlivých studentů. Výsledkem společné práce bude elektronická edice úryvku historického textu.