Automatická segmentace, tokenizace a morfologická a syntaktická anotace textů ve 45 jazycích, vygenerovaná pomocí UDPipe (http://ufal.mff.cuni.cz/udpipe), spolu se 100rozměrnými slovními embeddingy vypočítanými nad textem převedeným na malá písmena nástrojem word2vec (https://code.google.com/archive/p/word2vec/).