Treq je sbírka oboustranných česko-cizojazyčných slovníků, vytvořených automaticky z paralelního korpusu InterCorp. Originální a překladové texty jsou nejprve na základě statistických výpočtů zarovnány po slovech pomocí programu GIZA++.
Zarovnané dvojice slov jsou pak setříděny a sumarizovány. Výsledek automatické excerpce není nijak revidován, jako ukazatel relevance překladového ekvivalentu však může posloužit relativní frekvence příslušné dvojice slov. Čím častěji se ekvivalent zadaného slova vyskytl ve srovnání s ostatními ekvivalenty, tím větší je pravděpodobnost, že je funkční.
Ve verzi 2.0 můžeme kromě jednotlivých slov vyhledávat i víceslovnou jednotku a využít při hledání regulární výrazy. Můžeme si také vybrat, zda má být výsledek založen na překladech beletristického jádra, jednotlivých kolekcí, nebo všech textů v InterCorpu.
Databáze vychází z 9. vydání korpusu InterCorp.