Charles Explorer logo
🇨🇿

TrTok: Rychlý a trénovatelný tokenizér pro přirozené jazyky

Publikace na Matematicko-fyzikální fakulta |
2012

Abstrakt

Představujeme univerzální nástroj pro segmentaci a tokenizaci textů, který uživateli dovoluje nadefinovat potenciální hranice vět a slov a na základě trénovacích dat se naučí hranice hledat.