Charles Explorer logo
🇨🇿

Vliv nastavení slovníku na účinnost komprese malých souborů

Publikace na Matematicko-fyzikální fakulta |
2007

Abstrakt

Při kompresi velkých kolekcí malých textových souborů, jako jsou například zprávy elektronické pošty, člán\-ky z novin a časopisů nebo webové stránky, zjišťujeme, že mnohé kompresní techniky zde nebývají tak úspěšné jako na větších dokumentech. Rozhodli jsme se proto nalézt vhodné modifikace nebo nastavení parametrů existujících textových kompresních metod, které by úspěšně pracovaly v prostředí, kde je nutné uchovávat velké množství samostatně přístup\-ných malých souborů, například ve webovém vyhledávači. Jedním z faktorů ovlivňující chování testovaných kompres\-ních metod je počáteční nastavení jejich slovníku. Při kompresi velkých souborů je význam tohoto nastavení velmi malý, a proto bývá autory programů využívajících těchto metod počáteční nastavení slovníku zjednodušeno na minimum ?- bývají prázdné. Dle našich měření je význam vhodného počátečního naplnění slovníku při kompresi malých souborů značný.