Charles Explorer logo
🇨🇿

Page Content Rank: přístup k dolování obsahu webu

Publikace na Matematicko-fyzikální fakulta |
2005

Abstrakt

Metoda, nazýváme ji ve článku Page Content Rank (PCR), kombinuje několik heuristik, které se zdají být důležité pro analyzování obsahu webové stránky. Důležitost stránky je určena na základě důležitosti termů ve stránce.

Důležitost termů je specifikována vzhledem k danému dotazu a je založena na statistických a lingvistických rysech. PCR používá jako vnitřní klasifikační strukturu neuronovou síť.