Podobnostní vyhledávání v teoretických hmotnostních spektrech generovaných z databází proteinových sekvencí je široce používaný přístup pro identifikaci peptidů z experimentálně naměřených spekter. Rostoucí databáze proteinových sekvencí a zašuměná experimentální spektra vyžadují použití databázových indexovacích metod a přesnějších podobnostních měr pro porovnání teoretických a experimentálních spekter.
V této práci definujeme modifikaci dříve navržené parametrizované Hausdorffovy vzdálenosti pro porovnání hmotnostních spekter. Nově navržená míra překonává původní vzdálenost, kosinovou podobnost a stávající aplikace pro identifikaci peptidů OMSSA a X!Tandem v počtu identifikovaných peptidů, a to i přestože q-hodnota je pouze 0.001.
Ukazujeme, že pokud je použit prekurzorový hmotnostní filtr jako databázová indexovací technika, naše metoda překonává algoritmus OMSSA v rychlosti vyhledávání. V případě, že nevyhledáváme variabilní modifikace, čas hledání je přibližně stejný jako u aplikace X!Tandem.
Prekurzorový hmotnostní filtr se tedy ukazuje jako účinná indexovací metoda máme-li spektra získaná z přístrojů s vysokou přesností. Dále ukazujeme, že počet identifikovaných peptidů je vyšší hledáme-li variabilní modifikacejednotlivě s využitím více běhů dané aplikace, než když hledáme všechny modifikace současně.
Statistické hodnocení výsledků je pak totiž v menší míře ovlivněno současným hledáním nemodifikovaných a modifikovaných spekter. Naše metoda je implementov ána ve volně dostupné aplikaci SimTandem, která může být použita ve frameworku TOPP založeném na knihovně OpenMS.