Charles Explorer logo
🇨🇿

O statistickém porovnání SimTandemu se stávajícími aplikacemi pro identifikaci peptidů, efektivitě prekurzorového hmotnostního filtru a variabilních modifikacích peptidů

Publikace na Matematicko-fyzikální fakulta |
2013

Abstrakt

Podobnostní vyhledávání v teoretických hmotnostních spektrech generovaných z databází proteinových sekvencí je široce používaný přístup pro identifikaci peptidů z experimentálně naměřených spekter. Rostoucí databáze proteinových sekvencí a zašuměná experimentální spektra vyžadují použití databázových indexovacích metod a přesnějších podobnostních měr pro porovnání teoretických a experimentálních spekter.

V této práci definujeme modifikaci dříve navržené parametrizované Hausdorffovy vzdálenosti pro porovnání hmotnostních spekter. Nově navržená míra překonává původní vzdálenost, kosinovou podobnost a stávající aplikace pro identifikaci peptidů OMSSA a X!Tandem v počtu identifikovaných peptidů, a to i přestože q-hodnota je pouze 0.001.

Ukazujeme, že pokud je použit prekurzorový hmotnostní filtr jako databázová indexovací technika, naše metoda překonává algoritmus OMSSA v rychlosti vyhledávání. V případě, že nevyhledáváme variabilní modifikace, čas hledání je přibližně stejný jako u aplikace X!Tandem.

Prekurzorový hmotnostní filtr se tedy ukazuje jako účinná indexovací metoda máme-li spektra získaná z přístrojů s vysokou přesností. Dále ukazujeme, že počet identifikovaných peptidů je vyšší hledáme-li variabilní modifikacejednotlivě s využitím více běhů dané aplikace, než když hledáme všechny modifikace současně.

Statistické hodnocení výsledků je pak totiž v menší míře ovlivněno současným hledáním nemodifikovaných a modifikovaných spekter. Naše metoda je implementována ve volně dostupné aplikaci SimTandem, která může být použita ve frameworku TOPP založeném na knihovně OpenMS.