O statistickém porovnání SimTandemu se stávajícími aplikacemi pro identifikaci peptidů, efektivitě prekurzorového hmotnostního filtru a variabilních modifikacích peptidů

Publikace na Matematicko-fyzikální fakulta |

2013

Abstrakt

Podobnostní vyhledávání v teoretických hmotnostních spektrech generovaných z databází proteinových sekvencí je široce používaný přístup pro identifikaci peptidů z experimentálně naměřených spekter. Rostoucí databáze proteinových sekvencí a zašuměná experimentální spektra vyžadují použití databázových indexovacích metod a přesnějších podobnostních měr pro porovnání teoretických a experimentálních spekter.

V této práci definujeme modifikaci dříve navržené parametrizované Hausdorffovy vzdálenosti pro porovnání hmotnostních spekter. Nově navržená míra překonává původní vzdálenost, kosinovou podobnost a stávající aplikace pro identifikaci peptidů OMSSA a X!Tandem v počtu identifikovaných peptidů, a to i přestože q-hodnota je pouze 0.001.

Ukazujeme, že pokud je použit prekurzorový hmotnostní filtr jako databázová indexovací technika, naše metoda překonává algoritmus OMSSA v rychlosti vyhledávání. V případě, že nevyhledáváme variabilní modifikace, čas hledání je přibližně stejný jako u aplikace X!Tandem.

Prekurzorový hmotnostní filtr se tedy ukazuje jako účinná indexovací metoda máme-li spektra získaná z přístrojů s vysokou přesností. Dále ukazujeme, že počet identifikovaných peptidů je vyšší hledáme-li variabilní modifikacejednotlivě s využitím více běhů dané aplikace, než když hledáme všechny modifikace současně.

Statistické hodnocení výsledků je pak totiž v menší míře ovlivněno současným hledáním nemodifikovaných a modifikovaných spekter. Naše metoda je implementována ve volně dostupné aplikaci SimTandem, která může být použita ve frameworku TOPP založeném na knihovně OpenMS.

Klíčová slova

SimTandem identifikace peptidů hmotnostní spektrometrie prekurzorový hmotnostní filtr posttranslační modifikace