Charles Explorer logo
🇨🇿

Komplexita : software pro lingvistické analýzy genetických sekvencí

Publikace

Abstrakt

Bioinformatický program umožňující analýzy genetických sekvencí na základě matematických lingvistických metod, které jsou alternativním bioinformatickým nástrojem pro kvalitativní analýzu genetických sekvencí. Program pracuje se sekvencemi nukleotidů nebo proteinů ve standardních bioinformatických formátech.

Umožňuje rozklad textu na potenciální slova délky n. (tzv. Shannonovské n-gramy) a jejich následné statistické zpracování.

Program dále nabízí výpočty lingvistických charakteristik jako Shannonova entropie, lingvistická komplexita, lingvistická komplexita dle E.N. Trifonova, markovský model entropie, Wootton – Federhenův index.

Mimo tyto základní funkce program umožňuje detekci potenciálně amfipatických peptidů v proteinech, náhodný výběr vzorku zvolené délky, filtraci sekvencí na základě zvolených parametrů a porovnání s náhodným modelem pomocí simulací Monte- Carlo. Program je zveřejněn v anglické verzi, manuál je dostupný v češtině i v angličtině.