Úvod do bioinformatiky

Předmět na Přírodovědecká fakulta |

MB130C52

Sylabus

1. Orientace ve zdrojích dat: databáze sekvencí, prohledávání, stahování souborů. Genomové a další specializované databáze. Nástroje pro získávání a zpracovávání dat.

2. Základní manipulace se sekvenčními daty. Výběr relevantních oblastí sekvence, formáty souborů, nástroje k jejich úpravě. Translace a in silico restrikční analýza DNA sekvencí.

3. Vyhledávání sekvencí na základě podobnosti. Metody - BLAST, FASTA. Teoretické principy metod. Substituční matice PAM a BLOSUM. Speciální verze programu BLAST.

4. Hledání motivů a analýza doménové struktury proteinů. SMART, PROSITE a podobné zdroje. Hledání specifických signálů (lokalizační a degradační signály v proteinech, vazebná místa na DNA). Hledání pomocí krátkých motivů (patterns), formáty motivů.

5. Identifikace genů a kódujících oblastí. Software pro hledání genů a predikci sestřihu.

6. Konstrukce a interpretace alignmentu. Automatické a manuální metody - porovnání CLUSTAL vs. MACAW. Využití EST sekvencí pro ověřování predikcí struktury genů. Odvozování proteinových motivů a profilů.

7. Konstrukce a kritická interpretace fylogenetických stromů. Problém smysluplné selekce dat. Programový balík PHYLIP.

Anotace

Účastníci kursu získají základní dovednosti potřebné pro prohledávání, analýzu a interpretaci genomových dat za použití volně dostupných nástrojů (www, zdarma stažitelné programy).

Nezbytná je základní orientace v molekulární biologii (např. v rozsahu kursu B140P41) a základní počítačové dovednosti (Windows, WWW). Základní orientace v evoluční biologii je výhodou, avšak nikoli podmínkou.