1. Orientace ve zdrojích dat: databáze sekvencí, prohledávání, stahování souborů. Genomové a další specializované databáze. Nástroje pro získávání a zpracovávání dat.
2. Základní manipulace se sekvenčními daty. Výběr relevantních oblastí sekvence, formáty souborů, nástroje k jejich úpravě. Translace a in silico restrikční analýza DNA sekvencí.
3. Vyhledávání sekvencí na základě podobnosti. Metody - BLAST, FASTA. Teoretické principy metod. Substituční matice PAM a BLOSUM. Speciální verze programu BLAST.
4. Hledání motivů a analýza doménové struktury proteinů. SMART, PROSITE a podobné zdroje. Hledání specifických signálů (lokalizační a degradační signály v proteinech, vazebná místa na DNA). Hledání pomocí krátkých motivů (patterns), formáty motivů.
5. Identifikace genů a kódujících oblastí. Software pro hledání genů a predikci sestřihu.
6. Konstrukce a interpretace alignmentu. Automatické a manuální metody - porovnání CLUSTAL vs. MACAW. Využití EST sekvencí pro ověřování predikcí struktury genů. Odvozování proteinových motivů a profilů.
7. Konstrukce a kritická interpretace fylogenetických stromů. Problém smysluplné selekce dat. Programový balík PHYLIP.
Účastníci kursu získají základní dovednosti potřebné pro prohledávání, analýzu a interpretaci genomových dat za použití volně dostupných nástrojů (www, zdarma stažitelné programy).
Nezbytná je základní orientace v molekulární biologii (např. v rozsahu kursu B140P41) a základní počítačové dovednosti (Windows, WWW). Základní orientace v evoluční biologii je výhodou, avšak nikoli podmínkou.