Charles Explorer logo
🇨🇿

UNIX a práce s genomickými daty

Předmět na Přírodovědecká fakulta |
MB170C47

Sylabus

1. Úvod do prostředí Unix.

II. Základy Unixu - základní příkazy (cd, ls, ll, mkdir, mv, cp, pwd, htop, screen, grep, globbing, less, head, tail, cat, cut, sort, uniq, paste, join, pipes).

III. Pokročilý Unix - základy příkazů awk, sed, standardní výrazy, atd.

IV. Úvod do genomiky - struktura genomů.

V. Vizualizace dat - formátování dat pro jejich efektivní vizualizaci, použití RStudio, tidyr, dplyr a ggplot2.

VI. Posouzení kvality sekvenčních genomových dat - FASTQ soubory.

VII. "Genome assembly" - jak propojit malé segmenty genomové informace.

VIII. Variantní procesy - použití originálních NGS readů a "genome assembly" jejich variant.

IX. Standardní anotovací formáty - uložení a skladování genomové informace (formáty GFF, VCF, BED), sumarizace dat (bedtools, vcftools)

X. Mnoho praktického procvičování.

Anotace

Jak se biologický výzkum rozvíjí, pro většinu biologů jsou stále více důležité pokročilé výpočetní dovednosti a využití výkonných výpočetní zdroje. Nezbytným nástrojem je příkazový řádek Unixu, který je klíčový ke vzdálenému přístupu k výkonnějším výpočetním platformám. Nástroje jako git jsou navíc nepostradatelné pro reprodukovatelnost výzkumu, zajišťující konzistentnost a spolehlivost nálezů.

Představujeme zde aktualizovaný kurz se zaměřením na výpočty na vzdálených platformách a reprodukovatelnost kódu. Účastníci kurzu získají dostatečné dovednosti a sebevědomí v unixových prostředích, aby je mohli používat pro zpracování a analýzu vlastních genomických dat. Kromě mnoha praktických cvičení poskytneme také přehled dostupných výpočetních prostředí používaných v akademickém i komerčním prostředí v bioinformatice.