1. Úvod do prostředí Unix.
II. Základy Unixu - základní příkazy (cd, ls, ll, mkdir, mv, cp, pwd, htop, screen, grep, globbing, less, head, tail, cat, cut, sort, uniq, paste, join, pipes).
III. Pokročilý Unix - základy příkazů awk, sed, standardní výrazy, atd.
IV. Úvod do genomiky - struktura genomů.
V. Vizualizace dat - formátování dat pro jejich efektivní vizualizaci, použití RStudio, tidyr, dplyr a ggplot2.
VI. Posouzení kvality sekvenčních genomových dat - FASTQ soubory.
VII. "Genome assembly" - jak propojit malé segmenty genomové informace.
VIII. Variantní procesy - použití originálních NGS readů a "genome assembly" jejich variant.
IX. Standardní anotovací formáty - uložení a skladování genomové informace (formáty GFF, VCF, BED), sumarizace dat (bedtools, vcftools)
X. Mnoho praktického procvičování.
Jak se biologický výzkum rozvíjí, pro většinu biologů jsou stále více důležité pokročilé výpočetní dovednosti a využití výkonných výpočetní zdroje. Nezbytným nástrojem je příkazový řádek Unixu, který je klíčový ke vzdálenému přístupu k výkonnějším výpočetním platformám. Nástroje jako git jsou navíc nepostradatelné pro reprodukovatelnost výzkumu, zajišťující konzistentnost a spolehlivost nálezů.
Představujeme zde aktualizovaný kurz se zaměřením na výpočty na vzdálených platformách a reprodukovatelnost kódu. Účastníci kurzu získají dostatečné dovednosti a sebevědomí v unixových prostředích, aby je mohli používat pro zpracování a analýzu vlastních genomických dat. Kromě mnoha praktických cvičení poskytneme také přehled dostupných výpočetních prostředí používaných v akademickém i komerčním prostředí v bioinformatice.