Charles Explorer logo
🇨🇿

Demografické aplikace SAS III

Předmět na Přírodovědecká fakulta |
MD360P46R

Sylabus

1)    The BOXPLOT Procedure (SAS/STAT). Krabicový graf s anténami (box-and-whisker plot), označovaný též boxplot znázorňuje medián, eventuálně průměr, kvartily, minimum a maximum v dané skupině, odlehlé a extrémní hodnoty. Délka krabičky se rovná kvartilovému rozpětí QR (rozdíl mezi hodnotou horního a dolního kvartilu), uvnitř je čára mediánu, horní anténa odpovídá maximu (resp. maximu v pásmu  Q3 +1,5QR) a dolní minimu (resp. minimu v pásmu Q1 – 1,5QR). BOXSTYLE=SKELETAL (antény znázorňují minimum a maximum). BOXSTYLE=SCHEMATIC (antény znázorňují maximum v pásmu Q3 +1,5QR a minimum v rámci Q1 – 1,5QR; BOXSTYLE=SCHEMATICID a BOXSTYLE=SCHEMATICIDFAR znázorňují odlehlé hodnoty, respektive extrémní hodnoty. Umístění souhrnných statistik do grafu INSET INSETGROUP.

2)    The UNIVARIATE Procedure (Base SAS). Statistiky založené na momentech (průměr, rozptyl, směrodatná odchylka, variační koeficient, šikmost, špičatost), kvantily, modus, odlehlé hodnoty, četnosti. Intervaly spolehlivosti pro průměr, směrodatnou odchylku a varianci. Příkazy FREQ a WEIGHT. Histogram (HISTOGRAM), proložení histogramu (parametrickými rozloženími, neparametrickým jádrovým - kernel). Umístění textu a souhrnných statistik do grafu (INSET). PROBPLOT and Q-Q diagram (QQPLOT). Skupinová data a tvorba skupinových (srovnávacích grafů), příkaz CLASS. Zaokrouhlování hodnot proměnných (ROUND). Testování statistik. The MEANS Procedure (Base SAS).

3)    The FREQ Procedure (Base SAS). Tvorba jednorozměrných a vícerozměrných tabulek četností. Testování závislostí v kontingenčních tabulkách. (TABLES  definuje typ tabulky; specificky tabulky 2x2 – poměr šancí a relativní riziko). TEST (Chi-kvadrát test, Pearsonův korelační koeficient, Spearmanův korelační koeficient pořadí). Příkaz WEIGHT.

4)    The CORR Procedure (Base SAS). Pearsonův korelační koeficient (parametrická míra asociace dvou proměnných). Měří sílu a směr lineární asociace. Spearmanův koeficient pořadové korelace (neparametrická míra asociace založená na pořadí), Kendallův koeficient pořadové korelace (Kendallovo tau, míra založená na počtu konkordancí a diskordancí párových pozorování). Pearsonův, Spearmanův, Kendallův koeficient parciální korelace (PARTIAL statement). Příkazy FREQ a WEIGHT.

5)      ODS Graphics (Base SAS). Tvorba „statistických“ grafů s pokročilými možnostmi fomátování, barev ap.  The SGPLOT Procedure umožňuje tvorbu velkého množství různých druhů grafů: korelační diagramy, histogramy, liniové grafy, sloupcové grafy, výstupy z regrese a další. The SGSCATTER Procedure umožňuje pokročilou tvorbu různě uspořádaných korelačních diagramů. The SGPANEL Procedure umožňuje skupinové uspořádání grafů, které také mohou být rozdílně formátovány.

6)    Transformace dat, (statistická) standardizace: Standard, Stdize. ·        The STANDARD Procedure (Base SAS). Standardizace vzhledem k danému průměru a dané směrodatné odchylce, vytváří se nový datový soubor, který obsahuje standardizované proměnné (standardizovaná data nebo-li standardizované skóry). ·        The STDIZE Procedure (SAS/STAT). Standardizace vzhledem k dané konstantě a měřítku.  Více možností oproti proc standard.

7)    The ANOVA Procedure (SAS/STAT). Analýza variance pro vyvážená data. Efekt jednoho faktoru na závisle proměnnou. Hlavní a interakční efekty kategoriálních nezávislých proměnných na závisle proměnnou kvantitativního typu. F-testovací charakteristika rozdílnosti skupinových průměrů. Procedure GLM pro vyvážená a nevyvážená data.

8)    MAKRA. Typy a použití. Makro proměnná, přiřazení hodnot a použití. Makro jako část programu definovaná uživatelem pro opakované použití. Makra v knihovně programů SAS a jejich aplikace.

9)    The FACTOR Procedure (SAS/STAT). Cílem je popis chování množiny proměnných pomocí menšího počtu nových proměnných – faktorů.  Metoda hlavních komponent, faktorové zátěže, faktorová rotace, faktorové skóry. Příkazy FREQ a WEIGHT.

10) The DISTANCE Procedure(SAS/STAT). Výpočet matice vzdáleností mezi objekty pro různé typy proměnných.

11) The CLUSTER Procedure (SAS/STAT). Cílem shlukové analýzy je rozdělit objekty do skupin na základě jejich podobnosti. Transformace proměnných. Omezený výpočet matice vzdáleností.

12) The TREE Procedure (SAS/STAT). Tvorba dendrogramu, horizontálně, vertikálně a další formátování.

13) The VARCLUS Procedure (SAS/STAT). Seskupování proměnných. Metoda redukce proměnných.

Anotace

Předmět představuje studentům software SAS včetně praktických příkladů. Vyučovány jsou vybrané postupy ze softwaru SAS / STAT, vhodné k použití vícerozměrných statistik v demografii.

SAS / STAT (BOXPLOT, ANOVA, FACTOR, STDIZE, CLUSTER, DISTANCE, TREE, VARCLUS).