Analýza rozptylu – metoda nepostradatelná v analýze dat již téměř 100 let

27.11. 2017společnost ACREA14353x0 Komentářů

Analýza rozptylu (analýza variance, ANOVA) patří mezi základní metody statistické analýzy dat. Své uplatnění nachází téměř ve všech oblastech aplikované statistiky. Umožňuje odhalit faktory, které ovlivňují chování určité číselné veličiny, posoudit míru jejich vlivu a provést detailní porovnání skupin. Ačkoliv uplynulo již téměř 100 let od okamžiku, kdy ji v roce 1918 poprvé představil Sir Ronald Fisher ve svém článku The Correlation Between Relatives on the Supposition of Mendelian Inheritance, stále zůstává jednou z nejoblíbenějších a nejčastěji užívaných statistických technik.

Analýza rozptylu nachází své uplatnění v situacích, kdy porovnáváme průměry nějaké číselné charakteristiky ve skupinách (například průměrnou dobu od prvního kontaktu se zákazníkem do uzavření obchodního případu podle produktů, průměrnou spokojenost se životem podle rodinného stavu respondenta, průměrnou hloubku součástek vyrobených na třech strojích, průměrné hodnocení nového produktu podle věkových kategorií hodnotících a podobně).

Nejprve si obvykle klademe otázku, zda mohou být zjištěné rozdíly průměrů způsobené náhodou, nebo se jedná o obecnou vlastnost. Pokud zjistíme, že se skupiny od sebe statisticky významně odlišují, můžeme se dále zajímat o to, jaký je efekt jednotlivých skupin a zda se mezi sebou navzájem liší všechny dvojice skupin, nebo jen některé. Metoda rovněž umožňuje testovat různé speciální typy hypotéz, které si sami formulujeme a zadáváme je jako tzv. kontrasty.

Skupiny obvykle definujeme na základě kategorií určité kategorizované proměnné (faktoru). Pokud porovnáváme vliv různých faktorů (například pohlaví, vzdělání, věkové kategorie a rodinného stavu), můžeme zjišťovat, který z nich působí na analyzovanou proměnnou nejsilněji. V některých případech ale potřebujeme sledovat vliv několika faktorů současně. Potom zjišťujeme, zda každý z nich působí nezávisle na ostatních a jejich efekty se sčítají, nebo je nutné uvažovat i vliv různých kombinací kategorií těchto faktorů. Ve druhém případě lze rovněž odhadnout efekt společného působení jednotlivých kombinací kategorií.

V praxi se často setkáváme se situací, kdy může být vztah mezi vysvětlovanou číselnou proměnnou a sledovanými faktory zkreslený zavádějícím vlivem jiných proměnných. Rozdíly průměrů ve skupinách (nebo naopak neprokázání významnosti těchto rozdílů) mohou být způsobené směšováním vlivu skupin a dalších proměnných, jejichž hodnoty se ve skupinách liší. Otázkou, jak kontrolovat v analýze rozptylu nepřímé vlivy takových číselných proměnných, které nejsou předmětem našeho zájmu, ale mohou zkreslovat výsledky, se zabývá analýza kovariance.

Pokud Vás analýza rozptylu zaujala a chcete porozumět jejím základům i hlouběji proniknout do její podstaty, rádi bychom Vás pozvali na dvoudenní kurz „Analýza rozptylu: Přístupy k odhalování příčin a vlivů“. Představíme Vám základní principy metody a na praktických úlohách Vás provedeme nejčastějšími typy aplikací. Zaměříme se především na analýzu rozptylu jednoduchého a dvojného třídění, testování podrobnějších hypotéz o průměrech ve skupinách pomocí kontrastů a post hoc testů a na analýzu kovariance.

společnost ACREA

ACREA CR je českou analytickou společností s tradicí od roku 1995. Poskytuje analytické, statistické a dataminingové služby, školení a software z řady IBM SPSS a Predictive Solutions. Název firmy je zkratkou pro Analytical CREAtivity, která vyjadřuje, že každý analytický projekt je pro nás unikátní a ke každému přistupujeme individuálně.

Komentáře

Analýza rozptylu – metoda nepostradatelná v analýze dat již téměř 100 let

Přidat komentář Zrušit odpověď

Nepropásněte další blogový článek