Power analýza v IBM SPSS Statistics

Mezi hlavní novinky verze 27 patří procedury pro analýzu síly testu (power analýzu). Tyto procedury naleznete pod nabídkou Analyze, Power Analysis a jsou k dispozici pro řadu běžně užívaných statistických testů (T-testy, analýza rozptylu, testy proporcí, testy hypotéz o korelačních koeficientech, testy nulovosti parametrů v lineární regresi). V tomto článku si podrobněji přiblížíme, co je power analýza, ukážeme si, jak zadávat výpočet i jaké typy výstupů procedury nabízejí.

Co je power analýza

Síla testu (power) je jednou ze základních vlastností statistických testů. Je to pravděpodobnost, že statistický test správně zamítne nulovou hypotézu, pokud neplatí. Čím je test silnější, tím spíše odhalí i malou odchylku od nulové hypotézy.

Analýza síly testu hraje klíčovou roli především při plánování výzkumů. Nejčastěji se užívá k určení optimální velikosti výběrového souboru. Pokud je výběrový soubor příliš malý, test nemusí být schopen odhalit ani výraznou odchylku od nulové hypotézy. Naopak zbytečně velký soubor znamená vyšší náklady, ale může také snadno vést k přeceňování statistické významnosti. I v případě analýzy dat, u nichž není možné počet pozorování předem ovlivnit, je dobré vědět, s jakou sílou je statistický test schopen odhalit odchylku, která je již věcně významná.

Při realizaci power analýzy v IBM SPSS Statistics je možné zvolit jeden ze dvou cílů: 

  • odhad optimální velikosti výběru pro danou hladinu významnosti, sílu testu a očekávanou odchylku od nulové hypotézy, nebo
  • odhad síly testu pro danou hladinu významnosti, velikost výběru a odchylku od nulové hypotézy. 

Jedním z parametrů, s nímž analýza síly testu pracuje, je odchylka od nulové hypotézy. Může se jednat o odchylku, kterou již považujeme za věcně významnou a chceme, aby ji test byl schopen prokázat s danou silou, nebo o odchylku, kterou jsme zjistili z dat a chceme pro ni a další vstupní parametry odhadnout sílu testu. Obvykle se uvádí ve standardizované formě, která se označuje jako effect size. Definice effect size nejčastěji se vycházejí z metodologie Jacoba Cohena a jeho knihy Statistical power analysis for the behavioral sciences, která je velmi populární zvláště v oblasti sociálních věd. Program IBM SPSS Statistics nabízí uživatelsky příjemný způsob zadávání, kdy není nutné určit přímo hodnotu effect size, ale informace potřebné pro její výpočet (například předpokládaný rozdíl průměrů ve skupinách a směrodatnou odchylku). Ve výstupu se ale u některých procedur zobrazuje i tato charakteristika.

Další důležité vstupní parametry se mírně liší pro jednotlivé typy testů, vždy však mezi ně patří hladina významnostityp alternativní hypotézy (oboustranná nebo jednostranná).

Velikost výběru (sample size) se podle typu testu uvádí jako celkový počet případů pro jednovýběrové testy, počet párů pro párové testy nebo počet případů v jednotlivých skupinách (pro nezávislé výběry). 

Způsob zadávání

Většina procedur se zadává obdobným způsobem. Ukažme si to na příkladu dvouvýběrového T-testu. Dialogové okno zobrazíme pomocí nabídky Analyze, Power Analysis, Means, Independent-Samples T Test.

Chceme-li získat odhad velikosti výběrů tak, abychom dosáhli požadované síly testu při dané odchylce od nulové hypotézy, zvolíme Estimate sample sizečásti Test Assumptions, určíme požadovanou sílu (Power) a poměr velikosti výběru první a druhé skupiny (Group size ratio). Pro výpočet síly testu při daném rozsahu výběrů a ostatních parametrech, zvolíme Estimate power a zadáme počty pozorování v první a druhé skupině (Sample size for group 1… and group 2…).

Dále zadáme předpokládaný rozdíl středních hodnot ve skupinách (Population mean difference) nebo střední hodnoty v obou skupinách (Population mean for group 1… and group 2…).

Jestliže mají skupiny stejnou směrodatnou odchylku, označíme v části Population standard deviations are volbu Equal for two groups a zadáme směrodatnou odchylku (Pooled standard deviation). V opačném případě zvolíme Not equal for two groups a určíme směrodatné odchylky v obou skupinách (Standard deviation for group 1 … and group 2 …).

V části Test Direction určíme typ alternativní hypotézy:

  • Nondirectional (two-sided) analysis– oboustranná,
  • Directional (one-sided) analysis– jednostranná.

Hladinu významnosti testu nastavíme v poli Significance level.

Pomocí tlačítka Plot lze při odhadu síly testu (volba Estimate power v části Test Assumptions) zobrazit dvourozměrné nebo třírozměrné grafy síly vzhledem k různým charakteristikách včetně effect size

Effect size pro dvouvýběrový T-test se stejnými směrodatnými odchylkami ve skupinách je definovaná jako rozdíl středních hodnot ve skupinách dělený společnou směrodatnou odchylkou (v absolutní hodnotě při oboustranném testování). Pokud se směrodatné odchylky ve skupinách liší, je odklon od nulové hypotézy vyjádřen rozdílem středních hodnot. 

Příklad

Výzkumník plánuje porovnat průměrný reakční čas na určitý typ zvuku ve skupinách mužů a žen. Potřebuje odhadnout, jaký nejmenší počet subjektů by měl být v každé skupině (obě skupiny mají být stejně zastoupené) tak, aby byl schopen prokázat rozdíl ve skupinách alespoň 15 milisekund na hladině významnosti 5 %, se sílou testu 85 % a při oboustranné alternativní hypotéze. Odhad směrodatné odchylky na základě podobných studií je 55 milisekund (v obou skupinách stejný).

Zadání dialogu demonstruje následující obrázek:

Výstupy

Výstupem procedur je obvykle jednoduchá tabulka, která zobrazuje požadovaný odhad a shrnuje vstupní parametry. Při odhadu síly testu může být doplněna také grafy.

V tomto případě tabulka obsahuje odhad počtu případů ve skupinách (N1, N2), aktuálně odhadovanou sílu testu (Actual Power) a vstupní parametry: sílu testu (Power), směrodatnou odchylku ve skupinách (Std. Dev.), rozdíl středních hodnot ve skupinách dělený společnou směrodatnou odchylkou (Effect Size) a hladinu významnosti (Sig.).

Výzkumník tedy potřebuje v každé skupině alespoň 243 subjektů. V praxi je však třeba tento počet vždy mírně navýšit pro případ, že někteří účastníci výzkumu odpadnou, směrodatná odchylka bude reálně o něco větší apod.

Rádi byste se o statistice a analýze dat dozvěděli více? Chcete se stát mistrem ve svém oboru nebo si jen potřebujete doplnit znalosti? V ACREA nabízíme širokou nabídku kurzů pro váš profesní růst. Máte-li jiný dotaz. Nebojte se využít naši nezávaznou konzultaci, při které vám rádi zodpovíme všechny vaše dotazy a najdeme vhodné řešení.  

společnost ACREA
ACREA CR je českou analytickou společností s tradicí od roku 1998. Poskytuje analytické, statistické a dataminingové služby, školení a software z řady IBM SPSS a Predictive Solutions. Název firmy je zkratkou pro Analytical CREAtivity, která vyjadřuje, že každý analytický projekt je pro nás unikátní a ke každému přistupujeme individuálně.
Komentáře
  1. Příklad výpočtu síly testu napsal:

    Výborná funkce. Mohla by být do článku doplněn také výsledek opačné varianty, tj. výpočet síly testu již provedeného, spolu se zmíněným grafem? Dovedu si představit, že by se tato analýza prováděla automaticky u všech testů (asi bychom často zaplakali na výsledkem…).

    • info@acrea.cz napsal:

      Dobrý den, spojíme se s Vámi emailem a pošleme Vám ukázku výstupů, o které máte zájem. Článek již doplňovat nebudeme, byl by již příliš dlouhý.

  2. Sample Power napsal:

    Dobrý den, chápu tedy dobře, že nová verze IBM SPSS Statistics je doplněna v podstatě jen o program Sample Power, který máme nyní koupený zvlášť? Nebo je v nové verzi programu ještě něco navíc?
    Děkuji.

    • info@acrea.cz napsal:

      Dobrý den, Sample Power byl velmi dobrý program pro power analýzu, bohužel se ale již před nějakou dobou přestal vyvíjet a není ho možné nově zakoupit. Tato funkčnost je však nově ve verzi IBM SPSS Statistics. Nové procedury ale nejsou zcela totožné s původními v Sample Power – liší se způsob zadávání, výstupy i výběr testů, se kterými je možné pracovat. Pokud máte Sample Power, určitě ho nezahazujte a můžete ho dále využívat.

Přidat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Vaše osobní údaje budou použity pouze pro účely zpracování tohoto komentáře. Zásady zpracování osobních údajů