Analýza reliability (česky také analýza spolehlivosti) představuje ve statistice klíčový nástroj pro hodnocení konzistence a přesnosti měření. Reliabilita (spolehlivost) měření je jedním ze základních aspektů vypovídajících o kvalitě dat. Vyjadřuje přesnost měření té vlastnosti, kterou ve skutečnosti měříme. Jedná se o schopnost zopakovat za stejných podmínek stejné výsledky měření. Reliabilitu nelze v praxi zjišťovat přímo, pouze odhadovat. Pro její odhad vždy potřebujeme opakovaná měření téhož, tzv. paralelní měření (opakování stejného dotazu po jisté době, položení obsahově ekvivalentní otázky, řešení stejně obtížné položky v testu apod.). Odhadové postupy jsou založeny na zjišťování variability a souběhu variabilit jednotlivých měření. Přitom je však třeba zajistit splnění základních předpokladů paralelních měření, především nezávislosti chyb.
Důležitou vlastností reliability je možnost jejího podstatného zlepšení v případě opakovaného dotazu na totéž. Náhodná chyba se při spojení více měření podstatně eliminuje. Součtové nebo průměrové indexy se konstruují z položek, které by v optimálním případě měly měřit stejnou vlastnost zkoumaného objektu a být vzájemně konzistentní. Posouzení, nakolik je tento požadavek splněn, je úkolem analýzy reliability. Přitom je však nutné, aby škály všech položek byly orientovány jedním směrem (například při hodnocení spokojenosti na stupnici od 1 do 5 nesmí u jedné z proměnných vyjadřovat jednička nejlepší hodnocení, zatímco u jiné nejhorší).
Ve statistice se reliabilita obvykle rozlišuje podle toho, jaký typ měření či konstrukce je analyzován. Mezi nejčastější formy analýzy reliability patří:
1. Test–retest reliabilita
Test–retest metoda hodnotí stabilitu měření v čase. Stejný test nebo nástroj je aplikován na stejný vzorek respondentů ve dvou (či více) časových bodech. Vysoký korelační koeficient mezi výsledky z obou měření naznačuje, že nástroj je stabilní a spolehlivý.
2. Vnitřní konzistence (internal consistency)
Zaobíra se otázkou jak dobře spolu různé položky v rámci měření (například dotazníku nebo testu) souvisejí a jak konzistentně měří stejný konstrukt. Je to míra toho, jak dobře položky „doplňují“ a zda měří stejný základní koncept. Existuje několik nástrojů pro měření vnitřní konzistence: Cronbachovo alfa, Split half test, Guttmanovo λ , McDonaldovo ω a další.
Jedná se o techniku, při níž je test rozdělen na dvě poloviny (např. sudé a liché položky), které jsou vzájemně porovnány. Pokud obě poloviny vedou ke srovnatelným výsledkům, je nástroj považován za reliabilní.
Čím blíže je jeho hodnota jedné, tím konzistentnější jsou položky. Cronbachovo α blízké nule nebo záporné naopak signalizuje zcela nekonzistentní množinu proměnných. Je však třeba vzít v úvahu také skutečnost, že hodnota koeficientu se zvyšuje s rostoucím počtem položek
3. Reliabilita mezi hodnotiteli (interrater reliability)
Je mírou konzistence a shody mezi dvěma nebo více hodnotiteli nebo pozorovateli v jejich hodnocení konkrétního jevu nebo chování. Jinými slovy, IRR se vztahuje k míře, do jaké různí hodnotitelé nebo pozorovatelé dosahují podobných nebo konzistentních výsledků při hodnocení téže věci.
IRR lze vyjádřit jako procentuální shodu (počet skóre shody / celkový počet skóre). Lze ji také měřit pomocí statistických metod, jako je Cohenův kappa koeficient, koeficient vnitrotřídní korelace (ICC) nebo Fleissův kappa, které berou v úvahu počet hodnotitelů, počet hodnocených kategorií nebo proměnných a míru shody mezi hodnotiteli.
Shrnme si tedy jaké nástroje můžeme ve statistice využít při měření reliability:
Je důležité poznamenat, že žádný z těchto koeficientů neposkytuje absolutní odpověď – každý má své předpoklady a omezení.
Reliabilita bývá často zaměňována s validitou, avšak jde o dva odlišné koncepty. Reliabilita říká, jak konzistentně nástroj měří, zatímco validita určuje, zda měří to, co skutečně měřit má. Měření může být vysoce reliabilní, ale nízké validity – například pokud dotazník o úzkosti konzistentně měří spíše obecnou nervozitu.
Zjišťování reliability je nezbytnou součástí výzkumné praxe ve všech oblastech a oborech činnosti, kde jsou využívány jakékoliv typy testů nebo dotazníků – v sociologii, psychologii, výzkumu veřejného mínění, marketingu, zdravotnictví, školství, státní správě a administrativě apod. Při předkládání nového měřícího prostředku uživateli by měla být dokumentace reliability nutnou podmínkou.
V SPSS se Cronbachovo alfa vypočítá takto:
Výstup vypadá následovně:
Celková reliabilita škály je vysoká (0.912). Do výpočtu vstoupilo 5 položek.
V případě, že bychom vynechali druhou položku hodnotu alpha bychom mohli mírně zvýšit na 0.923 (Cronbachs alpha if item deleted).
Součtový (nebo průměrový) index pěti položek IOC má vysokou reliabilitu – s 95% spolehlivostí leží v intervalu mezi 0.671 a 0.990 (Average Measures, 95% Confidence Interval). Single Measure Intraclass Correlation vyjadřuje reliabilitu odpovídající situaci, kdy by byla užita pouze jedna položka. Obecně bývá nižší než reliabilita indexu, který vychází ze součtu nebo průměru více položek.
Nejprve je potřeba nainstalovat a načíst balíček:
Interpretace: Celková reliabilita škály je vysoká (0.91). Pokud by byla položka 2 odstraněna, reliabilita by mírně vzrostla – tedy může být kandidátem na úpravu.
Pokud chcete výsledky doplnit o vizualizaci, můžete např. vykreslit korelační matici mezi položkami:
Tímto příkazem získáte korelační mapu mezi jednotlivými položkami, která vizuálně ukazuje, zda spolu korelují tak, jak by u reliabilní škály měly.
Guttmanovy dolní meze (Guttman’s lower bounds) představují šest různých statistik Λ1 … Λ6 navržených jako dolní odhady reliability. První odhad Λ1 je základem pro výpočet většiny následujících.
Paralelní a přísně paralelní model (Parallel, Strictly Parallel) testují hypotézu, že položky mají stejný rozptyl (paralelní model) resp. stejný rozptyl i aritmetický průměr (přísně paralelní model). Ačkoliv jsou předpoklady těchto modelů splněny spíše výjimečně, jsou tyto případy velmi cenné, neboť poskytují odhady variability, které v ostatních situacích nejsou k dispozici.
Rádi byste se o statistice a analýze dat dozvěděli více? Chcete se stát mistrem ve svém oboru nebo si jen potřebujete doplnit znalosti? V ACREA nabízíme širokou nabídku kurzů pro váš profesní růst. Máte-li jiný dotaz. Nebojte se využít naši nezávaznou konzultaci, při které vám rádi zodpovíme všechny vaše dotazy a najdeme vhodné řešení.