Víte, co je to faktorová analýza a jak se liší explorační a konfirmační přístup?

Faktorová analýza je oblíbená statistická metoda, která nachází široké uplatnění nejen ve společenských vědách (v psychometrii, sociologii, pedagogickém výzkumu i v mnoha dalších oborech), ale také tam, kde je třeba nejprve redukovat dimenzi problému před užitím jiných metod. V tomto článku si přiblížíme podstatu faktorové analýzy, vysvětlíme si, jaké dva základní přístupy rozlišujeme i v jakých situacích který z nich použít.

Faktorová analýza

Cílem faktorové analýzy je vysvětlit korelační strukturu skupiny pozorovaných (manifestních) proměnných na základě menšího počtu neznámých (neměřitelných) latentních faktorů. Do analýzy tedy vstupuje skupina vzájemně korelovaných manifestních proměnných. Předpokládáme však, že zjištěné korelace nejsou způsobené přímými vztahy mezi nimi, ale skrytými faktory, které na tyto proměnné působí. Vstupem do faktorové analýzy však může být i přímo korelační nebo kovarianční matice manifestních proměnných. Nejčastěji se užívá Pearsonův lineární korelační koeficient, lze ale pracovat i s jinými typy korelačních koeficientů.

Model faktorové analýzy se snaží vyjádřit manifestní proměnné jako lineární kombinace faktorů. Vzhledem k tomu, že faktorů je ale standardně méně, dochází ke zjednodušení a redukci informace v datech. Model vysvětluje manifestní proměnné s určitou chybou (podobně jako například lineární regrese).

Hlavním důvodem oblíbenosti faktorové analýzy v oblasti společenských věd je, že umožňuje pracovat s teoretickými koncepty, které se přímo měřit nedají (znalosti, schopnosti, rysy osobnosti apod.), prostřednictvím manifestních proměnných a faktorového modelu však lze odhadnout jejich hodnoty. Na druhou stranu se této metodě někdy vytýká značná míra subjektivity, například při interpretaci faktorů.

Ve faktorové analýze rozlišujeme dva základní přístupy – explorační a konfirmační. Explorační faktorová analýza (EFA) nevychází z žádné počáteční představy o počtu faktorů ani o vztazích mezi manifestními proměnnými a faktory. Jejím cílem je nalézt neznámé latentní faktory tak, aby co nejlépe odpovídaly korelační struktuře dat. Konfirmační faktorová analýza (CFA) naproti tomu vychází z konkrétní představy (modelu), jak by tyto vztahy měly vypadat, a na základě dat se ji snaží potvrdit nebo vyvrátit.

Explorační faktorová analýza

Historicky starší je explorační faktorová analýza, která původně vznikla v psychologii (Charles Spearman, 1904), v současnosti má však široké uplatnění i v mnoha dalších oblastech. Jejím cílem je nalézt neznámé latentní faktory, výzkumník však předem nespecifikuje žádnou apriorní představu o jejich počtu ani o vztazích mezi manifestními proměnnými a faktory. Díky těmto faktorům lze potom redukovat počet proměnných při zachování maxima informace v datech. Často se také přidává požadavek, aby výsledné faktory byly navzájem nekorelované. Z toho důvodu je explorační faktorová analýza oblíbená i v situacích, kdy je třeba snížit dimenzi úlohy a nahradit velký počet korelovaných proměnných menším počtem navzájem nezávislých faktorů (například před užitím seskupovací analýzy, nebo při silné multikolinearitě v lineární regresi).

Explorační faktorová analýza nabízí široký výběr metod extrakce faktorů (hlavní komponenty, maximální věrohodnost, hlavní osy, nevážené nejmenší čtverce, zobecněné nejmenší čtverce a další). Mezi základní otázky a problémy, které metoda řeší, patří volba optimálního počtu faktorůrotace faktorů z důvodu snazší interpretace, interpretace faktorů na základě vztahů s původními proměnnými, odhad faktorových skórů či jejich následná analýza. 

Explorační faktorovou analýzu nabízí většina běžně dostupného statistického softwaru, například IBM SPSS Statistics je součástí základního modulu Base. Pokud se chcete o této metodě dozvědět více a vše si vyzkoušet na praktických úlohách za pomoci softwaru IBM SPSS Statisticsrádi bychom Vás pozvali na kurz Faktorová analýza. Pro jeho úspěšné absolvování stačí základní znalosti statistiky (včetně korelací a porozumění principu testování statistických hypotéz).

Konfirmační faktorová analýza

Konfirmační faktorová analýza (Karl Gustav Jöreskog, 1969) patří do metodologie strukturního modelování. Jejím cílem je ověřit (otestovat) určitou apriorní (předem danou) představu o faktorovém modelu vztahů. Výzkumník tedy má již na začátku konkrétní představu o tom, jak by měl model vypadat, a na základě dat se ji snaží potvrdit nebo vyvrátit. Konfirmační faktorová analýza má velký význam ve společenských vědách při ověřování, zda je očekávání, jak měřené proměnné odrážejí určitý teoretický koncept, v souladu s daty. Testovaný model přitom obvykle vychází z teorie i dřívějších výzkumů. 

Pro užití konfirmační faktorové analýzy je nutné mít k dispozici specializovaný software zaměřený na strukturní modelování, například IBM SPSS Amos. Pokud byste se chtěli hlouběji seznámit nejen s konfirmační faktorovou analýzou, ale i s celou touto metodologií, můžeme Vám nabídnout kurz Modelování statistických vztahů – IBM SPSS Amos. V tomto případě je však třeba počítat s tím, že se jedná o poměrně pokročilé statistické téma. Pro úspěšné absolvování kurzu je nutné mít dobré statistické základy včetně znalosti korelací, kovariancí a lineární regrese, výhodou je ale i zkušenost s explorační faktorovou analýzou.

společnost ACREA
ACREA CR je českou analytickou společností s tradicí od roku 1998. Poskytuje analytické, statistické a dataminingové služby, školení a software z řady IBM SPSS a Predictive Solutions. Název firmy je zkratkou pro Analytical CREAtivity, která vyjadřuje, že každý analytický projekt je pro nás unikátní a ke každému přistupujeme individuálně.
Komentáře

Přidat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Vaše osobní údaje budou použity pouze pro účely zpracování tohoto komentáře. Zásady zpracování osobních údajů