Sériou viacerých článkov si predstavíme vybrané procedúry zo softvérového riešenia PS IMAGO PRO od spoločnosti Predictive Solutions, ktoré rozširuje funkcionalitu IBM SPSS Statistics o ďalších 57 procedúr na prípravu dát, transformáciu dát, analýzu a hlavne vizualizáciu výsledkov.
V tomto článku sa zameriame na vybrané procedúry z ponuky Predictive Solutions – Analyze, ktoré nám poskytnú jednoducho a rýchlo cenné informácie o analyzovaných premenných, a to konkrétne významné prediktory z hľadiska asociácie vo vzťahu k závislej premennej.
Cramer`s correlated variables
Cramerovo V je jeden z koeficientov mier asociácie medzi kategorizovanými premennými. Výstupom procedúry je tabuľka s uvedenými hodnotami Cramerovho V a signifikancií nezávislých premenných nominálnych alebo ordinálnych vo vzťahu k vybranej kategorizovanej závislej premennej. Procedúra poskytuje aj grafické zobrazenie pomocou ktorého sme schopní rozpoznať signifikantné premenné – sfarbené na modro – a ktoré sa viacej hodia na reportovanie výsledkov.
Tento postup je užitočný pri analýze dát. Dá sa použiť na rýchle overenie úrovne asociácie pre množinu nezávislých premenných s vybranou závislou premennou a poskytuje prostriedky na lepšie pochopenie ich vzťahov.
Significant variables Chi-square
Procedúra sa používa k zisteniu a zobrazeniu hladiny významnosti pre skupinu nezávislých kategorických premenných a závislou kategorizovanou premennou. Výsledkom postupu je tabuľka s hladinami významnosti testu nezávislosti chí-kvadrát pre nezávislé premenné merané na nominálnej a ordinálnej úrovni vo vzťahu k vybranej závislej premennej. Vo výstupnej tabuľke je okrem hodnoty signifikancie označené pomocou Yes/No, ktoré veličiny signifikantne ovplyvňujú závislú premennú a ktoré ju neovplyvňujú.
Tento postup je užitočný pri analýze dát. Dá sa použiť na rýchle overenie hladín významnosti súboru nezávislých premenných vo vzťahu k vybranej závisle premennej a poskytuje prostriedky na lepšie pochopenie ich vzťahov.
Significant variables CHAID
Procedúra slúži k identifikácie a zobrazeniu premenných, ktoré majú signifikantný vplyv na závislú kategorickú premennú. V tomto prípade nezávislé premenné môžu byť tak číselné ako aj kategorické. Procedúra pomocou algoritmu CHAID z modulu Decision Tree kategorizuje číselné premenné a rekategorizuje kategorické premenné. Rekategorizované premenné je možné uložiť do dátovej matice ako nové premenné s pôvodným menom a príponou _opt a taktiež vygenerovať syntax s novo vytvorenými názvami kategórii. Výstupom procedúry sú dve tabuľky, ktoré obsahujú iba tie premenné, ktoré majú signifikantný vplyv na závislú premennú určené na základe hodnoty signifikancie Chí-kvadrát testu. Prvá tabuľka obsahuje prehľad signifikantných veličín, ich kategórie, príslušné predikované kategórie závislej premennej a percentuálne zastúpenie pozorovaní v kategóriách závisle premennej. Druhá tabuľka obsahuje základné výstupy Chí-kvadrát testu. Procedúra vyžaduje mať aktivovaný doplnkový modul Decision Trees.
Všetky predstavené procedúry majú vlastnú syntax a help.
V ďalšej časti si predstavíme zvyšné procedúry z ponuky Predictive Solutions – Analyze, ktoré rozširujú funkcionalitu IBM SPSS Statistics.