Rozšírenie funkcionality IBM SPSS Statistics o procedúry PS

Sériou viacerých článkov si predstavíme vybrané procedúry zo softvérového riešenia PS IMAGO PRO od spoločnosti Predictive Solutions, ktoré rozširuje funkcionalitu IBM SPSS Statistics o ďalších 57 procedúr na prípravu dát, transformáciu dát, analýzu a hlavne vizualizáciu výsledkov.

V tomto článku sa zameriame na vybrané procedúry z ponuky Predictive Solutions – Analyze, ktoré nám poskytnú jednoducho a rýchlo cenné informácie o analyzovaných premenných, a to konkrétne významné prediktory z hľadiska asociácie vo vzťahu k závislej premennej.  

Cramer`s correlated variables

Cramerovo V je jeden z koeficientov mier asociácie medzi kategorizovanými premennými. Výstupom procedúry je tabuľka s uvedenými hodnotami Cramerovho V a signifikancií nezávislých premenných nominálnych alebo ordinálnych vo vzťahu k vybranej kategorizovanej závislej premennej. Procedúra poskytuje aj grafické zobrazenie pomocou ktorého sme schopní rozpoznať signifikantné premenné – sfarbené na modro – a ktoré sa viacej hodia na reportovanie výsledkov.

Tento postup je užitočný pri analýze dát. Dá sa použiť na rýchle overenie úrovne asociácie pre množinu nezávislých premenných s vybranou závislou premennou a poskytuje prostriedky na lepšie pochopenie ich vzťahov.

Significant variables Chi-square

Procedúra sa používa k zisteniu a zobrazeniu hladiny významnosti pre skupinu nezávislých kategorických premenných a závislou kategorizovanou premennou. Výsledkom postupu je tabuľka s hladinami významnosti testu nezávislosti chí-kvadrát pre nezávislé premenné merané na nominálnej a ordinálnej úrovni vo vzťahu k vybranej závislej premennej. Vo výstupnej tabuľke je okrem hodnoty signifikancie označené pomocou Yes/No, ktoré veličiny signifikantne ovplyvňujú závislú premennú a ktoré ju neovplyvňujú.

Tento postup je užitočný pri analýze dát. Dá sa použiť na rýchle overenie hladín významnosti súboru nezávislých premenných vo vzťahu k vybranej závisle premennej a poskytuje prostriedky na lepšie pochopenie ich vzťahov.

Significant variables CHAID

Procedúra slúži k identifikácie a zobrazeniu premenných, ktoré majú signifikantný vplyv na závislú kategorickú premennú. V tomto prípade nezávislé premenné môžu byť tak číselné ako aj kategorické. Procedúra pomocou algoritmu CHAID z modulu Decision Tree kategorizuje číselné premenné a rekategorizuje kategorické premenné. Rekategorizované premenné je možné uložiť do dátovej matice ako nové premenné s pôvodným menom a príponou _opt a taktiež vygenerovať syntax s novo vytvorenými názvami kategórii. Výstupom procedúry sú dve tabuľky, ktoré obsahujú iba tie premenné, ktoré majú signifikantný vplyv na závislú premennú určené na základe hodnoty signifikancie Chí-kvadrát testu. Prvá tabuľka obsahuje prehľad signifikantných veličín, ich kategórie, príslušné predikované kategórie závislej premennej a percentuálne zastúpenie pozorovaní v kategóriách závisle premennej. Druhá tabuľka obsahuje základné výstupy Chí-kvadrát testu. Procedúra vyžaduje mať aktivovaný doplnkový modul Decision Trees.

Všetky predstavené procedúry majú vlastnú syntax a help.

V ďalšej časti si predstavíme zvyšné procedúry z ponuky Predictive Solutions – Analyze, ktoré rozširujú funkcionalitu IBM SPSS Statistics.

Ing. Stefan Kováč, PhD.
lektor, analytik a odborný konzultant ve společnosti ACREA. Ve své profesní kariéře se zabývá analytickou činností v oblasti statistiky, data miningu, reportování dat a své odborné zkušenosti využívá také v lektorské činnosti. Podílí se na odborné konzultační činnosti pro oblast aplikace a využití softwarových řízení v malých a středních podnicích.
Komentáře

Přidat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Vaše osobní údaje budou použity pouze pro účely zpracování tohoto komentáře. Zásady zpracování osobních údajů