Košík je prázdný

Rozšírenie funkcionality IBM SPSS Statistics o procedúry PS – 2. část

30.11. 2022Ing. Stefan Kováč, PhD.2076x0 Komentářů

V tomto článku sa zameriame na zvyšné procedúry z ponuky Predictive solutions – Analyze, ktoré nám poskytnú informácie o mierach disparít, ďalej na ohodnotenie zhlukov vytvorených zoskupovacou analýzou a porovnávanie obsahu dvoch textových premenných.

Inequality measures

Procedúra počíta Lorenzovu krivku znázorňujúcu percentuálny podiel ľudí na celkovom bohatstve. Lorenzova krivka je známy nástroj pre grafické znázornenie nerovnomerného bohatstva v spoločnosti. Výstupom procedúry je vykreslenie grafu Lorenzovej krivky pre navolené skupiny a taktiež tabuľka s vybranými indexami nerovností.

Cluster evaluation

Procedúra slúži k ohodnoteniu zhlukov vytvorených zoskupovacou analýzou. Procedúra umožňuje uložiť do dátovej matice hodnotu siluety pre každé pozorovanie, hodnotu vzdialenosti pozorovania od stredu zhluku a identifikátora najbližšieho zhluku.

Hodnota koeficientu siluety sa pohybuje v intervale (-1, 1). Čím je hodnota koeficientu bližšia k jednej, tým lepšia je kvalita triedenia. Vo všeobecnosti platí, že hodnota väčšia ako 0,5 znamená dobré triedenie dát.

Výstupom procedúry sú viaceré objekty:

Silhouette mean – hodnota siluety (graf s celkovou hodnotou siluety)
Descriptive statistics for Silhouette – popisné štatistiky pre hodnoty siluety
Distribution of Silhouette values by cluster – rozdelenie hodnôt siluety v jednotlivých klastroch
Distances between clusters centroids – vzdialenosti medzi centroidmi klastrov
The distance between case and cluster centroid – vzdialenosť medzi prípadom a centroidom klastra

Compare text

Procedúra porovnáva obsah dvoch textových premenných a umožňuje uložiť skóre a ich podobnosť do dátovej matice a poskytuje nasledujúce miery pre textové premenné:

Jaro Distance
Jaro-Winkler Distance
Hamming Distance
Levenshtein Distance
Optimal Streing Alignment
Needleman-Wunsch
Longest Common Substring

Score

Pridá hodnotenie vzdialenosti medzi analyzovanými textami pre všetky vybrané miery vzdialenosti. Napríklad pre miery Hamming, Levenshtein a Optimal String Alignment sa jedná o počet odlišných znakov. Naopak u Jaro a Jaro-Winkler ide o počet zhodných znakov. Novo pridané premenné majú príponu _scr.

Similarity

Pridá normalizované hodnoty podobnosti (v intervale 0 – 1). Čím bližšia bude hodnota k jednej, tým viacej sú si porovnávané reťazce podobné. Novo pridané premenné majú príponu _sim.

Procedúra vyžaduje k analýze dve textové premenné a z ponuky mier vzdialenosti musí byť vybraná aspoň jedna možnosť a aspoň jeden typ premennej zo sekcie Add variables. Ako už býva zvykom, všetky predstavené procedúry majú vlastnú syntax a help.

Ing. Stefan Kováč, PhD.

lektor, analytik a odborný konzultant ve společnosti ACREA. Ve své profesní kariéře se zabývá analytickou činností v oblasti statistiky, data miningu, reportování dat a své odborné zkušenosti využívá také v lektorské činnosti. Podílí se na odborné konzultační činnosti pro oblast aplikace a využití softwarových řízení v malých a středních podnicích.

Komentáře

Přidat komentář Zrušit odpověď

Tato stránka používá cookies

Na stránkách používáme soubory cookies. Některé jsou nezbytné pro fungování stránek, jiné nám umožňují poskytnout vám lepší zkušenost při návštěvě našich stránek nebo zobrazování reklamy, pomáhají nám analyzovat návštěvnost a stránky zlepšovat. Více informací

Nastavení cookies Přijmout vše

Souhlas s používáním cookies

Cookies jsou malé soubory, které se dočasně ukládají ve vašem počítači a pomáhají nám k lepší uživatelské zkušenosti na našich stránkách. Cookies používáme k personalizaci obsahu stránek a reklam, poskytování funkcí sociálních sítí a k analýze návštěvnosti. Informace o vašem používání našich stránek také sdílíme s našimi partnery v oblasti sociálních sítí, reklamy a analýzy, kteří je mohou kombinovat s dalšími informacemi, které jste jim poskytli nebo které shromáždili při vašem používání jejich služeb.

Ze zákona můžeme na vašem zařízení ukládat pouze soubory cookie, které jsou nezbytně nutné pro provoz těchto stránek. Pro všechny ostatní typy souborů cookie potřebujeme vaše svolení. Budeme vděční, když nám ho poskytnete a pomůžete nám tak, naše stránky a služby zlepšovat. Svůj souhlas s používáním cookies na našem webu můžete samozřejmě kdykoliv změnit nebo odvolat. Více informací

Jednotlivé souhlasy

Nezbytné - aby stránky fungovaly, jak mají.

Nezbytné soubory cookie pomáhají učinit webové stránky použitelnými tím, že umožňují základní funkce, jako je navigace na stránce a přístup k zabezpečeným oblastem webové stránky. Bez těchto souborů cookie nemůže web správně fungovat.

Preferenční - abychom si pamatovali vaše preference.

Preferenční cookies umožňují, aby si stránka pamatovala informace, které upravují, jak se stránka chová nebo vypadá. Např. vaše přihlášení, obsah košíku, zemi, ze které stránku navštěvujete.

Statistické - abychom věděli, co na webu děláte a co zlepšit.

Statistické cookies pomáhají provozovateli stránek pochopit, jak návštěvníci stránek stránku používají, aby mohl stránky optimalizovat a nabídnout jim lepší zkušenost. Veškerá data se sbírají anonymně a není možné je spojit s konkrétní osobou.

Marketingové - abychom vám ukazovali pouze relevantní reklamu.

Marketingové cookies se používají ke sledování pohybu návštěvníků napříč webovými stránkami s cílem zobrazovat jim pouze takovou reklamu, která je pro daného člověka relevantní a užitečná. Veškerá data se sbírají a používají anonymně a není možné je spojit s konkrétní osobou.

Uložit nastavení

Přijmout vše

Rozšírenie funkcionality IBM SPSS Statistics o procedúry PS – 2. část

Přidat komentář Zrušit odpověď

Nepropásněte další blogový článek