Příprava dat pro jejich analýzu - Blog společnosti ACREA

Procedury pro přípravu dat: optimální kategorizace

Ve třetím článku ze série o procedurách pro přípravu dat v IBM SPSS Statistics si představíme proceduru Optimal Binning, která umožňuje kategorizovat číselnou proměnnou optimálním způsobem vzhledem k cílové kategorizované proměnné. Ve verzi 27 je nově zařazená do základního modulu Base (dříve modul Data Preparation). K čemu je...

Celý článek

11.1. 2021společnost ACREA6156x0 Komentářů

Procedury pro přípravu dat: identifikace neobvyklých případů

V dalším článku ze série o procedurách pro přípravu dat v IBM SPSS Statistics si ukážeme, jak identifikovat neobvyklé případy v datech na základě jejich mnohorozměrného profilu. Důvodem pro vyhledávání neobvyklých případů je nejčastěji snaha nalézt chybné, podezřelé nebo problematické případy, které by mohly zkreslovat výsledky analýz....

Celý článek

28.12. 2020společnost ACREA5783x2 Komentáře

Procedury pro přípravu dat: kontrola a ověřování kvality dat

V sérii čtyř na sebe navazujících článků si postupně představíme nástroje pro přípravu dat, které jsou ve verzi IBM SPSS Statistics 27 nově zařazené do základního modulu Base (dříve modul Data Preparation) a jsou tak nyní dostupné širokému okruhu uživatelů. V tomto článku si podrobněji přiblížíme procedury...

Celý článek

14.12. 2020společnost ACREA4827x0 Komentářů

Jak velký má být můj výzkumný soubor?

Analytik resp. statistik dostává zřejmě nejčastěji otázky typu: Jak mohu zpracovat má data? Co mohu zjistit z mých dat? Případně dostává úkol: Zjistěte souvislost všeho se vším. Je nasnadě, že jde o nadlidský úkol, analytik/statistik nadto často věcně zkoumané oblasti nerozumí a v tom,...

Celý článek

30.11. 2020PhDr. Ing. Petr Soukup, Ph.D.9105x4 Komentáře

Chybějící hodnoty v IBM SPSS Statistics

IBM SPSS Statistics rozlišuje dva typy vynechaných hodnot (missing values): systémové (system missing) a uživatelem definované (user missing). Systémové vynechané hodnoty jsou u numerických proměnných reprezentovány prázdnou buňkou datové matice, v níž se zobrazuje symbolická tečka. Vynechané hodnoty textových proměnných (prázdné řetězce) jsou...

Celý článek

24.8. 2020společnost ACREA5914x0 Komentářů

Kategorie: Příprava dat

Procedury pro přípravu dat: optimální kategorizace

Procedury pro přípravu dat: identifikace neobvyklých případů

Procedury pro přípravu dat: kontrola a ověřování kvality dat

Jak velký má být můj výzkumný soubor?

Chybějící hodnoty v IBM SPSS Statistics

Nepropásněte další blogový článek