fbpx

Blog

Přinášíme vám články, tipy a rady z oblasti analýzy dat.

Procedury pro přípravu dat: optimální kategorizace

Ve třetím článku ze série o procedurách pro přípravu dat v IBM SPSS Statistics si představíme proceduru Optimal Binning, která umožňuje kategorizovat číselnou proměnnou optimálním způsobem vzhledem k cílové kategorizované proměnné. Ve verzi 27 je nově zařazená do základního modulu Base (dříve modul Data Preparation)....

Celý článek

Procedury pro přípravu dat: identifikace neobvyklých případů

V dalším článku ze série o procedurách pro přípravu dat v IBM SPSS Statistics si ukážeme, jak identifikovat neobvyklé případy v datech na základě jejich mnohorozměrného profilu. Důvodem pro vyhledávání neobvyklých případů je nejčastěji snaha nalézt chybné, podezřelé nebo problematické případy, které by mohly zkreslovat...

Celý článek

Procedury pro přípravu dat: kontrola a ověřování kvality dat

V sérii čtyř na sebe navazujících článků si postupně představíme nástroje pro přípravu dat, které jsou ve verzi IBM SPSS Statistics 27 nově zařazené do základního modulu Base (dříve modul Data Preparation) a jsou tak nyní dostupné širokému okruhu uživatelů. V tomto článku si podrobněji...

Celý článek

Jak velký má být můj výzkumný soubor?

Analytik resp. statistik dostává zřejmě nejčastěji otázky typu: Jak mohu zpracovat má data? Co mohu zjistit z mých dat? Případně dostává úkol: Zjistěte souvislost všeho se vším. Je nasnadě, že jde o nadlidský úkol, analytik/statistik nadto často věcně zkoumané oblasti nerozumí a v tom,...

Celý článek

Nastavení desetinného oddělovače v IBM SPSS Statistics

Každé jazykové prostředí má svá specifika týkající se jednak písmen, ale i způsobu psaní čísel. Čeština disponuje mnoha různými znaky, např. ščřáíéů, které se v jiných jazycích nevyskytují a pro psaní čísel používá jako desetinný oddělovač čárku. S těmito odlišnostmi jednotlivých jazyků se počítače,...

Celý článek

Jednoduchá předpověď vývoje počtu nakažených a mrtvých

Sledujeme-li vývoj počtu nakažených a mrtvých během druhé vlny koronavirové epidemie, snadno zjistíme, že když pomineme pravidelné týdenní oscilace, počty rostou čím dál rychleji[1]. Ovlivnila vývoj epidemiologická opatření? Kdy a na jaké hodnotě se počty nakažených a mrtvých zastaví? Budeme-li počty v druhé vlně...

Celý článek

Bootstrapping – aneb jak souvisí statistika s řemínky na botách

Jednou ze změn ve verzi IBM SPSS Statistics 27 je zařazení nástrojů původního modulu Bootstrapping do základního modulu Base. Díky tomu jsou nyní dostupné mnohem širšímu okruhu uživatelů. V dialogovém okně celé řady standardních statistických procedur je k dispozici tlačítko Bootstrap, pomocí něhož lze zadat výpočet robustních odhadů standardních chyb...

Celý článek