Blog

Přinášíme vám články, tipy a rady z oblasti analýzy dat a datové vědy.

Zaměřujeme se zejména na témata sběru dat, přípravy dat pro jejich následnou analýzu, vysvětlení užití jednotlivých statistických a dataminingových metod i ovládání softwaru IBM SPSS, Power BI či programování v jazyce R, Python a dalších.

Procedury pro přípravu dat: optimální kategorizace

Ve třetím článku ze série o procedurách pro přípravu dat v IBM SPSS Statistics si představíme proceduru Optimal Binning, která umožňuje kategorizovat číselnou proměnnou optimálním způsobem vzhledem k cílové kategorizované proměnné. Ve verzi 27 je nově zařazená do základního modulu Base (dříve modul Data Preparation)....

Celý článek

Procedury pro přípravu dat: identifikace neobvyklých případů

V dalším článku ze série o procedurách pro přípravu dat v IBM SPSS Statistics si ukážeme, jak identifikovat neobvyklé případy v datech na základě jejich mnohorozměrného profilu. Důvodem pro vyhledávání neobvyklých případů je nejčastěji snaha nalézt chybné, podezřelé nebo problematické případy, které by mohly zkreslovat...

Celý článek

Procedury pro přípravu dat: kontrola a ověřování kvality dat

V sérii čtyř na sebe navazujících článků si postupně představíme nástroje pro přípravu dat, které jsou ve verzi IBM SPSS Statistics 27 nově zařazené do základního modulu Base (dříve modul Data Preparation) a jsou tak nyní dostupné širokému okruhu uživatelů. V tomto článku si podrobněji...

Celý článek

Jak velký má být můj výzkumný soubor?

Analytik resp. statistik dostává zřejmě nejčastěji otázky typu: Jak mohu zpracovat má data? Co mohu zjistit z mých dat? Případně dostává úkol: Zjistěte souvislost všeho se vším. Je nasnadě, že jde o nadlidský úkol, analytik/statistik nadto často věcně zkoumané oblasti nerozumí a v tom,...

Celý článek

Nastavení desetinného oddělovače v IBM SPSS Statistics

Každé jazykové prostředí má svá specifika týkající se jednak písmen, ale i způsobu psaní čísel. Čeština disponuje mnoha různými znaky, např. ščřáíéů, které se v jiných jazycích nevyskytují a pro psaní čísel používá jako desetinný oddělovač čárku. S těmito odlišnostmi jednotlivých jazyků se počítače,...

Celý článek