fbpx

Kategorie: Analýza dat

Procedury pro přípravu dat: identifikace neobvyklých případů

V dalším článku ze série o procedurách pro přípravu dat v IBM SPSS Statistics si ukážeme, jak identifikovat neobvyklé případy v datech na základě jejich mnohorozměrného profilu. Důvodem pro vyhledávání neobvyklých případů je nejčastěji snaha nalézt chybné, podezřelé nebo problematické případy, které by mohly zkreslovat...

Celý článek

Jak velký má být můj výzkumný soubor?

Analytik resp. statistik dostává zřejmě nejčastěji otázky typu: Jak mohu zpracovat má data? Co mohu zjistit z mých dat? Případně dostává úkol: Zjistěte souvislost všeho se vším. Je nasnadě, že jde o nadlidský úkol, analytik/statistik nadto často věcně zkoumané oblasti nerozumí a v tom,...

Celý článek

Jednoduchá předpověď vývoje počtu nakažených a mrtvých

Sledujeme-li vývoj počtu nakažených a mrtvých během druhé vlny koronavirové epidemie, snadno zjistíme, že když pomineme pravidelné týdenní oscilace, počty rostou čím dál rychleji[1]. Ovlivnila vývoj epidemiologická opatření? Kdy a na jaké hodnotě se počty nakažených a mrtvých zastaví? Budeme-li počty v druhé vlně...

Celý článek

Kategorizácia číselných premenných v IBM SPSS Modeler

Proces kategorizácie spočíva v tvorbe nových premenných založených na zoskupení hodnôt existujúcich premenných do kategórií.  Kategorizáciu môžeme použiť pri spojitej premennej, kedy vytvoríme novú premennú, ktorá obsahuje intervaly spojitej premennej alebo pri zoskupení väčšieho množstva ordinálnych kategórií  do menších súborov kategórií.  Proces kategorizácie budeme...

Celý článek

Chybějící hodnoty v IBM SPSS Statistics

IBM SPSS Statistics rozlišuje dva typy vynechaných hodnot (missing values): systémové (system missing) a uživatelem definované (user missing). Systémové vynechané hodnoty jsou u numerických proměnných reprezentovány prázdnou buňkou datové matice, v níž se zobrazuje symbolická tečka. Vynechané hodnoty textových proměnných (prázdné řetězce) jsou...

Celý článek

Testovanie závislosti sentimentu filmového komentára a počtu hviezdičiek

V predchádzajúcom článku sme si predstavili štandardné výstupy z analýzy sentimentu na dátach filmových komentárov priradených užívateľmi k jednotlivým filmom na webovej stránke www.csfd.cz. Z analýzy sentimentu je vidieť, že máme už k dispozícii viacero premenných (číselné aj kategorickú), ktoré vypovedajú o sentimente komentára a môžeme tak prejsť k overovaniu...

Celý článek

Analýza sentimentu filmových komentárov

Webové stránky zamerané na databázu filmov, napríklad www.csfd.cz (Česko-Slovenská filmová databáze) alebo www.imdb.com (Internet Movie Database), umožňujú svojim užívateľom pridať k filmu ich hodnotenie v podobe komentára a počtu hviezdičiek. Zamýšľali ste sa niekedy nad tým, že či tieto dve hodnotenia medzi sebou aj...

Celý článek