fbpx

Kategorie: Analýza dat

Analýza sociální sítě aktérů korupčního skandálu ve fotbale

Nejsledovanějším sportem v Česku je nepochybně fotbal. Točí se tu velké peníze, a proto se s fotbalem pojí nejedna aféra. V aférách bývá zapleteno mnoho lidí a organizací a udělat si obrázek o tom, kdo s kým spolupracoval, nebývá snadné. Podívejme se na vztahy aktérů jedné z posledních afér, kdy...

Celý článek

Procedury pro přípravu dat: identifikace neobvyklých případů

V dalším článku ze série o procedurách pro přípravu dat v IBM SPSS Statistics si ukážeme, jak identifikovat neobvyklé případy v datech na základě jejich mnohorozměrného profilu. Důvodem pro vyhledávání neobvyklých případů je nejčastěji snaha nalézt chybné, podezřelé nebo problematické případy, které by mohly zkreslovat...

Celý článek

Jak velký má být můj výzkumný soubor?

Analytik resp. statistik dostává zřejmě nejčastěji otázky typu: Jak mohu zpracovat má data? Co mohu zjistit z mých dat? Případně dostává úkol: Zjistěte souvislost všeho se vším. Je nasnadě, že jde o nadlidský úkol, analytik/statistik nadto často věcně zkoumané oblasti nerozumí a v tom,...

Celý článek

Jednoduchá předpověď vývoje počtu nakažených a mrtvých

Sledujeme-li vývoj počtu nakažených a mrtvých během druhé vlny koronavirové epidemie, snadno zjistíme, že když pomineme pravidelné týdenní oscilace, počty rostou čím dál rychleji[1]. Ovlivnila vývoj epidemiologická opatření? Kdy a na jaké hodnotě se počty nakažených a mrtvých zastaví? Budeme-li počty v druhé vlně...

Celý článek

Kategorizácia číselných premenných v IBM SPSS Modeler

Proces kategorizácie spočíva v tvorbe nových premenných založených na zoskupení hodnôt existujúcich premenných do kategórií.  Kategorizáciu môžeme použiť pri spojitej premennej, kedy vytvoríme novú premennú, ktorá obsahuje intervaly spojitej premennej alebo pri zoskupení väčšieho množstva ordinálnych kategórií  do menších súborov kategórií.  Proces kategorizácie budeme...

Celý článek

Chybějící hodnoty v IBM SPSS Statistics

IBM SPSS Statistics rozlišuje dva typy vynechaných hodnot (missing values): systémové (system missing) a uživatelem definované (user missing). Systémové vynechané hodnoty jsou u numerických proměnných reprezentovány prázdnou buňkou datové matice, v níž se zobrazuje symbolická tečka. Vynechané hodnoty textových proměnných (prázdné řetězce) jsou...

Celý článek

Testovanie závislosti sentimentu filmového komentára a počtu hviezdičiek

V predchádzajúcom článku sme si predstavili štandardné výstupy z analýzy sentimentu na dátach filmových komentárov priradených užívateľmi k jednotlivým filmom na webovej stránke www.csfd.cz. Z analýzy sentimentu je vidieť, že máme už k dispozícii viacero premenných (číselné aj kategorickú), ktoré vypovedajú o sentimente komentára a môžeme tak prejsť k overovaniu...

Celý článek