fbpx

Kategorie: Analýza dat

Kategorizácia číselných premenných v IBM SPSS Modeler

Proces kategorizácie spočíva v tvorbe nových premenných založených na zoskupení hodnôt existujúcich premenných do kategórií.  Kategorizáciu môžeme použiť pri spojitej premennej, kedy vytvoríme novú premennú, ktorá obsahuje intervaly spojitej premennej alebo pri zoskupení väčšieho množstva ordinálnych kategórií  do menších súborov kategórií.  Proces kategorizácie budeme...

Celý článek

Chybějící hodnoty v IBM SPSS Statistics

IBM SPSS Statistics rozlišuje dva typy vynechaných hodnot (missing values): systémové (system missing) a uživatelem definované (user missing). Systémové vynechané hodnoty jsou u numerických proměnných reprezentovány prázdnou buňkou datové matice, v níž se zobrazuje symbolická tečka. Vynechané hodnoty textových proměnných (prázdné řetězce) jsou...

Celý článek

Testovanie závislosti sentimentu filmového komentára a počtu hviezdičiek

V predchádzajúcom článku sme si predstavili štandardné výstupy z analýzy sentimentu na dátach filmových komentárov priradených užívateľmi k jednotlivým filmom na webovej stránke www.csfd.cz. Z analýzy sentimentu je vidieť, že máme už k dispozícii viacero premenných (číselné aj kategorickú), ktoré vypovedajú o sentimente komentára a môžeme tak prejsť k overovaniu...

Celý článek

Analýza sentimentu filmových komentárov

Webové stránky zamerané na databázu filmov, napríklad www.csfd.cz (Česko-Slovenská filmová databáze) alebo www.imdb.com (Internet Movie Database), umožňujú svojim užívateľom pridať k filmu ich hodnotenie v podobe komentára a počtu hviezdičiek. Zamýšľali ste sa niekedy nad tým, že či tieto dve hodnotenia medzi sebou aj...

Celý článek

Využití exaktních testů nejen ve zdravotnictví

V medicínských studiích se často vyskytují situace, kdy je nutné analyzovat malé soubory pacientů, kteří například trpí určitým vzácným onemocněním nebo podstupují nákladné vyšetření. V těchto případech však není možné pracovat běžnými statistickými postupy založenými na asymptotických metodách. Ty dobře fungují pouze tehdy, pokud...

Celý článek

Korelace – co jste o nich věděli i nevěděli

Analýza vztahů v datech patří k základním úlohám statistiky. Snad každý analytik si někdy položil otázku, jak silný je vztah mezi dvěma proměnnými, zda může jedna veličina vysvětlovat chování jiné, nebo jak moc společné informace v sobě nesou dvě proměnné. Odpověď na tyto otázky,...

Celý článek

Kto mal najväčšiu pravdepodobnosť prežitia na Titanicu?

Od stroskotania legendárneho zaoceánskeho parníku Titanic už uplynulo vyše 108 rokov. Stroskotal pri svojej prvej plavbe v noci zo 14. na 15. apríla roku 1912 po zrážke s ľadovcom. Pri tejto tragickej udalosti zahynulo okolo 1 500 osôb. Posledná osoba, ktorá prežila stroskotanie lode...

Celý článek