Proces kategorizácie spočíva v tvorbe nových premenných založených na zoskupení hodnôt existujúcich premenných do kategórií. Kategorizáciu môžeme použiť pri spojitej premennej, kedy vytvoríme novú premennú, ktorá obsahuje intervaly spojitej premennej alebo pri zoskupení väčšieho množstva ordinálnych kategórií do menších súborov kategórií. Proces kategorizácie budeme...
Celý článek
V predchádzajúcom článku sme si predstavili štandardné výstupy z analýzy sentimentu na dátach filmových komentárov priradených užívateľmi k jednotlivým filmom na webovej stránke www.csfd.cz. Z analýzy sentimentu je vidieť, že máme už k dispozícii viacero premenných (číselné aj kategorickú), ktoré vypovedajú o sentimente komentára a môžeme tak prejsť k overovaniu...
Celý článek
Webové stránky zamerané na databázu filmov, napríklad www.csfd.cz (Česko-Slovenská filmová databáze) alebo www.imdb.com (Internet Movie Database), umožňujú svojim užívateľom pridať k filmu ich hodnotenie v podobe komentára a počtu hviezdičiek. Zamýšľali ste sa niekedy nad tým, že či tieto dve hodnotenia medzi sebou aj...
Celý článek
V medicínských studiích se často vyskytují situace, kdy je nutné analyzovat malé soubory pacientů, kteří například trpí určitým vzácným onemocněním nebo podstupují nákladné vyšetření. V těchto případech však není možné pracovat běžnými statistickými postupy založenými na asymptotických metodách. Ty dobře fungují pouze tehdy, pokud...
Celý článek
Analýza vztahů v datech patří k základním úlohám statistiky. Snad každý analytik si někdy položil otázku, jak silný je vztah mezi dvěma proměnnými, zda může jedna veličina vysvětlovat chování jiné, nebo jak moc společné informace v sobě nesou dvě proměnné. Odpověď na tyto otázky,...
Celý článek