Kategorie: Analýza dat

Analýza rozptylu a její předpoklady II

Popis metody V minulém článku Analýza rozptylu a její předpoklady I jsme se zabývali důsledky porušeného předpokladu pro testování hypotézy o shodě středních hodnot. Článek shrnoval hlavní závěry pro klasický ANOVA test, pro robustní testy Welchův a Brownův-Forsytheův a pro neparametrický Kruskalův-Wallisův test. V tomto článku se podrobněji seznámíme s parametry simulace i jejími...

Celý článek

Analýza rozptylu a její předpoklady I

Definice úlohy Mezi uživateli statistických metod je rozšířen předpoklad, že normalita dat je u testů, které ji předpokládají, zásadní podmínka použití testu. Tento článek popisuje, že alespoň pro analýzu rozptylu to není pravda a normalita není zásadní, zásadní je ale požadavek na shodu rozptylu. Zjištění vycházejí z výsledků...

Celý článek

Desatinná bodka alebo čiarka vo výstupných tabuľkách SPSS

V tomto článku si bližšie popíšeme ako budeme mať pod kontrolou desatinné bodky alebo čiarky vo výstupných tabuľkách IBM SPSS Statistics. A taktiež pri exporte výstupných tabuliek SPSS napríklad do MS Excel, aby bol zachovaný ten istý desatinný oddeľovač. Existujú situácie, napríklad pri...

Celý článek

Vyhodnocovanie kvality modelu klasifikácie viacerých tried

Pri vyhodnocovaní kvality modelu binárnej klasifikácie (binary classification) sa využívajú rôzne evaluačné metriky (evaluation metrics). Napríklad Accuracy, Precision, Recall, F1 score, Area Under the ROC Curve (AUC), Log loss atď. V tomto článku sa zameriame na vyhodnocovanie kvality modelu klasifikácie viacerých tried...

Celý článek

Ověření úspěšnosti predikčního modelu pracovních úrazů

Předchozí článek Kolik se stane v příštím roce v České republice pracovních úrazů? byl věnován vytváření predikčního modelu, jehož cílem bylo stanovit odhady počtu pracovních úrazů pro roky 2021-2023. I přesto, že byl model vytvářen až v průběhu roku 2022, tak k datu jeho vzniku stále nebyly k dispozici údaje...

Celý článek