Blog

Přinášíme vám články, tipy a rady z oblasti analýzy dat a datové vědy.

Zaměřujeme se zejména na témata sběru dat, přípravy dat pro jejich následnou analýzu, vysvětlení užití jednotlivých statistických a dataminingových metod i ovládání softwaru IBM SPSS, Power BI či programování v jazyce R, Python a dalších.

Vyhodnocovanie kvality modelu klasifikácie viacerých tried

Pri vyhodnocovaní kvality modelu binárnej klasifikácie (binary classification) sa využívajú rôzne evaluačné metriky (evaluation metrics). Napríklad Accuracy, Precision, Recall, F1 score, Area Under the ROC Curve (AUC), Log loss atď. V tomto článku sa zameriame na vyhodnocovanie kvality modelu klasifikácie viacerých tried...

Celý článek

Tidyverse v jazyce R pro „Data Science“

V sérii několika navazujících článků si představíme tři nejčastěji využívané balíky z kolekce R balíků – tidyverse, navržených pro datovou vědu Hadley Wickhamem a jeho týmem. Jedná se o balík k vizualizaci dat – ggplot2, balík k manipulaci s daty – dplyr a balík k čištění dat – tidyr....

Celý článek

Ověření úspěšnosti predikčního modelu pracovních úrazů

Předchozí článek Kolik se stane v příštím roce v České republice pracovních úrazů? byl věnován vytváření predikčního modelu, jehož cílem bylo stanovit odhady počtu pracovních úrazů pro roky 2021-2023. I přesto, že byl model vytvářen až v průběhu roku 2022, tak k datu jeho vzniku stále nebyly k dispozici údaje...

Celý článek

Kolik se stane v příštím roce v České republice pracovních úrazů?

Pracovní úraz je podle zákona definován jako takové poškození zdraví, které bylo způsobeno při plnění pracovních úkolů zevními vlivy a k němuž došlo nezávisle na vůli samotného zaměstnance. Informace o pracovních úrazech jsou v České republice evidovány dvěma institucemi, a to Státním úřadem inspekce práce a Českým báňským úřadem....

Celý článek

Rozšírenie funkcionality IBM SPSS Statistics o procedúry PS – 2. část

V tomto článku sa zameriame na zvyšné procedúry z ponuky Predictive solutions – Analyze, ktoré nám poskytnú informácie o mierach disparít, ďalej na ohodnotenie zhlukov vytvorených zoskupovacou analýzou a porovnávanie obsahu dvoch textových premenných. Inequality measures Procedúra počíta Lorenzovu krivku znázorňujúcu percentuálny podiel ľudí na celkovom bohatstve....

Celý článek