Pri vyhodnocovaní kvality modelu binárnej klasifikácie (binary classification) sa využívajú rôzne evaluačné metriky (evaluation metrics). Napríklad Accuracy, Precision, Recall, F1 score, Area Under the ROC Curve (AUC), Log loss atď. V tomto článku sa zameriame na vyhodnocovanie kvality modelu klasifikácie viacerých tried...
Celý článek
V sérii několika navazujících článků si představíme tři nejčastěji využívané balíky z kolekce R balíků – tidyverse, navržených pro datovou vědu Hadley Wickhamem a jeho týmem. Jedná se o balík k vizualizaci dat – ggplot2, balík k manipulaci s daty – dplyr a balík k čištění dat – tidyr....
Celý článek
Předchozí článek Kolik se stane v příštím roce v České republice pracovních úrazů? byl věnován vytváření predikčního modelu, jehož cílem bylo stanovit odhady počtu pracovních úrazů pro roky 2021-2023. I přesto, že byl model vytvářen až v průběhu roku 2022, tak k datu jeho vzniku stále nebyly k dispozici údaje...
Celý článek
Pracovní úraz je podle zákona definován jako takové poškození zdraví, které bylo způsobeno při plnění pracovních úkolů zevními vlivy a k němuž došlo nezávisle na vůli samotného zaměstnance. Informace o pracovních úrazech jsou v České republice evidovány dvěma institucemi, a to Státním úřadem inspekce práce a Českým báňským úřadem....
Celý článek
V tomto článku sa zameriame na zvyšné procedúry z ponuky Predictive solutions – Analyze, ktoré nám poskytnú informácie o mierach disparít, ďalej na ohodnotenie zhlukov vytvorených zoskupovacou analýzou a porovnávanie obsahu dvoch textových premenných. Inequality measures Procedúra počíta Lorenzovu krivku znázorňujúcu percentuálny podiel ľudí na celkovom bohatstve....
Celý článek