V předchozím článku jsme si ukázali, jak efektivně spojit data z několika sešitů Excelu dohromady, avšak pouze pro tabulky z jednoho konkrétního listu. Toto pokračování ukáže, jak postupovat, pokud bychom potřebovali spojit několik sešitů a v nich několik listů najednou. Ukázka bude opět prováděna na datech...
Celý článek
To, že každá analýza začíná u dat, je vcelku jasné. Ať máme v plánu počítat základní popisné statistiky nebo vytvářet složitý predikční model, vždy je potřeba mít data na vstupu vhodně připravená. Dnešní článek je věnován úpravě vstupních dat, a to konkrétně spojování proměnných...
Celý článek
Předchozí článek Kolik se stane v příštím roce v České republice pracovních úrazů? byl věnován vytváření predikčního modelu, jehož cílem bylo stanovit odhady počtu pracovních úrazů pro roky 2021-2023. I přesto, že byl model vytvářen až v průběhu roku 2022, tak k datu jeho vzniku stále nebyly k dispozici údaje...
Celý článek
Pracovní úraz je podle zákona definován jako takové poškození zdraví, které bylo způsobeno při plnění pracovních úkolů zevními vlivy a k němuž došlo nezávisle na vůli samotného zaměstnance. Informace o pracovních úrazech jsou v České republice evidovány dvěma institucemi, a to Státním úřadem inspekce práce a Českým báňským úřadem....
Celý článek
Dnešní článek navazuje na předcházející text Jak poznat, že náš data miningový model je dobrý? věnovaný evaluačním grafům Gains a ROC. Křivek pro vyhodnocení kvality supervizovaných modelů s dichotomickou cílovou proměnnou však existuje mnohem více, proto se nyní seznámíme s dalšími dvěma typy grafů,...
Celý článek
V dnešní době, kdy je snahou každé organizace vytěžit ze svých dat co nejvíce informací, je v rámci řešení dataminingových úloh vytvářeno velké množství různých modelů. Nicméně spolu se zrodem každého modelu vzniká také potřeba ověřit správnost jeho výsledků a vyhodnotit, zda je „dostatečně dobrý“...
Celý článek