Pri vyhodnocovaní kvality modelu binárnej klasifikácie (binary classification) sa využívajú rôzne evaluačné metriky (evaluation metrics). Napríklad Accuracy, Precision, Recall, F1 score, Area Under the ROC Curve (AUC), Log loss atď. V tomto článku sa zameriame na vyhodnocovanie kvality modelu klasifikácie viacerých tried...
Celý článek
Dnešní článek navazuje na předcházející text Jak poznat, že náš data miningový model je dobrý? věnovaný evaluačním grafům Gains a ROC. Křivek pro vyhodnocení kvality supervizovaných modelů s dichotomickou cílovou proměnnou však existuje mnohem více, proto se nyní seznámíme s dalšími dvěma typy grafů,...
Celý článek
V dnešní době, kdy je snahou každé organizace vytěžit ze svých dat co nejvíce informací, je v rámci řešení dataminingových úloh vytvářeno velké množství různých modelů. Nicméně spolu se zrodem každého modelu vzniká také potřeba ověřit správnost jeho výsledků a vyhodnotit, zda je „dostatečně dobrý“...
Celý článek
Proces kategorizácie spočíva v tvorbe nových premenných založených na zoskupení hodnôt existujúcich premenných do kategórií. Kategorizáciu môžeme použiť pri spojitej premennej, kedy vytvoríme novú premennú, ktorá obsahuje intervaly spojitej premennej alebo pri zoskupení väčšieho množstva ordinálnych kategórií do menších súborov kategórií. Proces kategorizácie budeme...
Celý článek
Před několika měsíci mě kolegyně požádala, abych pro ni připravil data o zákaznících do emailových kampaní z našeho firemního CRM. Souhlasil jsem, ale v duchu jsem si říkal, proč si to neudělá sama. Vždyť export dat z webového rozhraní CRM nemůže být žádná věda. Bohužel...
Celý článek