Blog

Přinášíme vám články, tipy a rady z oblasti analýzy dat a datové vědy.

Zaměřujeme se zejména na témata sběru dat, přípravy dat pro jejich následnou analýzu, vysvětlení užití jednotlivých statistických a dataminingových metod i ovládání softwaru IBM SPSS, Power BI či programování v jazyce R, Python a dalších.

Desatinná bodka alebo čiarka vo výstupných tabuľkách SPSS

V tomto článku si bližšie popíšeme ako budeme mať pod kontrolou desatinné bodky alebo čiarky vo výstupných tabuľkách IBM SPSS Statistics. A taktiež pri exporte výstupných tabuliek SPSS napríklad do MS Excel, aby bol zachovaný ten istý desatinný oddeľovač. Existujú situácie, napríklad pri...

Celý článek

2. Jak efektivně sloučit listy/sešity Excelu dohromady?

V předchozím článku jsme si ukázali, jak efektivně spojit data z několika sešitů Excelu dohromady, avšak pouze pro tabulky z jednoho konkrétního listu. Toto pokračování ukáže, jak postupovat, pokud bychom potřebovali spojit několik sešitů a v nich několik listů najednou. Ukázka bude opět prováděna na datech...

Celý článek

1. Jak efektivně sloučit listy/sešity Excelu dohromady?

To, že každá analýza začíná u dat, je vcelku jasné. Ať máme v plánu počítat základní popisné statistiky nebo vytvářet složitý predikční model, vždy je potřeba mít data na vstupu vhodně připravená. Dnešní článek je věnován úpravě vstupních dat, a to konkrétně spojování proměnných...

Celý článek

Úprava výstupov v podaní PS IMAGO PRO

V tomto článku si bližšie popíšeme procedúry z ponuky Predictive Solutions – Report. PS IMAGO PRO okrem štandardných nástrojov na úpravu výstupu, ktoré sú zahrnuté v štatistickom nástroji IBM SPSS Statistics obsahuje ďalšie procedúry na úpravu výstupu. Jednou z týchto procedúr je Output actions, pomocou ktorej...

Celý článek

Vyhodnocovanie kvality modelu klasifikácie viacerých tried

Pri vyhodnocovaní kvality modelu binárnej klasifikácie (binary classification) sa využívajú rôzne evaluačné metriky (evaluation metrics). Napríklad Accuracy, Precision, Recall, F1 score, Area Under the ROC Curve (AUC), Log loss atď. V tomto článku sa zameriame na vyhodnocovanie kvality modelu klasifikácie viacerých tried...

Celý článek