Blog

Přinášíme vám články, tipy a rady z oblasti analýzy dat a datové vědy.

Zaměřujeme se zejména na témata sběru dat, přípravy dat pro jejich následnou analýzu, vysvětlení užití jednotlivých statistických a dataminingových metod i ovládání softwaru IBM SPSS, Power BI či programování v jazyce R, Python a dalších.

Automatizované odstranění emoji z textu s využitím Pythonu

Je obecně známo, že téměř před každou analýzou je potřeba data zkontrolovat a vyčistit, typicky odstranit chybné hodnoty. Příprava dat však zahrnuje mnohem více úkonů, ostatně ne nadarmo se označuje za jednu z nejdůležitějších, avšak i časově nejnáročnějších částí celého postupu analýzy. Některé softwary...

Celý článek

Co dělat, když Power Query (Excel, Power BI) automaticky nerozpozná názvy sloupců?

Načítali jste data do Excelu či Power BI pomocí Power Query a automaticky se nerozpoznaly názvy sloupců importovaných dat? V tomto článku si ukážeme dva způsoby, jak takovou situaci vyřešit. Pokud již z náhledu okna Navigátoru je zřejmé, že názvy sloupců nebudou správně rozpoznány...

Celý článek

Analýza rozptylu a její předpoklady III

V minulých dvou článcích jsme se zabývali chováním testů pro shodu středních hodnot ve skupinách při platnosti nulové hypotézy a nesplnění předpokladů klasické analýzy rozptylu. Konkrétně jsme zkoumali klasický ANOVA test, robustní testy Welchův a Brownův-Forsytheův a neparametrický Kruskalův-Wallisův test. Nyní se zaměříme na vlastnosti testů, pokud platí alternativní hypotéza....

Celý článek

Využijte dotaci MPSV na vaše vzdělávání

Víte, že můžete získat dotaci Ministerstva práce a sociálních věcí ČR (MPSV) na vaše další vzdělávání? Díky spolupráci s Úřadem práce nabízíme naše kurzy jako součást programu MPSV „Jsem v kurzu“.  Výše dotace činí 82 % z ceny kurzu a každý takto může vyčerpat až 50 000 Kč...

Celý článek

Analýza rozptylu a její předpoklady II

Popis metody V minulém článku Analýza rozptylu a její předpoklady I jsme se zabývali důsledky porušeného předpokladu pro testování hypotézy o shodě středních hodnot. Článek shrnoval hlavní závěry pro klasický ANOVA test, pro robustní testy Welchův a Brownův-Forsytheův a pro neparametrický Kruskalův-Wallisův test. V tomto článku se podrobněji seznámíme s parametry simulace i jejími...

Celý článek