Je obecně známo, že téměř před každou analýzou je potřeba data zkontrolovat a vyčistit, typicky odstranit chybné hodnoty. Příprava dat však zahrnuje mnohem více úkonů, ostatně ne nadarmo se označuje za jednu z nejdůležitějších, avšak i časově nejnáročnějších částí celého postupu analýzy. Některé softwary...
Celý článek
Načítali jste data do Excelu či Power BI pomocí Power Query a automaticky se nerozpoznaly názvy sloupců importovaných dat? V tomto článku si ukážeme dva způsoby, jak takovou situaci vyřešit. Pokud již z náhledu okna Navigátoru je zřejmé, že názvy sloupců nebudou správně rozpoznány...
Celý článek
V předchozím článku jsme si ukázali, jak efektivně spojit data z několika sešitů Excelu dohromady, avšak pouze pro tabulky z jednoho konkrétního listu. Toto pokračování ukáže, jak postupovat, pokud bychom potřebovali spojit několik sešitů a v nich několik listů najednou. Ukázka bude opět prováděna na datech...
Celý článek
To, že každá analýza začíná u dat, je vcelku jasné. Ať máme v plánu počítat základní popisné statistiky nebo vytvářet složitý predikční model, vždy je potřeba mít data na vstupu vhodně připravená. Dnešní článek je věnován úpravě vstupních dat, a to konkrétně spojování proměnných...
Celý článek
Předchozí článek Kolik se stane v příštím roce v České republice pracovních úrazů? byl věnován vytváření predikčního modelu, jehož cílem bylo stanovit odhady počtu pracovních úrazů pro roky 2021-2023. I přesto, že byl model vytvářen až v průběhu roku 2022, tak k datu jeho vzniku stále nebyly k dispozici údaje...
Celý článek