Autor Ing. Petra Raszyková

O autorovi

V roce 2019 úspěšně ukončila magisterský obor Statistika na Vysoké škole ekonomické v Praze. Již během studia pracovala v bankovním prostředí v oblasti databází, reportingu a optimalizace práce s daty. Ve společnosti ACREA CR pracuje jako analytička, konzultantka a lektorka se zaměřením na data mining a optimální datové transformace.

Automatizované odstranění emoji z textu s využitím Pythonu

Je obecně známo, že téměř před každou analýzou je potřeba data zkontrolovat a vyčistit, typicky odstranit chybné hodnoty. Příprava dat však zahrnuje mnohem více úkonů, ostatně ne nadarmo se označuje za jednu z nejdůležitějších, avšak i časově nejnáročnějších částí celého postupu analýzy. Některé softwary...

Celý článek

Co dělat, když Power Query (Excel, Power BI) automaticky nerozpozná názvy sloupců?

Načítali jste data do Excelu či Power BI pomocí Power Query a automaticky se nerozpoznaly názvy sloupců importovaných dat? V tomto článku si ukážeme dva způsoby, jak takovou situaci vyřešit. Pokud již z náhledu okna Navigátoru je zřejmé, že názvy sloupců nebudou správně rozpoznány...

Celý článek

2. Jak efektivně sloučit listy/sešity Excelu dohromady?

V předchozím článku jsme si ukázali, jak efektivně spojit data z několika sešitů Excelu dohromady, avšak pouze pro tabulky z jednoho konkrétního listu. Toto pokračování ukáže, jak postupovat, pokud bychom potřebovali spojit několik sešitů a v nich několik listů najednou. Ukázka bude opět prováděna na datech...

Celý článek

1. Jak efektivně sloučit listy/sešity Excelu dohromady?

To, že každá analýza začíná u dat, je vcelku jasné. Ať máme v plánu počítat základní popisné statistiky nebo vytvářet složitý predikční model, vždy je potřeba mít data na vstupu vhodně připravená. Dnešní článek je věnován úpravě vstupních dat, a to konkrétně spojování proměnných...

Celý článek

Ověření úspěšnosti predikčního modelu pracovních úrazů

Předchozí článek Kolik se stane v příštím roce v České republice pracovních úrazů? byl věnován vytváření predikčního modelu, jehož cílem bylo stanovit odhady počtu pracovních úrazů pro roky 2021-2023. I přesto, že byl model vytvářen až v průběhu roku 2022, tak k datu jeho vzniku stále nebyly k dispozici údaje...

Celý článek