Pracovní úraz je podle zákona definován jako takové poškození zdraví, které bylo způsobeno při plnění pracovních úkolů zevními vlivy a k němuž došlo nezávisle na vůli samotného zaměstnance. Informace o pracovních úrazech jsou v České republice evidovány dvěma institucemi, a to Státním úřadem inspekce práce a Českým báňským úřadem.
Počty pracovních úrazů, včetně jejich podrobného členění, každoročně zveřejňuje na svých webových stránkách například Výzkumný ústav bezpečnosti práce (BOZP v cislech a grafech | BOZP statistiky (vubp.cz)). Tyto statistiky jsou velmi důležité pro všeobecný přehled o stavu počtu pracovních úrazů, jejich struktuře a dlouhodobém vývoji v čase.
Kromě zdravotní újmy zaměstnance se však s pracovními úrazy pojí také nemalé výdaje, a to jak na straně samotných zaměstnavatelů, tak i ze strany příslušných pojišťoven a státu. Z důvodu plánování finančních zdrojů by zajisté všechny tyto subjekty ocenily mít nějakou představu nejen o počtech pracovních úrazů již vzniklých, ale také o těch incidentech, které v budoucnu teprve nastanou. Takovouto cennou informaci může poskytnout predikční model.
Statistických metod, pomocí nichž lze analyzovat a predikovat časové řady, existuje několik typů. Liší se různými přístupy k dané problematice, postupy výpočtu, jejich složitostí a nutnými předpoklady. Pro naši konkrétní úlohu, tedy získání odhadu počtu pracovních úrazů, které v České republice teprve vzniknou, byla použita Boxova‑Jenkinsonova metodologie pro model časové řady. Důvodem pro výběr tohoto postupu byla skutečnost, že metoda je velmi flexibilní. To znamená, že se dokáže poměrně rychle adaptovat na změny v charakteru časových řad, důsledkem čehož velmi často poskytuje nejlepší možné výsledky oproti jiným postupům.
Tip:
Analýzu pomocí Boxovy-Jenkinsonovy metodologie nabízí například program IBM SPSS Statistics. Jednou z jeho výhod je, že pokud na začátku nemáme žádnou představu o druhu časové řady, můžeme program nechat vykreslit základní typy grafů a rovnou i navrhnout vhodný typ modelu (viz následující obrázek s nastavením). Tyto prvotní informace nám často mohou velmi pomoci jako jakýsi odrazový můstek pro následné hledání nejvhodnějšího typu a ladění parametrů modelu.
Typ modelu a jeho parametry se upravují na základě tvaru časové řady, spočtených hodnotících statistik a vykreslených autokorelačních funkcí ACF a PACF. Přitom by měl být kladen důraz především na to, aby výsledný model nebyl příliš komplikovaný, neobsahoval statisticky nevýznamné prvky, aby mezi rezidui nebyla korelace a míry shody modelu a dat byly co nejlepší.
Následující obrázek zachycuje na levé straně prvotní návrh modelu poskytnutý softwarem, na pravé straně je pak uveden model výsledný. Úprav bylo docíleno v několika krocích, kterými byly především:
U finálního modelu lze v grafech ACF a PACF vidět, že již žádný ze sloupečků nepřesahuje vykreslené meze, a také že hodnoty statistik jako RMSE či MAPE oproti původnímu návrhu softwaru klesly.
Protože výskyt pracovních úrazů je velmi úzce závislý na počtu pracovníků, a to především těch, kteří do svého povolání docházejí fyzicky, byl jejich počet v posledních letech ovlivněn pandemií COVID-19. Aby byl predikční model schopen v příslušném období zohlednit, že se jednalo o nestandardní vývoj, byla kromě samotného počtu pracovních úrazů do modelu zařazena také indikátorová proměnná označující vliv COVID‑19 v daných měsících a letech. Za období vlivu pandemie bylo pro potřeby modelování stanoveno období duben 2020‑prosinec 2022, a to vzhledem k tomu, že ještě v první polovině roku 2022 představovala práce z domova podstatnou část výkonu některých profesí.
Predikční model byl vytvářen na měsíční časové řadě dat za období let 2009-2020 a poskytl bodové odhady počtu pracovních úrazů na následující tři roky, tedy pro léta 2021-2023. Jak lze vidět z následujícího grafu, model se snažil co nejvíce zachovat sezónnost časové řady, kdy zejména v měsících duben, červenec a prosinec typicky dochází k poklesu počtu pracovních úrazů. Naopak v lednu, červnu a září pravidelně dochází k nárůstu hlášených pracovních úrazů.
Výsledný model odhadl, že v lednu 2021 nastane 2 879 pracovních úrazů. Naopak v prosinci téhož roku se podle modelu mělo přihodit pouze 2 542 incidentů. Z následujícího grafu je také možné vidět, že pro rok 2023 již model nepředpokládal vliv pandemie a tudíž, že se podle odhadu modelu vrátí měsíční počty pracovních úrazů opět na původní hodnoty, jako byly před pandemií COVID-19.
Pomocí součtu měsíčních predikcí počtu pracovních úrazů byly následně získány roční odhady. Sestavený model predikoval pro rok 2021 celkový počet pracovních úrazů vzniklých v České republice roven 33 657 případů a pro rok 2022 odhadoval 34 135 pracovních úrazů. Model dále předpokládal, že v roce 2023 bude nahlášeno celkem 42 404 případů pracovních úrazů.
Predikční model byl vytvářen na začátku roku 2022 a jeho zdrojem dat byly veřejně dostupné databáze. Proto asi velkou část čtenářů nepřekvapí, že k datu vzniku modelu ještě nebyla k dispozici data za předchozí rok 2021. Není totiž výjimkou, že státní organizace zveřejňují své statistiky s několika měsíčním zpožděním. To bylo důvodem, proč predikční model musel nejprve odhadovat počty pracovních úrazů za rok 2021, který již byl v té době minulostí. Výhodou toho však bylo, že po zveřejnění dat mohla být provedena kontrola kvality vytvořeného modelu. Navazující článek Ověření úspěšnosti predikčního modelu pracovních úrazů se proto věnuje stanovení úspešnosti sestaveného modelu prostřednictvím porovnání získaných odhadů a skutečných hodnot.
Rádi byste se o statistice a analýze dat dozvěděli více? Chcete se stát mistrem ve svém oboru nebo si jen potřebujete doplnit znalosti? V ACREA nabízíme širokou nabídku kurzů pro váš profesní růst. Máte-li jiný dotaz. Nebojte se využít naši nezávaznou konzultaci, při které vám rádi zodpovíme všechny vaše dotazy a najdeme vhodné řešení.