Jak účinné je očkování proti covidu?

Očkování proti covidu, podobně jako jiná očkování, zřejmě dokonalé není. Jeho vliv na pravděpodobnost nakažení a průběh choroby je však značný. Podívejme se, jak můžeme vliv očkování a prodělané nemoci kvantifikovat a jak se vyvíjí v čase.

Každého obyvatele České republiky charakterizujeme podle toho, zda je očkovaný, zda prodělal covid a podle aktuální nákazy. Z hlediska očkování každý patříme do jedné z kategorií:

  • bez očkování,
  • nedokončené očkování,
  • dokončené očkování,
  • posilující dávka.

Podle prodělání nemoci se rozřadíme do kategorií:

  • neprodělal covid během posledních 180 dní,
  • prodělal covid během posledních 180 dní.

A konečně z hlediska aktuálního stavu každého jedince zařadíme do některé z kategorií:

  • zdravý,
  • nakažený,
  • hospitalizovaný,
  • hospitalizovaný s těžkým průběhem.

Mohli bychom ještě přidat kategorii mrtvý, ale mrtvé do statistik v tomto příspěvku nezařazuji. Budeme zkoumat, jak první dvě kategorizace, tj. očkování a prodělání nemoci (nezávislé proměnné), ovlivňují rozřazení podle aktuálního stavu (závislá proměnná).

Pro jednoduchost si ještě sloučíme některé kategorie a budeme pracovat pouze s dichotomickými atributy. U očkování sloučíme neočkované osoby a osoby s nedokončeným očkováním do kategorie neočkovaných. Zbytek tvoří kategorii očkovaných. Celou populaci znázorníme množinami na obrázku 1.

Obrázek 1 Rozdělení populace ČR pole očkování a prodělání nemoci

Protože budeme počítat statistiky pro skupiny obyvatel určené očkováním a proděláním nemoci, skupiny si označíme písmeny podle tabulky na obrázku 2. Skupina A bude referenční, vůči ní budeme porovnávat ostatní skupiny.

Obrázek 2 Označení skupin obyvatel podle očkování a prodělání nemoci

Závislou proměnnou, aktuální nákazu, si také zjednodušíme. Budeme se zabývat zařazením do každé z uvedených ordinálních kategorií samostatně. Například se podíváme, jak očkování a prodělání nemoci ovlivňuje nákazu, a do nakažených započítáme i hospitalizované a hospitalizované s těžkým průběhem. Závislá proměnná pak bude také dichotomická a do buněk tabulky na obrázku 2 můžeme zapsat pravděpodobnosti nákazy v jednotlivých skupinách obyvatel.

Obrázek 3 Vnořené kategorie závislé proměnné

Pro zamýšlené analýzy potřebujeme individuální data, tj. datovou matici, kde každý řádek reprezentuje jednoho obyvatele ČR a ve třech sloupcích máme jeho stav z hlediska očkování, prodělané nemoci a aktuálního stavu. A pokud budeme chtít sledovat časové změny, například jak se mění účinnost očkování, je třeba si zajistit denní, týdenní či měsíční snímky celé populace nebo alespoň v datové matici uvést datum posledního prodělání, resp. datum očkování. Taková data bohužel nejsou veřejně dostupná. K dispozici je pouze celá řada dat agregovaných. Naštěstí se v poslední době objevilo několik datových sad, které umožní spočítat potřebné statistiky se zanedbatelnými odchylkami i z některých agregací, pouze bylo třeba vynaložit větší úsilí při přípravě dat před analýzou.

Jak referenční skupina A neočkovaných a bez prodělání nemoci, tak ostatní skupiny B, C, D mají v každém časovém okamžiku jistou pravděpodobnost nákazy danou podílem nakažených ve skupině. Prodělání nemoci a očkování nazveme efekty a budeme kvantifikovat vliv efektu na pravděpodobnost nákazy. Statistiky, kterými se vliv měří, se souhrnně označují anglickým pojmem Effect Size (ES). V naší situaci, kdy nezávislé i závislá proměnná jsou kategorizované, vyjádříme ES statistikou nazvanou poměr šancí (anglicky Odds Ratio, OR). Kromě ní bychom mohli použít například koeficient φ, Cramerovo V, Cohenovo W nebo Cohenovo h. Aplikace standardních statistik a postupů konfirmační statistické analýzy, kdy bychom testovali hypotézy, zda zvolený efekt ovlivňuje závislou proměnnou, zde není příliš vhodné. Pracujeme totiž s daty o celé současné populaci ČR a nikoli jen s výběrem ze současné populace.

Zvolená statistika poměr šancí je definována jako podíl šancí, že nastane zkoumaný jev, tj. nákaza, v referenční skupině obyvatel a ve skupině s efektem. Pro lepší interpretaci dáme referenční skupinu A do čitatele. Vyjde-li například poměr šancí pro efekt očkování 5, můžeme říci, že neočkovaní mají pětkrát větší šanci nakazit se covidem než očkovaní.

Pro úplnost si zopakujme, že šance není pravděpodobnost, ale počítá se z ní. Šanci určitého jevu definujeme jako podíl pravděpodobnosti, že jev nastane, ku pravděpodobnosti, že jev nenastane. Proto také šanci často udáváme jako poměr. Například šanci o velikosti 3 můžeme ohlásit jako šanci 3:1 (tři ku jedné) a tato šance odpovídá pravděpodobnosti 75 % (75 %, že jev nastane, a 25 %, že jev nenastane).

Poměr šancí pro vyčíslení efektu očkování na nákazu zapíšeme vzorcem

OR = [P/ (1 – PA)] / [PB/ (1 – PB)],

kde P značí pravděpodobnost nákazy a index ukazuje na skupinu obyvatel. Při kvantifikaci efektu očkování tedy porovnáváme skupinu B s očkováním bez prodělání nemoci s referenční skupinou A bez očkování a bez prodělání nemoci. Analogicky pro vyjádření efektu prodělání nemoci podělíme šance nákazy ve skupinách A a C. Vydělení šancí ve skupinách A a D nám poskytne kvantifikaci efektu kombinace očkování a prodělání.

Pravděpodobnost nákazy se během času mění. Přichází a odchází covidové vlny, mění se mutace viru. Taktéž se v čase mění rozdělení populace ČR do námi definovaných skupin. Zatímco počet očkovaných roste, počet jedinců s prodělanou nemocí fluktuuje, neboť se omezujeme na posledních 180 dní od prodělání. Navíc ještě pracujeme s nepřesnými četnostmi prodělání choroby, neboť testování není plošné a očkovaní se testují méně.

Přesuny obyvatelstva mezi skupinami v čase ovlivňují další faktory: dostupnost očkování, ochota k očkování, prostředí a chování jedince, zdravotní stav, věk, vlny pandemie. Zřejmě bychom zjistili odlišné poměry šancí u různých skupin obyvatelstva, ale na to bychom potřebovali ještě podrobnější data a více prostoru.

Hodnoty poměrů šancí nákazy v jednotlivých měsících ukazuje obrázek 4. Do nakažených jsou zahrnuti i všichni hospitalizovaní. V obrázku jsou vidět samostatné efekty očkování a prodělání nemoci. Všechny šance jsou větší než jedna, z čehož vyplývá, že jak očkování, tak prodělání nemoci přestavují znamenitou prevenci proti nákaze covidem. Pozornost jistě upoutá klesající trend účinnosti očkování. Zatímco v červenci 2021 očkovaní měli téměř desetkrát menší šanci nakazit se, na přelomu roku už to bylo jen dvakrát. Ačkoli to můžeme přičítat reálnému snížení účinnosti očkování proti novým mutacím viru, v naší analýze je pokles způsoben především změnou referenční skupiny. Počet jedinců ve skupině A se během sledovaného období zmenšil na polovinu a zbyli v ní jen odolnější jedinci (mladí a zdraví). I přesto jsou na tom stále lépe očkovaní než současní neočkovaní. Aby bylo možné objektivně říci, jak se účinnost očkování mění, potřebovali bychom uměle udržovat reprezentativní referenční skupinu A, což bez individuálních dat není reálné.

Ti, kdo nemoc prodělali, mají taktéž několikanásobně nižší šanci, že se nakazí. Míra ochrany proti nákaze je u prodělání a očkování dnes srovnatelná. Do grafu bychom též mohli přidat křivku pro kombinaci očkování a prodělání, tj. porovnat šance ve skupinách A a D. Takových jedinců však na počátku sledovaného období existovalo velmi málo a odhad pravděpodobností a šancí se tím stává dosti nepřesný. Ke konci období ale výsledky ukazují, že kombinace očkování a prodělání je srovnatelná s každým samostatným efektem, očkovaní jedinci po prodělaném covidu jsou stejně dobře chráněni jako ti jenom očkovaní.

Obrázek 4 Poměr šancí nakažení pro efekty očkování a prodělání nemoci

Očkování či prodělání nemoci neovlivňuje toliko vlastní nákazu, ale také průběh nemoci. Abychom kvantifikovali vliv efektů na průběh nemoci, stačí zaměnit závislou proměnnou. Namísto nakažených začneme sledovat hospitalizované nebo dokonce hospitalizované s těžkým průběhem vyžadující speciální péči. Obrázek 5 ukazuje poměry šancí na hospitalizaci u očkovaných a lidí po nemoci. Opět porovnáváme skupiny B a C se skupinou A. Vysoké hodnoty poměrů šancí znovu ukazují, že jak očkování, tak prodělání nemoci přestavují vynikající prevenci proti hospitalizaci, a to i přes to, že v referenční skupině A zůstávají odolnější jedinci. V tomto grafu si jistě všimneme značného nárůstu ochrany proti hospitalizaci u prodělání nemoci v období okolo přelomu roku. Nárůst je tak výrazný, že i přes změny v referenční skupině A lze tvrdit, že v tuto dobu bylo prodělání nemoci účinnější ochranou než očkování. Díky relativně drobnému nárůstu účinnosti očkování na konci sledovaného období můžeme rovněž potvrdit, že posilující dávka nás chrání především proti horšímu průběhu nemoci než před vlastní nákazou.

Obrázek 5 Poměr šancí hospitalizace pro efekty očkování a prodělání nemoci

Graf na obrázku 6 nabízí analogickou interpretaci při sledování poměrů šancí u hospitalizace s těžkým průběhem. Opět na první pohled je zřejmé, že na přelomu roku bylo prodělání nemoci účinnější ochranou než očkování a že posilující dávka zabraňuje především horšímu průběhu nemoci. Hospitalizovaných jedinců s těžkým průběhem není mezi skupinami obyvatel mnoho, proto odhadnuté poměry šancí více fluktuují. V grafu to však není příliš patrné díky širší škále na svislé ose, protože oba efekty očkování i prodělání nemoci chrání jedince před hospitalizací s těžkým průběhem ještě více, než ho chrání před samotnou hospitalizací. To jsme mohli sledovat i během poslední omikronové vlny, kdy v populaci bylo více očkovaných i jedinců s prodělaným covidem než v předchozích vlnách. Zatížení nemocnic se oproti předchozím vlnám znatelně snížilo a nárůst hospitalizací s těžkým průběhem byl téměř nepozorovatelný.

Obrázek 6 Poměr šancí hospitalizace s těžkým průběhem pro efekty očkování a prodělání nemoci
Mgr. Ondřej Háva, Ph.D.
Senior analytik a lektor data miningu v ACREA CR. Ve své profesní kariéře se specializuje na dataminingové projekty, a to především v oblasti řízení rizik a detekce podvodů. Má zkušenost s vedením desítek rozsáhlých dataminingových projektů a softwarových řešení pro velké společnosti. Zaměřuje se na problematiku text miningu a sociálních sítí, je autorem a spoluautorem řady odborných článků a publikací. V současné době se věnuje vývoji textminingového modulu ACREA TEXT MINING.
Komentáře
  1. Samuel Koróny napsal:

    Dobry den,

    nebolo by mozne z takychto analyz urobit pdf dokument na stiahnutie?
    Aby to clovek nemusel pracne rucne vkladat Ctrl C + Ctrl V .
    Dakujem
    SK

    • info@acrea.cz napsal:

      Dobrý den, článek v PDF jsme vám zaslali na váš e-mail. S přáním hezkého dne tým Acrea.

  2. Zuzana Juščáková napsal:

    Okrem osvety v oblasti Pandémia COVID si cením podrobnú metodológiu
    vykonanej štatistiky. Ďakujem.

  3. Tatiana Hajdúková napsal:

    Dobrý deň,

    pridávam sa k poďakovaniu za ďalší vydarený článok prepojenia štatistiky s reálnymi problémami zo života. Prajem veľa síl v tvorivej práci.

Přidat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Vaše osobní údaje budou použity pouze pro účely zpracování tohoto komentáře. Zásady zpracování osobních údajů