Rubriky
• incidence, mortalita, statistické analýzy • populárně naučné - nerecenzované

Mortalita připisovaná Covidu-19 a nadúmrtnost – statistická analýza

Systematické monitorování dat týkajících se rozsahu infekcí Covidem 19 v obyvatelstvu je klíčovou součástí strategického postupu proti této pandemii. Rozšířený zdroj informací jsou data sbíraná universitou Johns Hopkins https://coronavirus.jhu.edu/, s možností stáhnutí například na
https://data.humdata.org/dataset/novel-coronavirus-2019-ncov-cases. Největší pozornost je věnována denním počtům potvrzených nebo registrovaných infekcí. To je odůvodněno tím, že se jedná o rychlý indikátor. Na druhé straně jsou tyto počty masivně ovlivněné rozsahem a strategií testování i typem používaného testu. Všechny tyto faktory se potenciálně mění v čase a prostoru. Proto nemohou tato data být objektivně porovnávána mezi různými státy a časovými obdobími a jejich
použití může vést k chybným nebo neopodstatněným protiopatřením.

Druhá důležitá veličina jsou úmrtí přičítaná Covidu 19. Jejich definice se take liší v ohledu na způsob jakým je úmrtí přiřazeno Covidu 19 nebo jiné příčině. Presto se dá očekávat, že úmrtí poskytují objektivnější obraz momentální závaznosti pandemie. Jejich nevýhoda je časové zpoždění řádově dvou týdnů oproti potvrzeným případům infekce.
Mezi nejobjektivnějsími kritérii na ohodnocení momentálního dopadu Covidu 19, nezkreslenými růzností definicí, je porovnání dvou zdrojů: hlášené úmrtnosti na Covid 19 na jedné straně a všeobecné mortality, obzvláště nadúmrtnosti, na straně druhé. Nadúmrtnost je definována jako
momentální počet úmrtí nad průměr daného časového úseku (typicky kalendářního týdne). Týdenní data o mortalitě jsou uložena, a mohou být stáhnuta, na https://ec.europa.eu/eurostat/en/web/population-demography-migration-projections/data/database. Pravidelné přehledy jsou vydávány na https://www.euromomo.eu/ . Porovnáním těchto dvou zdrojů dat je možné

1. odhadnout, do jaké míry je úmrtnost připisovaná Covidu 19 poplatná této příčině

2. uvést úmrtnost na Covid 19 do poměru s běžnými náhodnými fluktuacemi nadúmrtnosti.

Tato analýza byla provedena pro evropské státy s daty obsaženými v databázi Eurostat. Bohužel část těchto zemí neposkytla data v rozsahu dostatečném protento účel. Některé státy jako Německo, Francie, Itálie a Spojené království neposkytují historii dostatecnou pro odhad průměrné týdenní mortality(minimálne od roku 2011). Jiné státy jako Česká republika a Slovensko dodávají data s podstatným zpožděním, takže pokrytí druhé vlny Covidu 19 od září 2020 je nedostatečné. Česká republika mohla být podmíněně analyzována kvůli poměrně výraznému růstu infekcí. Výběr zemí k analýze tedy obsahuje Českou republiku,Polsko, Maďarsko, Rakousko, Švýcarsko, Španělsko, Švédsko, Nizozemí a Belgii, s daty o nadúmrtnosti počínající kalendářními týdny mezi 39 (Česká republika) a 44 (Švédsko).

Dvě statistické charakteristiky jsou v popředí této analýzy. Jedna je regresní koeficient, který ukazuje proporcionalitu, s jakou zvýšení úmrtnosti připisované Covidu 19 vede ke zvýšení všeobecné nadúmrtnosti. Hodnoty v blízkosti jedné poukazují na pravděpodobně správnou klasifikaci příčiny úmrtí.

Nižší hodnoty znamenají, že část “covidových” úmrtí pravděpodobně měla jinou příčinu. Hodnoty vyšší než jedna by poukazovaly na “skrytá” úmrtí na Covid 19, například nakažených, ale neregistrovaných jedinců. Regresnímu koeficientu je možno, v závislosti na datové situaci, přiřadit tzv. konfidenční interval, ve kterém se skutečná hodnota s velkou pravděpodobností nachází. Velmi široké konfidenční intervaly činí koeficient nespolehlivým pro interpretaci a tedy prakticky bezcenným.

Druhá charakteristika je koeficient determinace. Tento koeficient v našem případě udává, jakou část variability všeobecné nadúmrtnosti je možné vysvětlit úmrtností připisovanou Covidu 19. Je-li tento koeficient nízký, úmrtnost na Covid 19 tvoří jenom malou část běžné sezónní nadúmrtnosti.

Věcné závěry je možno učinit jen z kombinace obou charakteristik.
Metodické a číselné podrobnosti analýzy jsou uvedeny v přiložené zprávě v angličtině (PDF ke stažení dole). Kvalitativní shrnutí výsledku je následující.
Odděleně analyzovány byly dvě vlny Covidu 19. Data první vlny končí 26. kalendářním týdnem (konec června 2020). Data vlny druhé začínají 31. týdnem (srpen 2020).


Následující závěry jsou čistě statistické povahy. Předložená vysvětlení jsou jen návrhy, které je třeba ohodnotit epidemiologickou expertízou.
Jednotlivé státy vykazují široké spektrum charakteristických hodnot. Během první vlny, Švýcarsko, Španělsko, Švédsko, Nizozemí a Belgie mají regresní koeficienty relevantní výšky s úzkými konfidenční intervaly. Dle příslušných koeficientů determinace vysvětlují mezi 59 % (Španělsko) a 92% (Švédsko) sezónní variability nadúmrtnosti. Regresní koeficienty Švýcarska, Španělska a Švédska se pohybují kolem 0.6. Navrhovaná interpretace je, že 60 % úmrtnosti připisované Covidu 19 skutečně mělo tuto příčinu, zbylých 40 % příčiny jiné (s náhodnou koincidencí s pozitivním testem na Covid 19).
Vysokou hodnotu 0.86, svědčící o cíleném zjišťování příčiny úmrtí, má Nizozemí. Nízká hodnota 0.42 v případě Belgie může pramenit z velkorysého přiřazování úmrtí Covidu 19.
Česká republika, Polsko a Maďarsko mají hodnoty s nízkou signifikancí. Regresní koeficienty mají malé hodnoty i široké konfidenční intervaly (včetně změny znaménka na negativní). Tato nízká signifikance je také dokumentována nízkými hodnotami koeficientu determinace. Celkový závěr je nízká intenzita první vlny v těchto zemích.
Rakousko se pohybuje mezi oběma skupinami zemí.


Výsledky pro druhou vlnu infekce jsou podstatně méně významné. Česká republika má jeden z relativně úzkých (ale stále širokých v porovnání s první vlnou v Západní Evropě) konfidenčních intervalů regresního koeficientu. Jeho hodnota je 0.56 (tedy 56 % vykázaných úmrtí mělo tuto příčinu, zbytek jinou) a tedy podobná hodnotám z první vlny v západní Evropě. Koeficient determinace poukazuje na 57 % variability všeobecné nadúmrtnosti vysvětlitelné vykázanými úmrtími na Covid 19. Tato variabilita všeobecné nadúmrtnosti je ovšem na konci léta a začátku podzimu podstatně nižší než na jaře, takže se jedná o podíl na všeobecně nižších číslech.
Západoevropské státy vykazují málo signifikantní hodnoty. Švýcarsko, Španělsko, Švédsko a Nizozemí mají buď velmi nízké regresní hodnoty nebo jejich konfidenční intervaly jsou velmi široké. Regresní koeficient Belgie má poněkud užší konfidenční interval a jeho hodnota je relativně vysoká, 0.78. Koeficient determinace ale poukazuje na pouhých 24 % nadúmrtnosti způsobené Covidem 19 – ostatní příčiny nadúmrtnosti hrají větší roli.

Je důležité zdůraznit, že procentuální podíly se vztahují na nadúmrtnost a ne na celkovou úmrtnost. Nadúmrtnost je náhodně kolísající číslo prinejmenším o jeden řád menší než celková úmrtnost. Typické je pět až sedm procent celkové úmrtnosti. 50 % nadúmrtnosti odpovídá tedy zhruba 3 % celkové úmrtnosti.


Souhrnem je možné vyvodit, že je nízká statistická evidence pro hypotézu že druhá vlna je rozsahem srovnatelná s vlnou první. V tomto srovnání jsou hodnoty České republiky ve druhé vlně relativně nejvyšší. Možné vysvětlení spočívá v relativně zanedbatelné první vlně v centrální části východní Evropy, včetně České republiky. Následkem toho by nedošlo k podstatné imunizaci nebo úmrtnosti rizikových skupin.
Výsledky druhé vlny jsou jen předběžné, protože vlna stále probíhá. S přicházejícími dalšími daty je možné výsledky doplnit. Tím by vzrostla naděje na signifikantní závěry.

Tyto závěry jsou zalozeny pouze na datech. Skutečná kauzality nemůže být prokázána statistickými prostředky – definitivní interpretace by musela být provedena za účasti epidemiologů. Statistická podpora a důkazy platnosti ale mohou být vítaným zdrojem pro budování kauzálních hypotéz.