„Coronavirus-Fallzahlen sind bedeutungslos. Es sei denn, Sie wissen etwas über Tests. Und selbst dann wird es kompliziert.“ Das schrieb Nate Silver, Statistiker und Gründer von FiveThirtyEight, vor fast genau einem Jahr. Aber wissen wir genug über Tests?
Coronavirus Case Counts Are Meaningless*
*Unless you know something about testing. And even then, it gets complicated.
Im Oktober haben wir in der Unstatistik des Monats erklärt, warum die 7-Tage-Inzidenz, die die Entwicklung der Neuinfektionen abbildet, als Steuerungsgröße nur sehr eingeschränkt geeignet ist. Gleichwohl hängen Maßnahmen wie Sperrstunden, Personengrenzen auf Veranstaltungen und Alkoholverbote immer noch davon ab.
Immerhin wird die Sinnhaftigkeit dieser Kennzahl zunehmend hinterfragt. „Wo viel getestet wird, entstehen eben mehr Fälle. Insofern brauchen wir auch eine Relation zur Anzahl der gemachten Tests, die fehlt noch! Das würde ja sonst zu wenigeren Tests motivieren, um die Inzidenz im Zaum zu halten.“ So kritisierte der Ebersberger Landrat Robert Niedergesäß Mitte März die Orientierung der Politik an der 7-Tage-Inzidenz.
Eine hohe 7-Tage-Inzidenz zeigt an, dass sich viele Menschen mit dem Virus infiziert haben. Manche schließen daraus, dass mit etwas Zeitverzögerung das Gesundheitssystem überfordert sein wird und nicht alle Patient:innen behandelt werden können, was zahlreiche Todesfälle zur Folge haben kann. Die 7-Tage-Inzidenz allein ermöglicht jedoch keinen Blick auf das Gesamtgeschehen.
Gemeldete Neuinfektionen und alle daraus abgeleiteten Kenngrößen sollten stets in Bezug zu anderen Zahlen gesetzt werden.
Datenkompetente Entscheidungsfindung in einer Pandemie
Um eine Intuition dafür zu entwickeln, wie stark die Schätzung der Reproduktionszahl R und die Schätzung der 7-Tage-Inzidenz von der Güte der Tests, der tatsächlichen Prävalenz von Corona und von der Anzahl der Tests abhängen, hat mein Mitarbeiter Stefan Linner eine interaktive App programmiert (STAT-UP Corona Test and Infection Dynamics). Diese wird ein Teil des Online-Kurses „Data-informed Decision Making in a Pandemic“ sein, den wir zusammen mit Wissenschaftler:innen der Federation of European National Statistical Societies (FENStatS) und mit dem KI-Campus derzeit entwickeln. Entscheider:innen in Politik und Wirtschaft, aber auch Datenjournalist:innen und Studierende sollen mit diesem Kurs ein besseres Verständnis dafür entwickeln, wie Daten und Statistiken bei der Bewältigung einer Pandemie von Nutzen sein können.
Quelle: https://corona.statup.solutions/ (Screenshot)
Natürlich nimmt die App zu didaktischen Zwecken viele Vereinfachungen vor. Beispielsweise wird nicht berücksichtigt, dass im Zeitverlauf immer weniger Menschen angesteckt werden können. Bei einen verhältnismäßig kurzen Modell-Zeitraum von zehn Wochen und einer kleinen Prävalenz ist diese Vereinfachung jedoch unproblematisch. Zudem geht das Modell von der Annahme aus, dass die Tests repräsentativ sind, d.h. dass insbesondere die Wahrscheinlichkeit, ein positives Ergebnis zu erhalten, unabhängig von der Anzahl der Tests ist. In der nächsten Version der App werden wir einen Parameter für nicht-repräsentatives Testen einbauen, was die Realität deutlich besser abbildet.
Doch eins zeigt sich mehr als deutlich: Die Schätzung der 7-Tage-Inzidenz wird durch veränderte Teststrategien erheblich verzerrt.
Von manchen Kritiker:innen der 7-Tage-Inzidenz wird nun vorgeschlagen, die positiven Tests in Relation zur Gesamtzahl der Tests zu setzen, also den Anteil der positiv Getesteten zu betrachten bzw. dessen Veränderung. So einfach ist es leider nicht.
Corona-Inzidenz falsch berechnet? Mathe-Student wirft RKI „Fehler“ vor - und wird selbst verbessert
Ein Mathe-Student wirft dem RKI vor, die Corona-Inzidenz falsch zu berechnen. Doch auch seine Lösung scheint Fehler zu beinhalten.
Es ist davon auszugehen, dass mit zunehmender Zahl von Tests die Wahrscheinlichkeit abnimmt, unter den zusätzlich Getesteten positive Ergebnisse zu erhalten. Denn wenn wenige Tests zur Verfügung stehen oder gerade kein Anreiz besteht, sich „einfach so“ testen zu lassen, etwa weil der Weihnachtsbesuch bei den Eltern ansteht oder die Urlaubszeit beginnt, lassen sich vornehmlich Menschen testen, die Kontakt zu Infizierten hatten und/oder Symptome aufweisen. Dort ist die Wahrscheinlichkeit eines positiven Ergebnisses aber höher als unter asymptomatisch Getesteten.
Von Daten zu Informationen
Aber welche Alternativen gibt es dann? Wie könnte man mehr Informationen aus den Daten gewinnen? Ich möchte fünf Möglichkeiten kurz anreißen – und vorweg: keine davon ist der Königsweg. Vielmehr stellen sie einzelne Puzzlestücke dar, die zusammengefügt ein besseres Bild der Pandemie vermitteln können.
Möglichkeit 1: Positivenquote mit Zusatzinformationen
Wenn bekannt wäre, welche Positivenquote der aktuelle marginale Test hätte, ließen sich deutlich belastbarere Schlüsse ziehen. Würden wir die aktuelle Testwoche (rein hypothetisch) wiederholen, aber nur einen einzigen Test mehr machen, so wäre dies der marginale Test.
Dazu müssten die Tests in Prioritätsklassen aufgeteilt sein in dem Sinne, dass die getesteten Personen nach Wahrscheinlichkeit einer tatsächlichen Infektion zumindest grob geordnet werden. Diese Ordnung sollte zumindest qualitativ erfolgen, etwa durch die Klassifikation der Getesteten nach dem Grad ihrer Symptomatik. Eigentlich ist es verwunderlich, dass dies nach wie vor nicht geschieht oder zumindest – wenn es geschieht – die entsprechenden Daten nicht frei zugänglich sind.
Möglichkeit 2: Repräsentative Stichproben
Die saubere Lösung wäre das, was ich seit über einem Jahr fordere: Repräsentative Stichproben. Es ist klar, dass es nicht leicht wäre, diese durchzuführen, aber angesichts aller anderen Belastungen unserer Gesellschaft – ökonomische, psychosoziale u.v.a.m. – hätte man diesen Weg deutlich stärker forcieren müssen.
Laut RKI lag die reale Testkapazität seit Jahresanfang durchschnittlich bei 2,3 Mio.Tests pro Woche. Durchgeführt werden aber regelmäßig nur halb so viele Tests. 17 Mio. Menschen sind bereits mindestens einmal geimpft, 3 Mio. waren schon infiziert im Sinne von positiv getestet. Insbesondere wenn man zusätzlich Tests poolen würde, d.h. Proben von z.B. zehn Getesteten gemeinsam auswerten und nur im Fall eines positiven Ergebnisses Einzeltestungen durchführen, könnte man ausschließlich mit der ungenutzten Kapazität in nur einer Woche ein Fünftel der Bevölkerung komplett testen, um belastbare Daten zu erhalten. Sicher geht das nicht jede Woche, aber warum nicht wenigstens einmal im Jahr?
Möglichkeit 3: Relation von Fallzahlen und zeitversetzten Krankenhausaufnahmen
Falls sich die Kriterien für die Einweisung ins Krankenhaus nicht zu stark ändern, was bei einer Altersverschiebung der Infizierten nicht garantiert ist, dann sollten die täglichen Neuaufnahmen das tatsächliche Infektionsgeschehen relativ gut widerspiegeln. Der Zeitverzug zu den Infektionen ist nicht allzu groß, sondern dürfte etwa im Bereich von einer Woche liegen. Die ausgewiesenen Zahlen betreffen Intensivpatient:innen, d.h. hier dürfte der Zeitverzug etwas größer sein. Zudem müssten die Zugänge ausgewiesen werden, nicht der Bestand. Denn ähnlich wie die Verläufe von Infektionen durch Mutanten einander überlagern, können hier auch Entlassungen aus einer vorangegangenen Welle die Neueinweisungen der aktuellen Welle überdecken.
Leider werden in Deutschland die Neuaufnahmen nicht in den maschinenlesbaren Tabellen des Intensivregisters dargestellt, sondern nur in den Freitext-PDFs des RKI, wo sie mühsam extrahiert werden müssen, da die Position der Angaben innerhalb des Dokuments über die Zeit variiert. Aber selbst wenn der Zugang zu den Daten einfacher wäre – perfekt ist diese Lösung auch nicht. Bessere Behandlungsmethoden können die Zahl der Intensivpatienten verringern und die Zahl hängt stark vom Alter der Infizierten ab, d.h. Ausbrüche in Schulen dürften bei den Neuaufnahmen nicht auffallen.
Möglichkeit 4: Relation von Fallzahlen und zeitversetzten Todesfällen
Man könnte die gemeldeten Neuinfektionen in ähnlicher Weise mit den Sterbedaten abgleichen. Die Todesfälle sind der Goldstandard bzgl. der Erfassung einer Erkrankung. Die Letalität nimmt aber ab und die Zeit bis zum Tod kann sich ändern. Die Gründe dafür sind dieselben wie eben schon angeführt: Bessere Behandlungsmöglichkeiten und eine veränderte Altersstruktur der Infizierten. Auch hier ist also ein einfacher Vergleich über längere Zeiträume problematisch.
Möglichkeit 5: Alternative Datenquellen
Hier würden zusätzlich alternative Indikatoren überwacht. Das Zentrale Amt für Statistik der Niederlande (CBS) beispielsweise dokumentiert in seinem Corona-Dashboard die Anzahl der SARS-Cov2-Viruspartikel im Abwasser. Wenn Menschen mit dem Coronavirus infiziert sind, befinden sich mit einer gewissen Wahrscheinlichkeit Viruspartikel in ihrem Stuhl – Studien sagen, dass dies bei 40 Prozent oder mehr der Infizierten der Fall ist. Diese Partikel werden die Toilette hinuntergespült und landen im Abwasser. Durch die Untersuchung von Abwasserproben, die in Kläranlagen gesammelt werden, lassen sich Informationen darüber erhalten, wie verbreitet das Virus in einer bestimmten Region ist.
Coronavirus Dashboard | COVID-19 | Government.nl
Information on the development of coronavirus in the Netherlands.
Ein sehr umfassender Vorschlag zum Pandemie-Monitoring in Australien dokumentiert, wie verbreitet dieses Abwasser-Monitoring international bereits ist: „Der Abwassertest steht kurz vor der Einsatzreife in Australien. Er wurde bereits in Singapur und in einigen US-Standorten erfolgreich eingesetzt, und es gibt konkrete Pläne, das System in jeder Abwasserbehandlungsanlage in den Niederlanden einzusetzen. Es gibt auch Pläne, dieses Monitoring nach einer kürzlich durchgeführten Stichprobenstudie in Großbritannien durchzuführen, ebenso in Südafrika. Der neuseeländische Chief Medical Officer betrachtet es als Teil des Corona-Überwachungssystems.“
Aufschlussreich ist ein Vergleich der niederländischen Kurven für die 7-Tage-Inzidenz (gemeldete Fälle je 100.000 Einwohner:innen) und für die Viruspartikel, ebenso standardisiert auf 100.000 Einwohner:innen. Der Höchststand der letzten fünf Wochen wurde am 27. (Inzidenz) bzw. 28. März (Viruspartikel) erreicht. In den drei Wochen zuvor stiegen die Viruspartikel von 219,24 auf 263,34, also um 20 Prozent. Die Inzidenz hingegen nahm in den drei Vergleichswochen von 30,5 auf 50,6 zu, was 67 Prozent entspricht – einem mehr als dreimal so starken Anstieg.
Eins ist offensichtlich: Die Kurve der Viruspartikel im Abwasser ist nicht abhängig von der Anzahl der durchgeführten Tests; wochentägliche Schwankungen kommen nicht vor.
Quelle: https://coronadashboard.government.nl/ (Screenshot)
Dieser Vergleich verdeutlicht aber auch, warum es nicht klug wäre, nur die Veränderung der Positivenquote der Tests als Maßstab heranzuziehen. Denn zwischen dem 6./7. und dem 27./28. März stieg die Positivenquote von 8,1 auf 9 Prozent beziehungsweise 8,3 Prozent. Das ist ein Anstieg von zwei bis elf Prozent.
Informationen im Kontext
Wird deutlich mehr getestet und bleibt die Verbreitung der Infektion in der Bevölkerung konstant, so muss die Positivenquote sinken – weil unter den zusätzlich Getesteten anteilig weniger Infizierte zu erwarten sind. Eine konstante oder steigende Positivenquote bei steigender Testzahl spricht dafür, dass die wahre Inzidenz überproportional zunimmt. Dies wird gestützt durch den Anstieg der gemessenen Viruspartikel.
Mehr zu testen ermöglicht ein besseres Verständnis der Pandemie. Die Inzidenz wird aussagekräftiger, wenn man die Zahl der Tests ausweitet, da man die Dunkelziffer reduziert. Allerdings ist dann die Vergleichbarkeit zwischen den Landkreisen, falls unterschiedlich viel getestet wird, und über die Zeit nicht mehr gegeben. Außerdem sind fixe Grenzen wie 35, 50 oder 100 damit nichts als Zahlen ohne wirkliche Bedeutung für die Schwere des Infektionsgeschehens.
Mehr Tests sind besser. Aber man muss die Ergebnisse richtig einordnen und darf nicht die Nerven verlieren, wenn Fallzahlen und Inzidenzen dadurch in die Höhe schnellen.
Fallzahlen und Inzidenzen müssen im Kontext betrachtet werden – etwa der Krankenhausauslastung, der Sterblichkeit oder innovativer Kennzahlen wie der Viruspartikel-Zahl in Abwässern. Diese Indikatoren können, anders als diejenigen, die auf gemeldeten Fällen beruhen, nicht so einfach von mehr oder weniger willkürlichen Strategien beeinflusst werden. Ein datenkompetenter Umgang mit einer Krise kann nur erreicht werden, wenn Entscheidungsträger die Möglichkeiten und Grenzen der einzelnen Indikatoren umfassend verstehen.
Ich hoffe, wir sind davon nicht so weit entfernt, wie es den Anschein hat.