Mit Unsicherheiten in der Statistik müssen wir umgehen lernen

Wir wünschen uns Sicherheit in unsicheren Zeiten. Die Statistik kann uns diese jedoch nicht immer bieten. Tanja Stadler erklärt anhand der von ihr für die Schweiz berechneten Schätzung des R-Werts, warum wir auch die statistische Unschärfe berücksichtigen müssen.
Statistik

Steigen die Covid-Infektionszahlen derzeit in der Schweiz exponentiell an oder fallen sie? Und wie schnell verbreiten sich die neuen Virusvarianten im Vergleich zu den alten? Mit statistischen Auswertungen von Daten versuchen wir, diese Fragen zu beantworten. Noch so gerne würden wir Wissenschaftlerinnen und Wissenschaftler sehr klare und eindeutige Antworten liefern. Manchmal ist das möglich, doch längst nicht immer. Denn wenn es um unser Leben in der realen Welt und um Krankheiten geht, läuft praktisch nichts genau getaktet.

Welchen Lebensbereich wir uns auch anschauen, wir haben es stets mit Fluktuationen und Variationen zu tun. Unsere Fahrt zur Arbeit dauert nicht immer genau gleich lang, und trotzdem können wir die Fahrzeit ungefähr veranschlagen. Oder ein 7-jähriger Knabe sollte gemäss Tabelle 1,25 Meter gross sein. Jeder andere Wert zwischen 1,15 und 1,35 Meter liegt aber auch völlig im Rahmen.

««Ein einzelner Schätzer reicht nicht aus, um ein vollständiges Bild der epidemiologischen Situation zu haben.»
»     
Tanja Stadler

Die Pandemie ist da keine Ausnahme. Wenn eine mit Sars-CoV-2 infizierte Person im Schnitt eine weitere Person ansteckt, heisst das, das in der Realität einige Infizierte mehrere weitere Personen anstecken, andere aber gar keine. Ein weiteres Beispiel ist die Inkubationszeit – die Zeit, die von der Ansteckung mit dem Virus bis zum Ausbruch der ersten Symptome vergeht. Im Schnitt beträgt diese fünf Tage. In der Realität mögen das bei manchen Patienten drei Tage sein, bei anderen sieben oder acht. Oder die Zahl der Neuansteckungen, welche eine der Hauptgrundlagen unserer Auswertungen sind – auch sie fluktuieren von Tag zu Tag.

Das Unsicherheitsintervall ist zentral

In meiner Gruppe berechnen wir Schätzungen zum R-Wert der Corona-Pandemie1. Ist dieser Wert grösser als 1, verbreitet sich der Erreger in einer Bevölkerung exponentiell. Unsere Schätzungen berücksichtigen die vorher genannten sowie weitere Fluktuationen. Eine Folge davon ist allerdings, dass unsere Schätzungen nie einen präzisen Wert liefen, sondern immer einen Schätzbereich.

Wir können zum Beispiel sagen, dass der geschätzte R-Wert für die Schweiz derzeit zwischen 0,96 und 1,21 liegt. Diese Aussage ist statistisch belastbar. Den entsprechenden Bereich nennen wir das Unsicherheitsintervall.  Zusätzlich kommunizieren wir einen Wert, der in der Mitte dieses Intervalls liegt. Er ist die beste Schätzung für einen Einzelwert – wir nennen das den Punktschätzer. Der Punkschätzer darf aber nicht überinterpretiert werden.

«Gesicherte» Aussage und Trends

Liegt das Unsicherheitsintervall beim R-Wert nicht vollständig unter 1 oder über 1, können wir die Daten zwar interpretieren, wir können über eine Tendenz sprechen. Wir können aber nicht mit statistischer Signifikanz sagen, ob wir uns in einer Phase des exponentiellen Wachstums befinden. Dies bedeutet, dass wir keine «gesicherte» Aussage machen können.

Fluktuationen sind prägnanter, je weniger Daten wir analysieren. Denn bei einer sehr grossen Datenmenge gleichen sich die existierenden Fluktuationen wieder aus. Je weniger Daten wir analysieren können, desto grösser wird daher der Unsicherheitsbereich. Das sehen wir beispielsweise an den Daten aus kleinen Kantonen. In diesen Kantonen kommen zu wenig Daten zusammen, als dass man damit statistisch erhärtete Aussagen treffen könnte. Die Unsicherheitsintervalle bei unseren Analysen für kleinere Kantonen sind sehr gross.

Ich halte es deshalb für zielführender, auf die sieben Wirtschaftsräume (Grossregionen) zu fokussieren. Die Menschen bewegen sich stark innerhalb dieser Regionen. Wenn wir uns diese Regionen anschauen, erkennen wir Trends. Derzeit liegt nämlich der Punktschätzer für R in allen sieben Schweizer Grossregionen über 1. Selbst wenn wir keine abschliessende Aussage zum geschätzten R-Wert machen können, können wir diese Daten dennoch interpretieren. Die Punktschätzer in allen Regionen liefern einen starken Hinweis darauf, dass wir derzeit – leider – in der Schweiz in einem Bereich exponentiellen Wachstums liegen.

Schätzung des R-Werts alleine reicht nicht

Die Schätzung des R-Wertes kann Hinweise darauf geben, in welche Richtung sich die Pandemie entwickeln könnte. Aber wir müssen dafür immer auch den Unsicherheitsbereich berücksichtigen und die Daten vorsichtig interpretieren. Die Schätzung des R-Werts sollten wir zudem immer mit weiteren Kenngrössen der Pandemie abgleichen, denn ein einzelner Schätzer reicht nicht aus, um ein vollständiges Bild der epidemiologischen Situation zu haben.

Wir alle hätten gerne Sicherheit in diesen unsicheren Zeiten. Die Statistik kann uns die jedoch nicht immer bieten. Es gibt keine Möglichkeit, diese Unsicherheit wegzuzaubern. Sie ist eine direkte Folge davon, dass wir es mit Vorgängen in der realen Welt zu tun haben. Wir müssen die Unsicherheit also akzeptieren und als Gesellschaft einen Weg finden damit umzugehen. In unserem Team verfolgen wir das Ziel, basierend auf den verfügbaren Daten Dynamiken zu erkennen, mögliche Szenarien aufzuzeigen und diese mit Wahrscheinlichkeiten zu beziffern. Wie wir gemeinsam darauf reagieren, ist dann ein Entscheid von Politik und Gesellschaft.

Referenz