Corona-Plots und Interpretationshilfen, garantiert unaufgeregt.

Auf dieser Seite findet ihr kurz kommentierte, mehrmals täglich aktualisierte Plots zu Covid19-Fallzahlen (vulgo: Corona). Die Seite ist mittlerweile ziemlich angewachsen – nutzt das Inhaltsverzeichnis oben auf der Seite oder die Volltextsuche. Die Datenquelle ist die der Johns Hopkins University.

Wir fangen mit Deutschland an, woran ich die grundsätzlichen Elemente in den Grafiken erkläre und Interpretationshilfen liefere. Danach kommen auch noch andere bevölkerungsreiche Länder nach Kontinent geordnet, und ein paar von den Daten (sofern die Daten akzeptabel aussahen, also nicht wundern, wenn ein paar fehlen, die ihr erwartet). Alle Kommentare Stand 29. März 2020.

Ich liefere keine direkten Vergleichsplots von Fallzahlen in mehreren Ländern auf einmal, weil jedes Land seine eigenen Messverfahren haben wird und ich die Zahlen nur bedingt für vergleichbar halte. Sofern die Länder selbst die Messverfahren nicht während des Messzeitraums gravierend verändern, kann man die Daten aber heranziehen, um einen Verlaufseindruck für das Land selbst zu bekommen. Was man aber machen könnte, wäre die prozentualen Wachstumsraten vergleichen. Vielleicht mache ich das noch, mal sehen.

:!: Der Download aller Länderdaten (nicht der deutschen Bundesländer) als CSV findet sich hier. Automatisierte Downloads, die enger getaktet sind als stundenweise, bitte vorher absprechen. Bitte beachtet, dass LibreOffice gerne mal den Datenimport verkackt und in Spalten verrutscht. Wenn ihr also LibreOffice habt, guckt noch mal genau nach, bevor ihr mich via Mail auf Datenfehler hinweist. Ich hatte jetzt mehrere. :-)

Deutschland

Das wichtigste ist: Was nur kurzfristig ist, ist erstmal nicht wahr. Wenn ihr weniger Neuinfektionen an Wochenanfängen und Wochenenden seht, würde ich darauf erstmal nichts geben, da ist nämlich Behördenwochenende (kein Witz!). Achtet auf die sehr regelmäßigen Schwankungen nach unten. Auch und gerade das deutsche Robert-Koch-Institut gerät immer wieder wegen seiner Datenqualität in die Kritik. Auch sonst: Schwankungen in allen Daten sind üblich! Ich würde in den Daten generell nur auf längerfristige Trends achten. You have been warned.

Linker Plot, dicke schwarze Linie: Das vermisse ich medienübergreifend, und es ist aus meiner Sicht das allerwichtigste. Das ist das prozentuale Wachstum aller aktiven Covid19-Fälle pro Tag. Hieran kann man auf einen Blick das Wachstumsverhalten der Ansteckungen sehen. Die Linie ist etwas geglättet (für die Techies: alle Glättungen rollender Durchschnitt über 7 Tage, Minimum 5 Punkte), das Original ist die durchsichtigere zackelige Linie dahinter.

  • Wird die Ausbreitung nicht gebremst, schwankt das Wachstum in den meisten Ländern irgendwo um die 25% am Tag.
  • Stabile höhere Werte weisen auf besonders große Ansteckungszahlen hin, oder darauf, dass man im Vorhinein zu wenig auf Covid19 getestet hat.
  • Stabile niedrigere Werte deuten auf eine Einbremsung der Ansteckungen hin.
  • Negative Werte erhält man, wenn die Leute schneller genesen als neue Leute angesteckt werden (beispielsweise, wenn die erste riesige Bugwelle infizierter durch eine Ausgangssperre abgebaut wird).

Linker Plot, farbige Fläche: Alle gemeldeten Fälle (blau). Wo Länder es melden, sind die Genesenen grün und die verstorbenen rot. Die gesamten gemeldeten (inklusive Genesenen und Toten) sind die von den Medien immer zitierte Zahl.

  • Breitet sich der Virus ungehindert aus, wächst die Fallzahl exponentiell, bis die Durchseuchung der Menschenpopulation hoch genug ist.
  • Wird die Fallzahl irgendwann nicht mehr größer, ist die Pandemie im jeweiligen Land eingedämmt (siehe z.B. China). Das ist das Ziel. Irgendwann hat man dann keine blauen Flächen mehr, sondern vermehrt grüne (Genesene) mit hoffentlich kleinem Anteil rot (Tode).
  • :!: Achtung: Die Zahlen der Genesenen werden teilweise von mir korrigiert. Ich zähle Fälle nun automatisch als genesen, wenn sie nicht spätestens 18 Tage nach initialer Meldung als verstorben oder genesen gemeldet wuden. Das entspricht ca. 23 Tagen ab Infektion; das ist ein langer Verlauf und damit eine konservative Annahme. So begegne ich der Tatsache, dass einige Länder keine oder unrealistisch wenig Heilungen berichten. Diese meiner Meinung nach vernünftige Korrektur hat einige interessante Auswirkungen auf ein paar wenige Länder. Beispiele (nicht unbedingt erschöpfend):
    • Die Niederlande melden fast keine Genesungen und haben jetzt eine realistische Genesungszahl.
    • Italiens Erholungszahlen werden in den letzten Tagen ihres Plots nach oben korrigiert, analog zu dem heftigen Anstieg der Fallzahlen 18 Tage zuvor.
    • Chinas prozentuale Ausbreitungsrate des Virus wird gegen Ende der Beobachtungszeit nach oben korrigiert. Warum? Sie wird anhand neuer Fälle im Vergleich zu den derzeit aktiven Fällen berechnet, und nach meiner Heuristik haben sie jetzt weniger aktive Fälle, da einige von ihnen als genesen markiert wurden.
    • Großbritannien hat mehr Tote als heuristisch erzeugte Genesungen und darum selbst nach Korrektur immer noch keine Genesungen.

Rechter Plot: Tagesverlauf der neu gemeldeten Fälle / Tode / Heilungen in analogen Farben. Wieder geglättete dick, mit Originalen dahinter. Ziel ist, die neuen Fälle dazu zu kriegen, weniger schnell anzusteigen, dann sinken zu lassen, und schlussendlich auf 0 zu drücken. Das ist das, was man eigentlich zur Prognose heranziehen sollte, denn jeder neu gemeldete Fall wird mit gewisser Wahrscheinlichkeit eine gewisse Zeit nach Meldung hospitalisiert, und mit geringerer Wahrscheinlichkeit landet er nach ein paar weiteren Tagen auf der Intensivstation. Die Profis werden das vermutlich auch genau so machen. Ich habe hier dennoch mehr Priorität auf den Verlauf der kumulativen Fälle gelegt, weil ich euch von dem abholen wollte, was ihr schon kennt, und was meistens zitiert wird.

Deutsche Bundesländer

Die Zahlen für die deutschen Bundesländer kommen vom RKI. Das RKI hat auch hübsche, jedoch weniger kompakte Dashboards, und zwar hier auf Bundeslandebene und hier auf Landkreisebene. Beachtet den Meldeversatz und glaubt nichts, was nicht eine Woche Daten enthält. Meine geglätteten Linien enthalten genug Daten. Wundert euch nicht, wenn die Bundesländer in der Summe nicht immer komplett konform zum oben gezeigten gesamtdeutschen Plot sein müssen; es ist ja bekannt, dass die Johns Hopkins University (meine Datenquelle für den gesamtdeutschen Plot) dem RKI teilweise etwas voraus ist.

Baden-Württemberg

Bayern

Berlin

Brandenburg

Bremen

Hamburg

Hessen

Mecklenburg-Vorpommern

Niedersachsen

Nordrhein-Westfalen

Rheinland-Pfalz

Saarland

Sachsen-Anhalt

Sachsen

Schleswig-Holstein

Thüringen

Europa, außer Deutschland

Belgien

Dänemark

Finnland

Frankreich

Großbritannien

Der Einsatz des Vereinigten Königreichs als statistische Kontrollgruppe wird unvergessen bleiben. (GB war verhältnismäßig spät dran mit Gegenmaßnahmen.)

Italien

Niederlande

Norwegen

Österreich

Schweden

Schweden ist auch als statistische Kontrollgruppe interessant, weil sie einen liberaleren Ansatz der Eindämmung verfolgen als die meisten anderen Länder.

Schweiz

Spanien

Nordamerika

Kanada

Mexiko

USA

Sehr hohe Fallzahlen bei nahezu ungebremster Ausbreitung. Aktuell der schlimmste Plot meiner Aufstellung. Die anfangs durchgehend anormal hohen prozentualen Fallzuwächse lassen vermuten, dass sie beim Testen von ihren eigenen Fallzahlen überrascht wurden.

Südamerika

Argentinien

Brasilien

Kolumbien

Asien

China

Hinweis: Es gibt Leute, die die chinesischen Zahlen in Zweifel ziehen. Falls sie denn stimmen: So sieht es aus, wenn man den Virus eingedämmt hat. Fallzahlen statisch, prozentuales Wachstum der Fallzahl bei null, Neufälle nahe null. Bei der dicken Stufe in der kumulativen Fallzahl / dem dicken Peak in den Tagesfällen haben sie das Messverfahren geändert.

Indien

Indonesien

Japan

Pakistan

Russia

Südkorea

Afrika

Ägypten

Südafrika

Updates (nur größere)

  • 2020-04-04: Unterscheidung in Aktive Fälle / Geheilte / Tode hinzugefügt
  • 2020-04-07: Prozentuales Wachstum nur noch auf aktiven Fällen berechnet, rote Orientierungslinie entfernt. Das bedeutet, dass das prozentuale Wachstum nun auch negativ werden kann. Geht es unter 0, wird bei 0 eine Orientierungslinie eingefügt, um das hervorzuheben. Legenden etwas aufgeräumt.
  • 2020-04-09: Aktive Fälle werden 18 Tage nach initialer Meldung (ca. 23 Tage nach Infektion) automatisch als genesen gezählt, sofern sie nicht als verstorben oder genesen gemeldet wurden. Manche Länder reportieren sauber Neufälle und Tode, jedoch nur unzuverlässig oder gar keine Genesungen. Plot-Farben noch mal etwas optimiert.
  • 2020-04-10: Die täglichen Todesfälle haben jetzt ihre eigene y-Achse im rechten Plot pro Land. An der Legende muss allerdings noch ein wenig gefeilt werden, da die y-Hilfslinien der neuen zweiten y-Achse jetzt über die Legende gedruckt werden. Es ist aber Ostern und ich bin grade zu faul. Außerdem haben wir jetzt kurze Notationen für Achsen-Tick-Labels (z.B. 100K statt 100000)
  • 2020-04-17: Aktive Fälle in der kumulierten Darstellung befinden sich jetzt am unteren Rand, um ihren Rückgang besser sichtbar zu machen. Danke an die diversen Leute, die das vorgeschlagen haben. Außerdem kleinere Layout-Verbesserungen.