Findet den Unterschied

Man braucht schon mathematische Verfahren aus dem Big Data-Bereich, um die Grenzen der Parteien zu entdecken.

Die Zeit vor der Wahl, ein Routinebetrieb, so scheint es. Die Medien zitieren fast täglich neue Umfragen und man selbst macht sich Gedanken, wem man dieses mal eine Stimme schenken will – oder welche Parteien man überhaupt für wählbar hält. In diesem Jahr ist die Entscheidungsfindung besonders schwer. Zum einen drängt sich dem interessierten Bürger das Gefühl auf, dass der türkische Präsident Erdoğan in Deutschland engagierter für sein Referendum wahlkämpft als die Volksparteien für die Bundestagswahl; zum anderen helfen auch die inhaltlich hochangereicherten Slogans der Parteien nur bedingt.

Ein Ausweg soll sein: der Wahl-O-Mat, angeboten von der Bundeszentrale für politische Bildung. Dahinter steckt ein populärer Computeralgorithmus, der als Informationsangebot gedacht ist, aber auch als Entscheidungshilfe für die Wahl dienen kann. Er funktioniert leicht vereinfacht so: Die zur Wahl stehenden Parteien werden zu 38 Thesen befragt. Die Parteien dürfen zu jeder These aus drei Antworten wählen: Zustimmung, Ablehnung und Neutralität. Die Antworten der Parteien werden im Wahl-O-Mat gespeichert. Jetzt ist der Wähler dran: er darf zu denselben Thesen ebenfalls zustimmen, ablehnen oder neutral antworten. Die Antwortkette wird mit den Antwortketten der Parteien verglichen. Übereinstimmende Antworten geben zwei Punkte, gegensätzliche Zustimmung beziehungsweise Ablehnung ergeben null Punkte. Kombinationen wie ‚Neutral und Ablehnung‘ ergeben einen Punkt. Für jede Partei erhält man so den Prozentsatz der maximal möglichen Punkte. Diese Antwort soll Orientierung liefern, welche Partei am besten zum eigenen Meinungsbild passt.

Mathematisch ist dieser Ansatz sehr vielversprechend. Allein: Er nützt dieses Jahr nicht viel. Denn es stimmt ja, was der Herausgeber dieser Zeitung bemängelte (siehe F.A.Z. vom 8. September): Wenn sich mehrere Parteiprogramme so stark ähneln, dass am Ende alle nur ein paar Prozentpunkte unterschiedlich weit von meinen Wünschen entfernt liegen, hilft die Information auch nicht recht weiter. Was nützt eine Wahlempfehlung, bei der die vier heute im Bundestag vertretenen Parteien sich gewissermaßen den ersten Platz teilen?

Zunächst stellt sich die Frage, ob die Beobachtungen der Ähnlichkeit Einzelfälle sind. Um das herauszufinden, habe ich mir den Wahl-O-Mat am eigenen Computer auf eine Weise nachgebaut, die es mir erlaubt, extrem schnell hunderttausende Anfragen von ratsuchenden Wählern zu simulieren. Jede dieser virtuellen Zufallswähler beantwortet die 38 Thesen, wobei er im Schnitt zehn Prozent neutrale Antworten, 45 Prozent Zustimmungen und 45 Prozent Ablehnungen zu den Thesen abliefert. Diese Antworten der Zufallswähler wurden, wie der echte Wahl-O-Mat es tut, gegen die Antworten der Parteien vermessen (allerdings nur gegen die, die auch eine realistische Chance haben, in den Bundestag zu kommen: CDU, SPD, Grüne, Linke, FDP, AfD).

Wenn wir nicht nur die Partei mit dem höchsten Prozentsatz an Übereinstimmung als Sieger gelten lassen, sondern auch dicht darauffolgende Parteien (alle binnen 8 Prozentpunkten), ist das ungefähr das geschilderte Szenario. Ergebnis meiner Simulation: Für mehr als ein Drittel aller virtuellen Zufallswähler gab es mindestens vier Siegerparteien. Und das, obwohl nur die sechs genannten Parteien überhaupt getestet wurden und darin in Form von AfD und Linkspartei die rechten und linken Enden des mutmaßlich nächsten Bundestages schon enthalten waren.

Machen wir das Experiment noch einmal, aber diesmal ohne die rechten und linken Enden: nur mit den Parteien CDU, SPD, FDP und Grüne. Dann erhalten mehr als 47 Prozent aller Zufallswähler mindestens drei Sieger - von vier Parteien. Eine Entscheidungshilfe sieht sicher anders aus. Der Wähler kann anhand der Ergebnisse nicht unterscheiden, ob er selbst politisch bunt ist, oder die Parteien einen inhaltlichen Konsens bilden.

Und doch wäre es nicht gerecht, dem Wahl-O-Mat die Schuld dafür zu geben. So vielversprechend dessen Ansatz auch sein mag: Bei seiner Entwicklung hat sich das gefühlte Zusammenwachsen der Parteien wohl niemand träumen lassen. In einer Zeit, in der die CDU die Energiewende und die Ehe für alle durchgesetzt hat, die Spitzenkandidatin der Linkspartei äußert, dass kriminelle Flüchtlinge ihr Gastrecht „dann eben auch verwirkt“ hätten, und man beim Kanzlerduell jeden Moment erwartet, dass die Kontrahenten sich in die Arme fallen und die Fusion der Volksparteien verkünden (so K.T. zu Guttenberg sinngemäß nach der Sendung), darf auch ein Computeralgorithmus schon mal die Orientierung verlieren.

Ich möchte darum allen, die zwischen den gängigen Parteien beim besten Willen keine Unterschiede mehr ausmachen können, zeigen, dass es doch Unterschiede gibt. Es mag Bürgern mit nur im üblichen Maße ausgeprägtem politischem Interesse zwar schwerfallen, diese noch mit bloßem Auge zu sehen. Aber wer etwas Aufwand zu treiben bereit ist und die richtigen Hochleistungs-Meßmethoden anwendet, kann doch noch etwas feststellen.

Wir werden zwei mathematische Verfahren aus dem Arbeitsbereich „Big Data“ anschaulich machen, um wenigstens ansatzweise wieder eine Ordnung unter die Parteien zu bringen. Beide Ansätze enthalten Grundrauschen, kein Ansatz ist der Weisheit letzter Schluss, und dennoch kann man mit ihnen einen visuellen Überblick über die Parteienlandschaft erhalten, um diese besser zu durchdringen.

Im ersten Ansatz wollen wir die Parteienlandschaft als eine Art Landkarte darstellen. In der Informatik nennt man eine solche Landkarte einen Graphen. Graphen sind dort ein gängiges Mittel, um Orte und Verbindungen zwischen den Orten mathematisch darzustellen. Beispielsweise ist Facebook ein großer Graph. Die Orte sind hier Personen, und die Verbindungen sind Facebook-Freundschaften. Was sind nun die Verbindungen, wenn wir die Parteien als Orte nehmen?

Das Auslesen der Antworten aller Parteien auf die Thesen ermöglicht uns, diese gegeneinander zu vergleichen. Der Vergleich erfolgt genau so, wie der Wahl-O-Mat die Partei-Antworten mit den Antworten ratsuchender Wähler vergleichen würde. Wir vergleichen jede der 32 teilnehmenden Parteien mit jeder anderen. So erhalten wir 496 potentielle Verbindungen, wobei die Prozentzahl, die beim Vergleichen nach Wahl-O-Mat-Methodik herauskommt, die Stärke einer jeden Verbindung ist. Das sind sehr viele Verbindungen, die sowohl Bild als auch Mathematik schnell unübersichtlich werden lassen. Wir nehmen daher nur die stärkere Hälfte der Verbindungen tatsächlich in unseren Graphen auf.

Je stärker eine Verbindung ist, desto dicker zeichnen wir sie auch im Bild. Solche starken Verbindungen wirken für unser Bild außerdem wie stramme Federn – sie ziehen die durch sie stark verbundenen Parteien näher zueinander. Parteien, die verbunden und nahe beieinander sind, sind also tendenziell verwandt aus Sicht der Beantwortung der Wahl-O-Mat-Thesen. Hier ist die Landkarte:

Man kann den Graphen sehr gut nutzen, um auch solche kleineren Parteien ungefähr zu verorten, von deren Existenz man vielleicht noch gar nichts wusste. Interessant ist auch, dass man deutlich sieht, wie sich eine sehr dichte Gruppe aus kleinen, untereinander stark verbundenen, dem Ort im Graphen nach politisch eher links gerichteten Parteien herauskristallisiert hat. Diese Parteien sind untereinander sehr viel ähnlicher als alle restlichen Parteien untereinander, darum drängen sie sich so zusammen.

Nachdem wir nun einen Überblick über die Parteienlandschaft gewonnen haben, können wir dies mit einer weiteren Visualisierung noch vertiefen. Wieder legen wir die Daten zugrunde, welche Partei zu welcher These wie abgestimmt hat. Aber jetzt wollen wir nicht nur über die Parteien etwas lernen, sondern auch über die Thesen. Die folgende Ansicht ist viel informationstragender als der Graph, aber leider ist sie dafür etwas komplexer. Ich präsentiere sie zuerst, und danach führe ich schrittweise heran (klicken zum Vergrößern):

Der Kern der Grafik, das große rotblaue Rechteck, ist eine sogenannte Heatmap. Das ist nichts weiter, als die farbliche Darstellung einer Tabelle. Die Zeilen der Tabelle sind die 38 Thesen des Wahl-O-Mats. Die Spalten sind die Parteien. Thesen sind rechts beschriftet, Parteien unten. Über dem großen Rechteck findet man bei den bekannteren Parteien noch deren Farbe. Die Heatmap stellt die Antworten der jeweiligen Parteien zu den jeweiligen Thesen dar. Rot ist Zustimmung, Blau ist Ablehnung, Grau ist Neutralität. Man kann sehr schön eine Anomalie sehen: Die Gesundheitspartei (5. von links) hat überall neutral abgestimmt.

Will man wissen, ob zwei Parteien einander, was die Beantwortung der Wahl-O-Mat-Thesen angeht, nah oder fern sind, so muss man auf die baumartige Verwandtschaftsstruktur über der Tabelle schauen. Diese wurde algorithmisch und darum unvoreingenommen und ohne Ansehen der Parteien anhand der Ähnlichkeit der Partei-Antworten auf die Thesen ermittelt. Wir betrachten ein paar Beispiele:

Der politische Weg von der NPD zu „Die Rechte“ ist sehr kurz. Wir sehen das daran, dass diese beiden Parteien durch dieselbe, hierarchisch an unterster Stelle stehende Verästelung verbunden werden. Der politische Weg von „Die Rechte“ zur AfD ist immer noch sehr kurz, aber schon etwas länger. Man muss eine Verästelungsebene höher im Baum laufen, um seinen Weg zu gehen. Der politische Weg von den Grünen zur AfD ist dagegen, wer hätte das geahnt, sehr weit. Man muss von einer der beiden Parteien ganz bis zur Wurzel des Verwandtschaftsbaumes laufen, um zur anderen zu kommen. Mehr Abstand gibt das politische Spektrum kaum her. CDU und SPD sind übrigens sehr nah beieinander.

Der Partei-Verwandtschaftsbaum bestimmt die Ordnung der Spalten. Die Parteien sind also – wenn auch grob – nach Ähnlichkeit geordnet.

Das Besondere ist aber, dass wir nicht nur etwas über das Verhältnis der Parteien zueinander lernen können, sondern umgekehrt auch etwas über das Verhältnis der Thesen zueinander. Thesen sind dann verwandt miteinander, wenn sie ungefähr dasselbe Abstimmungsverhalten über die Parteien hinweg erzeugen. Auf der linken Seite des Bildes findet sich darum noch ein weiterer Verwandtschaftsbaum – der Thesen. Und auch die Thesen sind grob nach Ähnlichkeit geordnet.

Eines der Resultate dieser Doppelordnung ist das riesige rote Rechteck oben links in der Heatmap. Erinnerung: Rot war die Zustimmung einer Partei zu einer These. Bei der oberen Hälfte der Thesen bzw. dem oberen Hauptast des Thesen-Verwandtschaftsbaumes scheint es sich primär um linke Herzensangelegenheiten zu handeln. Ein kurzer Blick über die Namen der Thesen spricht ebenfalls dafür. Politisch hier vom Algorithmus eher links verortete Parteien befürworten fast übergreifend die doppelte Staatsbürgerschaft, Dieselbesteuerung, Tempolimit, das bedingungslose Grundeinkommen, einen Schuldenschnitt für Griechenland, das ausnahmslose Verbot von Rüstungsexporten, die Vermögenssteuer, Projekte gegen Rechtsextremismus, sozialen Wohnungsbau, und noch ein paar andere Sachen.

Die Ordnung von Thesen und Parteien nach Ähnlichkeit eignet sich auch ganz wunderbar zur visuellen Ausreißersuche. Das geht besonders gut in homogenen Gebieten der Heatmap. Es bietet sich beispielsweise an, in dem roten Rechteck der linken Herzensthemen und Parteien nach vereinzelten blauen Punkten zu suchen. So sind zum Beispiel ausgerechnet die Grünen gegen ein ausnahmsloses Exportverbot von Rüstungsgütern (der Fairness halber: Nicht alle Thesen sind gut mit „ja“ oder „nein“ zu beantworten! Die Webseite des Wahl-O-Maten stellt Begründungen der Parteien zu ihren Antworten zur Verfügung). Die Grünen sind auch gegen den vorgezogenen Renteneintritt als eine der ganz wenigen unter anhand ihrer Thesenantworten links verorteten Parteien. Die Piraten sind gegen generelle Tempolimits, was fast schon zu schön dem Klischee einer Partei mit eher jüngeren Mitgliedern entspricht. Die anderen Parteien sind insgesamt weniger homogen in ihrem Antwortverhalten, darum können wir bei ihnen rein visuell weniger gut Ausreißer finden. Ich möchte dem Leser aber auch noch Raum zum Selbstforschen lassen, deshalb nun zurück zur eigentlichen Botschaft:

Wir haben die Funktionsweise des Wahl-O-Maten kennengelernt. Wir haben gesehen, dass es dort für sehr viele Wähler den Anschein haben kann, als würden sich die Positionen der Parteien im politischen Spektrum gar nicht mehr groß unterscheiden – eine Beobachtung, die sich dem unbedarften Bürger freilich auch unabhängig vom Wahl-O-Maten aufdrängen kann.

Die Kritiker der Parteienlandschaft sind nun widerlegt, und zwar durch zwei verschiedene Ansätze: Allen Unkenrufen zum Trotz sind tatsächlich noch politische Richtungen und Unterschiede zwischen den Parteien messbar, auch wenn es auf Anhieb nicht so aussieht. Und die politische Landschaft gliedert sich dann auch ungefähr so, wie man es erwartet.

Was es allerdings über unsere Demokratie aussagt, dass man für diesen Nachweis Computerpower und mathematische Methoden aus dem Umfeld der künstlichen Intelligenz benötigt, ist eine andere Frage.


Dahinter steckt fast immer ein kluger Kopf. - Wie die FAZ einen Artikel von mir vergeigte

Dieser Artikel hat eine interessante Vorgeschichte, die früher in diesem Blogartikel vor dem eigentlichen Artikel stand. Der Artikel sollte eigentlich in dieser Form das Feuilleton-Wahl-Spezial der FAZ aufmachen. Das ist zwar passiert, aber ziemlich schiefgelaufen, was für eine interessante Vorgeschichte und Anekdote gesorgt hat. Die findet ihr nun hier, unter dem Artikel.

Vor ca. zwei Wochen rief mich ein Redakteur der Frankfurter Allgemeinen Zeitung an und bat darum, dass ich einen Artikel fürs Feuilleton schreibe. Es sollte um meine Wahlomat-Auswertungen gehen (Hier mit der Heatmap und hier mit der Landkarte), aber auch für jeden verständlich Mechanismen der Big Data erklären. Beide Artikel leben – ihr ahnt es – ganz existenziell von den Bildern. Und darum war selbstverständlich auch geplant und schriftlich zugesichert, die Bilder entsprechend groß abzudrucken.

Heute schaue ich in die FAZ - und was sehen meine müden Augen? Den Artikel.

  • Ohne Bilder.
  • Aber mit allen Textstellen, die sich auf die Bilder beziehen (sonst wäre der Artikel auch vermutlich ungefähr drei Worte lang).
  • Und mit expliziten, von der FAZ eingefügten Verweisen auf die Bilder.
  • Statt der Originalbilder gibt es fünf rote Wahlkreuzchen-Symbolbildern, die man eher bei Bento erwartet hätte, und einen roten Buntstift. Die Kreuzchen in dermaßen schlechter Qualität, dass man im Druck die JPEG-Artefakte sieht.
  • Mit absprachenfrei geändertem Titel und Teaser.

Mit anderen Worten: Die Bilder wurden nicht mal gestrichen, sie wurden schlicht im Layout vergessen. Und in der Schlussredaktion wurde die Pleite nicht bemerkt. Und vermutlich in einigen weiteren Prozeßschritten, die ich von außen nicht absehen kann.

Was übrigens nicht geändert wurde, ist mein Name darunter. Eine Freigabe existierte für eine solch entstellte und zusammenhanglose Version selbstverständlich nicht. Es ergäbe ja auch keinen Sinn, sie zu drucken. Für mich nicht, für die FAZ nicht, aber vor allem für die Leser nicht.

So eine Meisterleistung muss man erstmal schaffen. m( Man darf sich auch gerne mit einem völlig entstellten Artikel blamieren. Aber man sollte dann nicht einen fremden Namen von jemandem drunter schreiben, der schriftlich nachvollziehbar machen kann, die Sache niemals freigegeben zu haben.

Ergebnis 1: Ich kriege jetzt humorvoll formulierte eMails, die nach den Bildern fragen. Ergebnis 2: Ich ärgere mich rechtschaffen darüber, für die FAZ ein Wochenende damit zugebracht zu haben, und darüber wird auch noch zu reden sein.

Der Sinn war ja gerade, dass die Leser zuhause in den großen Bildern – die die Leser meines Blogs schon kennen – selbst herumforschen können und dabei sozusagen spielerisch und unterhalten von ein bisschen Humor über die Parteienlandschaft erfassen können, was Big Data eigentlich ist. Wie in meinen Vorträgen eben.

Aus diesem Grund poste ich den Artikel hier in voller Länge. Mit Bildern. Mit korrektem Titel und Teaser. Ob sie inhaltlich sonst was unabgesprochen geändert haben, weiß ich nicht. Die hier gepostete Variante ist jedenfalls die, die ich freigegeben habe.

Danke euch allen für die vielen Emails und Benachrichtigungen!

Edit: Weil ein paar Leute nachgefragt haben: Die Sache gewinnt langsam an Unterhaltungswert. Da es aber nicht meine Absicht ist, andere bloßzustellen, werde ich hier keine Einzelheiten posten können.
Edit 2: Die FAZ hat den Artikel jetzt online gestellt - wiederum in einer nicht freigegeben Version, und mit einem Wahlplakat mit Angela Merkel mit Hitlerbärtchen. Nein, wirklich! Klickt auf den Screenshot rechts. 8-O Wow. Und wieder mit Text, der nicht zu den Bildern passt (sie haben die Baumstrukturen der Heatmap abgeschnitten, die Absätze darüber aber drin gelassen). Und wieder unter meinem Namen. Es wird immer besser. Selbst wenn sie es nochmals versuchen, bleibt die Arbeitsqualität schlecht! Wow. Sowas hätte ich niemals bei der FAZ vermutet. 8-o
Edit 3: Das Hitlerbild ist jetzt weg. Text bezieht sich immer noch in mehreren Absätzen auf Bildanteile, die sie weggestrichen haben. Es ist mir jetzt zu peinlich, da immer und immer wieder hinterherzumailen. Wir sind hier doch nicht im Kindergarten. Ich kann nur sagen, dass die Auftürmung dieser unterirdischen Arbeitsqualität bei mir für helles Entsetzen sorgt. Da sich von der FAZ keiner mehr meldet (klar, Wahl), habe ich die Angelegenheit zusammengefasst, die schriftlichen Nachweise in Form einer Vielzahl von Mails zusammengesucht, und das an einen Medienrechtler gegeben. Abhängig davon, was mir geraten wird, schaue ich jetzt, was ich weiter mache.
Edit 4: Wir haben uns ausgesprochen, es gibt Einvernehmen darüber, dass das alles nicht so gut gelaufen ist und wir haben uns gütlich geeinigt. Da der Artikel zumindest auf meinem Blog sehr gut angekommen ist, lasse ich ihn hier online.