Wahl-O-Mat-Auswertung, Teil 2: Thesen- und Parteienverwandtschaften

Heute geht es noch mal ein bisschen um den Wahl-O-Mat. Wie letztes mal werte ich die Parteien nach ihren Antworten auf die Wahl-O-Mat-Thesen aus, aber diesmal rendere ich daraus keine Landkarte, sondern eine Cluster Heatmap. Diese Art der Grafik ist etwas komplexer. Dafür ist sie sehr Informationstragend. Ich präsentiere sie wieder zuerst, und danach führe ich euch schrittweise heran. Wie immer könnt ihr die Grafik zum Vergrößern klicken.

Was also sehen wir hier? Der Kern der Grafik, das große rotblaue Rechteck, ist eine sogenannte Heatmap. Das ist nichts weiter, als die farbliche Darstellung einer Tabelle.

Zeilen, Spalten, Heatmap

Die Zeilen der Tabelle sind die 38 Thesen des Wahl-O-Mats (damit ihr euch nicht durchklicken müsst: Die Thesen gibt es hier). Die Spalten sind die Parteien. Thesen sind rechts beschriftet, Parteien unten. Über dem großen Rechteck findet ihr bei den bekannteren Parteien noch deren Farbe.

Das große blaurotgraue Rechteck in der Mitte sind nun die Antworten der jeweiligen Parteien zu den jeweiligen Thesen. Rot ist Zustimmung, Blau ist Ablehnung, Grau ist Neutralität. Man kann sehr schön sehen, dass die Gesundheitspartei (5. von Links) überall neutral abgestimmt hat. Das war auch schon die Heatmap, die könnt ihr jetzt lesen.

Gruppierung der Parteien

Jetzt ist euch bestimmt schon aufgefallen, dass sowohl die Thesen, als auch die Parteien keine Ordnung haben, die man auf Anhieb versteht. Auf den ersten Blick scheinen die „irgendwie“ durcheinandergewürfelt zu sein.

Des Rätsels Lösung ist: Sowohl Thesen als auch Parteien sind –grob! – nach Ähnlichkeit geordnet! Zwei Parteien sind ähnlich, wenn ihre Antworten auf die Thesen sich gleichen (in der Heatmap sind das ähnliche Spalten). Und das geht auch andersrum: Zwei Thesen sind einander ähnlich, wenn sie von den gleichen Parteien gemocht bzw. nicht gemocht werden (das sind dann ähnliche Zeilen).

Wir schauen uns erstmal die Reihenfolge der Parteien an. Die haben sich anscheinend automatisch nach ihrer politischen Richtung angeordnet (ja, automatisch, das ist nicht mein Werk, und das ist das interessante daran!).

Die fünf linkesten Parteien waren durch den Algorithmus nicht so gut einzusortieren. Ich nenne sie „die Eigensinnigen“. Dazu gehört die gut sichtbare Gesundheitspartei, die alle Thesen neutral angekreuzt hat. Danach folgt der riesige, anscheinend links ausgerichtete Parteiblock, den wir schon im letzten Artikel gesehen hatten.

Diese Gruppe Parteien ist in sich sehr, sehr homogen. Im Wesentlichen mögen sie alle die oberen Thesen, darum ist da alles rot. Und sie lehnen die unteren Thesen ab, darum ist da alles blau.

Rechts vom der homogenen Gruppe kommen die Parteien der Mitte (FDP, SPD, CDU) und alle drumherum, wobei ich die CDU hier als rechte Grenze sehe. Die erste Partei rechts vom Linken Block ist hier interessanterweise die FDP (leicht abweichend von unserer Graphik aus dem letzten Artikel, aber dazu was hier die Abstände zwischen den Parteien sind, kommen wir noch).

Es folgt die Partei der „Volksabstimmung“, war wohl nicht so dolle einzusortieren, dazu später mehr. Und danach folgen die vier rechten Parteien. Hier kann man wieder unterteilen, dass erst die „eher rechten“ Parteien BP und AfD kommen, und danach die noch extremeren. BP und AfD waren auch im letzten Artikel schon sehr verwandt.

Gruppierung der Thesen

Jetzt zu den Thesen. Wir sehen den riesigen roten, fast massiven Block oben links in der Heatmap. Links sind die anscheinend links ausgerichteten Parteien, und rot ist Zustimmung. Ich wiederhole noch mal: Die Ausrichtungen der Parteien wurden hier nur an der Antwort auf die Wahlomatthesen vermessen, das ist alles unscharf (wenn auch interessant). Diese Thesen scheinen also alles linke Herzensangelegenheiten zu sein, wohingegen bei den linken Parteien unten fast alles blau ist, also abgelehnt wird. Wir machen mal ein paar Stichproben.

Die Linken mögen fast übergreifend die Doppelte Staatsbürgerschaft, Dieselbesteuerung, Tempolimit, Bedingungslose Grundeinkommen, Schuldenschnitt für Griechenland, das ausnahmslose Verbot von Rüstungsexporten, Vermögenssteuer, Projekte gegen Rechtsextremismus, sozialen Wohnungsbau, und noch ein paar andere Sachen. Scheint echt zu passen.

Der Witz ist, dass in diesem homogenen roten Block Ausnahmen sofort sichtbar sind. Das können wir jetzt nutzen, um mittels fiesesten Vorurteilen etwas Ketzerei zu betreiben. So sind zum Beispiel ausgerechnet die Grünen gegen ein ausnahmsloses Exportverbot von Rüstungsgütern. I shit you not, schaut selbst. :-) (Sicher gibt es dafür Beweggründe, ihr könnt auf der Wahl-O-Mat-Seite in den Thesenbegründungen nachlesen, warum jede Partei wie abgestimmt hat.)

Die Grünen sind auch gegen den vorgezogenen Renteneintritt als eine der ganz wenigen unter den linken Parteien. Böswillige Menschen würden sich hier an das Zitat von Westerwelle erinnern: „Die eine Hälfte der Grünen ist beim Staat angestellt, die andere Hälfte lebt vom Staat.“ – dafür ist es zwangsweise erforderlich, dass die andern länger arbeiten.

Die Piraten sind gegen generelle Tempolimits, was auch herrlich dem Klischee einer Partei mit eher jüngeren Mitgliedern entspricht. Und die Kommunisten sind gegen ein bedingungsloses Grundeinkommen. :-)

Hier links verortete Parteien mögen fast übergreifend nicht: Sachgrundlose Befristung von Arbeitsverträgen, den Abbau von Staatschulden, eine Obergrenze für Asylsuchende. Auch plausibel.

Die anderen Parteien sind insgesamt ein weniger homogener Block, darum können wir da weniger lustige Ausreißer finden. Schade. Ich hätte gerne auch die andere Seite etwas ketzerisch aufs Korn genommen. Tobt euch aber gerne in den Kommentaren aus. :-) Homogen ist vor allem eine These: Die gesamten nicht-linken Parteien wollen keine höhere Dieselbesteuerung, fast alle linken Parteien schon.

Egal, genug vorgekaut, schaut euch selber an. Was wir noch nicht besprochen haben, ist, wie das Gruppieren funktioniert (diese Section ist für die technischer interessierten unter euch).

Hierarchical Clustering

Die Gruppierungsmethode hier heißt Hierarchical clustering, und wie der Name schon sagt, erstellt sie eine Hierarchie von Gruppen. Ineinandergeschachtelte Gruppen, sozusagen. Beispiel Parteien: Die Menge aller Parteien wird erstmal in zwei geteilt, und zwar mathematisch so, dass die beiden neu entstandenen Teilgruppen in sich möglichst homogen, also einander ähnlich sind (im Abstimmungsverhalten bezüglich der Thesen). Mit den Teilgruppen wird das dann wieder gemacht, und so weiter und so fort, bis jede Gruppe nur noch eine Partei stark ist.

Die entstandene hierarchische Gruppenstruktur wird durch die Bäume im Bild angezeigt. Oben ist der Baum für die Parteien, und links der für die Thesen. Wir beginnen mit dem Baum oben, der die Parteiordnung vorgibt. Wir bilden den hier mal zur Erklärung im Detail ab:

Wir sehen , dass die alleroberste Verästelung (nennen wir mal Split 1 – im Detailbild mit 1 gekennzeichnet) zwei Untergruppen produziert. In einer Gruppe sind alle eher rechten Parteien, und in der anderen Gruppe der ganze Rest: Mitte und Linke Parteien. Der Algorithmus findet also: Die mittleren Parteien sind den linken Parteien näher als den rechten. Schon mal interessant.

Betrachten wir nun die rechte Gruppe. Diese wird wieder in zwei gespalten (Split 2, ebenfalls im Detailbild nummeriert). Wie man am Baum sieht, wird die Volksabstimmungspartei als einzige abgespalten, und die rechteren und rechtsextremen Parteien bleiben beieinander. Wenn direkt so früh des Abspaltungsvorgangs im Abspaltungsvorgang einzelne Elemente abgespalten werden, kann das heißen, dass die Partei nicht gut einzuordnen war, und in der Tat ist die Volksabstimmungspartei eine der eigensinnigen. Die andere neu entstandene Teilgruppe aus Split 2 sind dann wirklich die vier rechten Parteien.

Generell gilt: Je tiefer Parteien voneinander getrennt werden, desto ähnlicher sind die sich. Parteien, die früh getrennt werden, sind nur in sehr weitgefassten Gruppen zusammen.

Diese Gruppe der vier rechten Parteien wird dann wieder gesplittet (Split 3), und heraus kommen wieder zwei Gruppen: Die Parteien AfD und BP und die Parteien NPD und die Rechte. Beide Zweiergruppen werden dann später noch mal zu Einergruppen geteilt.

Kommen wir zum riesigen linken Teilast, der bei Split 1 entstanden ist. Da läuft es genauso, den gehen wir etwas schneller durch. Zunächst enthält der Teilast die Gruppe der „Linken und Mitte“-Parteien, und ein paar eigensinnige sind wieder enthalten. Als erstes abgespalten wird die „Mitte“ von dem großen Block der „linken und eigensinnigen“. Die Mitte enthält unter anderem FDP, SPD, und CDU.

Der Baum, der die Thesen splittet, funktioniert genauso. Die verschiedenen ober und Untergruppen werden zueinander layoutet, und so ergibt sich eine einigermaßen schlüssige Ordnung der Thesen, wobei es hier genau andersrum ist: Thesen sind ähnlich, wenn die gleichen Parteien für oder gegen sie stimmen.

Comments

Aufgrund von Caching kann es bis zu zwei Minuten dauern, bis ein Kommentar erscheint!

Zwei schöne Posts - sowohl die Landkarte wie auch dieses Clustering. Eine Frage aber: Wie wird denn die Ähnlichkeit der Parteien und Thesen ermittelt? Der Text bleibt mit „mathematisch“ an dieser Stelle sehr vage, ein Verfahren wird es dazu ja aber sicherlich geben?

1 |
sehriehn
| 2017/09/16 12:44 | reply

@sehriehn: Na exakt so wie der Wahlomat es macht, ist doch komplett sauber definiert?

2 |
David Kriesel
| 2017/09/16 12:45 | reply

„Rot ist Zustimmung, Blau ist Ablehnung, Grau ist Neutralität“ - Na, da hätte man doch eine etwas intuitivere Zuordnung wählen können, oder?

3 |
Heatmap
| 2017/09/24 16:42 | reply

Sehr interessante Idee. Allerdings muss ich ganz unbescheiden darauf hinweisen, dass ich solche Auswertungen schon vor vielen Jahren in meinem Blog gemacht habe:

https://asmaier.blogspot.de/2014/05/europawahl-2014-interessante.html https://asmaier.blogspot.de/2013/09/bundestagswahl-2013-interessante.html https://asmaier.blogspot.de/2013/08/landtagswahl-in-bayern-2013.html https://asmaier.blogspot.de/2011/09/berlin-wahl-2011-interessante.html

Leider musste ich damit aufhören, da der Wahl-O-Mat und die Rohdaten dazu für die Wahlen der letzten Zeit nicht mehr als zip-Archiv vom bpb zur Verfügung gestellt wurden (auch nicht auf meine Nachfrage). Mich würde daher interessieren, wie sie an die Daten gekommen sind? Haben sie sie manuell abgetippt?

4 | | 2017/09/24 16:44 | reply

@sehriehn: zwei Parteien sind ähnlich, wenn sie viele der Fragen gleich beantworteten. Zwei Fragen sind ähnlich, wenn sie von vielen Parteien gleich beantwortet werden. Man könnte jetzt noch eine primäre Komponenten Analyse machen und die Fragen kürzen die mit einer anderen stark korrelieren.

5 |
ukezi
| 2017/09/25 00:59 | reply

@ukezi: Hat einer auf reddit gemacht, hat nicht viel gebracht. Direkt die erste Hauptkomponente hatte nur ~30% der Variabilität.

6 |
David Kriesel
| 2017/09/25 06:06 | reply

Das Schlimme am Wahl-O-Mat ist, dass die entscheidenden Fragen der AfD garnicht abgefragt wurden. Kein Wunder, dieses Computerspiel diente ja nur der reGierung (und vielleicht noch den lobbyverseuchten „etablierten“ Parteien) als Stimmenfang. Die viel beschworene politische Korrektheit wurde gegenüber der AfD gezielt nicht angewendet. Entscheidende Punkte bei dieser Partei (und nur dieser Partei) wären: die Haushaltsabgabe und Volksabstimmungen. Diese zwei Fragen siehe http://www.polpro.de/mm17.html#bts2 und http://www.polpro.de/fragen-i.html dort die Fragen 1 + 3

Es gab 6 Parteien die echte Aussicht auf das Parlament hatten. Also ca. 6 Fragen die speziell jede Partei betreffen. Aber so genau wollte man ja nun (aus guten Gründen) auch nicht sein. Der Wahl-O-Mat war nur ein Wahlkampfinstrument. Die Fragen wurden nachweislich von linken Kids aufgestellt, nicht von einer repräsentativen Bevölkerungsgruppe. Siehe

http://www.geolitico.de/2017/09/11/wahl-o-mat-von-vater-staat/#comment-16862

aber auch in Form von Satire

https://qpress.de/2017/09/07/wahl-o-mat-gehackt-grosse-gefahr-fuer-die-scheindemokratie/

Die Auswertung des Wahl-O-Mat ist Zeitverschwendung. Jedenfalls nach den Gesetzen der Dummheit auf

http://www.polpro.de/dumm.html

7 | | 2017/09/25 21:33 | reply

@David Kriesel: Bei etwa 30 fragen sind 30% Varianzaufklärung oft verdammt viel. Ich denke, bei Zufallsdaten mit einer ähnlichen Verteilung würde man da wahrscheinlich nur etwa 10% erwarten, mit 30% hat man die Daten also gut zusammengefasst. Hast du einen Link auf den reddit post, das man mal gucken kann, was da als Vergleich genommen wurde um die 30% abzutun? Oder lief das nur nach der (oft leider üblichen) Methode 30% klingt wenig, können wir vergessen?

Interessanter wäre allerdings wohl eher eine Konzeptanalyse auf Basis der Zustimmungen (keine Meinung kann man wahrscheinlich gut ignorieren).

8 |
Till
| 2017/09/25 23:13 | reply

Danke für die Visualisierungen!

Hier ein paar Überlegungen zum »Cluster« der Parteien mit linken Grundpositionen:

https://glitzerkollektiv.de/2017/09/23/bundestagswahl-2017-positionen-von-glitzerkollektiv-de-zu-den-wahl-o-mat-thesen/#inhalte-menschen-werkzeuge

9 | | 2017/10/03 16:30 | reply



U A᠎ U