News

SpiegelMining. Auch Spiegelredakteure feiern Weihnachten. Eine Analyse von 70.000 SpiegelOnline-Artikeln

Seit Mitte 2014 habe ich mehr als 70.000 Artikel von SpiegelOnline systematisch gespeichert. Jeden Tag kommen im Schnitt 100 dazu. Diese Artikelmasse werden wir in der nächsten Zeit auswerten und erforschen. Was herauskommt, ist eine tiefgreifende Analyse des Publikationsverhaltens des vielleicht größten Meinungsmachers Deutschlands.

Ich werde über die nächste Zeit in einer losen Blogartikel-Serie unter dem Namen SpiegelMining etwas greifbarer machen, wie SpiegelOnline funktioniert. Geplant ist ein SpiegelMining-Artikel ca. alle zwei Wochen, bitte seid mir aber nicht böse, wenn das leicht variiert. Vielleicht finden wir sogar ein paar Sachen heraus, bei denen auch die Kollegen von SpiegelOnline zugeben müssen: „krass, das war nicht mal uns selbst so klar“. Zusätzlich werde ich verschiedene Methoden des Daten-Auswertens anhand des SpiegelOnline-Datensatzes plausibel, anschaulich und interessant machen – und zwar auch für Nicht-Informatiker.

Bei einigen der Auswertungen wird vielleicht „nur“ das rauskommen, was man sich schon vorher denken konnte. Bei anderen werden wir überraschende Ergebnisse erhalten. Und manchmal entdeckt man auch Systematiken da, wo man vielleicht überhaupt keine erwartet hat – ein Beispiel dafür findet sich schon in diesem Blogartikel.

"Säuberungen" in der Türkei - visualisiert

Dieser Plot enthält die verschiedenen Kategorien an Personen, die im Verlaufe der „Säuberungen“ in der Türkei ihres Amtes enthoben, festgenommen oder sonstwie kaltgestellt wurden. Die Zahlen kommen von Euronews. Nicht im Bild enthalten: 3212 Amateurfunker.

Anmerkung: Ich kann nicht sicher sagen, ob von den Nicht-Soldaten nicht doch irgendeiner mal geputscht hat – da ich davon aber nichts mitbekommen habe, gelten die hier zunächst als Nichtputscher. Hinweise sind gerne gesehen. Umgekehrt wird übrigens auch sicher nicht jeder der 6.000 verhafteten Militärangehörigen geputscht haben.

"Verschlüsselung" von SpiegelOnline-Bezahlartikeln extrem einfach knackbar

Seit ein paar Tagen gibt es auf SpiegelOnline Bezahlartikel ("Spiegel Plus"). Im vorliegenden Artikel beschreibe ich, wie diese verschlüsselt werden und wie man deren Verschlüsselung in Firefox vollautomatisch knacken kann.

Als Moral von der Geschicht gehen wir noch darauf ein, warum es für Portale wie SpiegelOnline entgegen aller Intuition trotzdem sinnvoll sein kann, eine derartig schlechte Verschlüsselung zu benutzen und warum Kommentare wie „die sind ja doof“ vielleicht etwas kurz gedacht sind.

:!: Disclaimer: Dieser Blogartikel soll nicht dazu anstiften, Spiegel Plus fortan gratis zu lesen. Wenn ihr das Angebot dort wahrnehmt, bezahlt es bitte auch. Mein Artikel dient als Proof of Concept für technisch interessierte User. Wenn man die Einfachheit der eingesetzten Verschlüsselung betrachtet ist außerdem davon auszugehen, dass sie einfach nur ein Testlauf bei SpiegelOnline ist, und irgendwann eine „richtige“ Verschlüsselung ausgerollt wird. Beschwert euch also nicht, wenn die hier gezeigte Entschlüsselung irgendwann nicht mehr funktioniert.

Folien zu meinem Vortrag "DataScience im öffentlichen Nahverkehr"

Hier gibt es den Foliensatz (PDF, ca. 800kb) meines Vortrages im Bonner DataScience-Meetup. Leider ist er um ein paar Bilder ärmer, da ich die Veröffentlichtungsrechte für ein paar der Bilder bis jetzt nicht zugesprochen bekommen habe. Das ist normal nicht meine Art, unvollständige Folien online zu stellen, aber kann ja nicht immer alles klappen.

Nochmal danke für die rege Teilnahme am Vortrag, gerne wieder! 8-)