Video und Folien meines 36C3-Vortrags "BahnMining"

Dieser Post enthält das Material zu meinem Vortrag „Bahnmining – Pünktlichkeit ist eine Zier“ vom 36. Communication Congress. Ich muss sagen, dass die Erfahrung dermaßen intensiv war, dass ich das selbst erstmal verdauen muss, und das meine ich ganz positiv. Felix unterstellt hier, dass ich sichtlich gerührt gewesen sei, und das trifft vollumfänglich zu.

Wir hatten den fettesten Saal mit Platz für 5000 Leute, der war komplett voll, und die Stimmung war herrlich. Der Gänsehautmoment für mich persönlich waren in Wirklichkeit zwei: Als ich beim Schlusswort war, war es im Saal so still, man hätte eine Stecknadel fallen hören können. Wow. Und als sich nach Ende des Vortrags die Leute von ihren Sitzen erhoben, musste ich echt schlucken. Danke, danke, danke. Once in a lifetime experience.

Danke auch noch mal an die Leute vom Congress, die den besten und professionellsten Service liefern, den ich je bei einer Konferenz erlebt habe – von Sälen über Technik über Simultanübersetzungsteams bis hin zu sofort-Liveübertragung draußen vor dem Saal, als der wegen Überfüllung dichtgemacht werden musste. Respekt.

Ich habe noch verschiedenste Fragen aus dem Chat vom CCC gemailt bekommen, die es nicht mehr in die Livesendung gepackt haben. Sobald ich Zeit habe, versuche ich einen Blogpost mit Antworten nachzuschieben, sofern technisch und mathematisch möglich. Ich versuche auch, auf die Mails zu antworten, die reingekommen sind, bitte seht mir nach, wenn es etwas dauert.

Hier noch eine Presseschau (lange nicht erschöpfend und da kommen grade diverse nach, ich werde das aber nicht schaffen, alles nachzuhalten): SpiegelOnline, FAZ, Heise, Golem, Zeit.

Zum Material:

Und hier die deutsche Youtube-Version im deutschen Originalton direkt eingebettet (war eigentlich die CCC-Version, die zerhaut mir aber das Layout):

Hier noch die Liste an Fragen, die der Signal-Angel meines Vortrages mir auf den Weg gegeben hat:

  1. Möglichkeit der Korrelation von ausgefallenen/verspäteten Stops und Sparpreis-Preisen? Kann ich leider nicht machen, weil ich die Preise nicht habe. Wäre aber interessant :-)
  2. Sind die langstrecken-Fremdanbieter , bspw. #flixtrain, nicht in der IC-Aufstellung enthalten? Nach meiner Kenntnis nein. Die ICs sind explizit ICs.
  3. Es gibt immer wieder Gerüchte, dass Reisende in einem verspäteten Zug sitzen, der DB-Navigator jedoch Pünktlichkeit anzeigt. Hast Du mal stichprobenartig untersucht, ob die von der DB herunter geladenen Daten auch mit der Realität überein stimmen? Stichprobenartig ja. Ich bin in 2019 häufiger auf den verschiedensten Strecken Bahn gefahren und habe diese Fahrten natürlich in der Datenbank angeguckt. Für diese war sie akkurat.
  4. Für den Fahrgast ist ja auch wichtig, Anschlüsse zu kriegen. Geben verfügbare Daten eine Auswertebasis für Verbindungen mit Umsteigen? Indirekt. Man könnte eine generelle Anschlussimulation fahren, indem man guckt, wieviele der züge z.B. in der nächsten halben Stunde nach geplanter Ankunft hätten erreicht werden können. Aber so richtig gut geht das nur, wenn man Passagierdaten hat, die ich leider nicht habe.
  5. Im Ruhrgebiet passiert es schon mal, dass eine verspätete S-Bahn einige Bahnhöfe überspringt, um Zeit aufzuholen. Wie würde man sowas statistisch messen? Ähnlichwie bei der Scheuerwende. Hier kam es darauf an, Serien von fehlenden Halten am Anfang / Ende einer Fahrt zu ausfindig zu machen und zu messen. Das Muster hier wäre ebenfalls sehr charakteristisch: Ausgefallene Halte irgendwo in der Mitte einer Fahrt, und dann gehts wieder weiter.
  6. Die Schweizer Bahn lässt ICEs mit einer gewissen Verspätung nicht mehr ins Land, also nach Interlaken. Wie gross ist da der Beitrag zu den prinzipiellen ICE Ausfällen? Keine Ahnung, ich habe keine Daten aus der Schweiz, und auf dem letzten Deutschen Bahnhof wird der Zug ja noch ankommen, das ist also kein Ausfall.
  7. Ist bekannt, wie viel Prozent der Verspätung im Nahverkehr wirklich Bahnverschuldet sind? Mit der Frage meine ich, wie viel denn Kundenverschuldet sind. Also durch türe offen halten oder ähnliches? Es gibt APIs, über die man auch Verspätungsgründe abrufen kann, das habe ich aber nicht gemacht.
  8. Hast du auch Daten bzgl. Fahrgastzahlen in einzelnen Zügen auswerten können? Nein, ich habe leider keine Fahrgastdaten.