Funktionsweise

Version: 4.0

Datenbasis

Bei jeder Anfrage zur Netzdarstellung bzw. Kursbuchstrecke werden mithilfe der Daten aus der Zugfinder-Datenbank die aktuellen Positionen der Züge im gefragten Netz berechnet und dargestellt. Diese Datenbank wird mithilfe der Reiseauskunft der DB (da die DB den Abruf ihrer Daten weitgehend gesperrt hat und ganz offensichtlich kein Interesse an einer transparenten Weiterverwendung hat, werden die Daten ab sofort nur noch von anderen Fahrplanauskünften geladen) stets auf dem aktuellsten Stand gehalten. Dadurch können aktuelle Fahrplanabweichungen relativ zeitnah berücksichtigt werden und letztlich die Verspätungsstatistik erweitert werden. Die Zugfinder-Datenbank wird also mit jedem Aufruf eines Netzes erweitert.

Wenn "k.A." angegeben ist, kann dies unterschiedliche Gründe haben. Teilweise werden die aktuellen Daten nicht vom Zug gemeldet (z.B. bei einigen Privatbahnen), aber es kann auch einen technischen Fehler beim Auslesen der Daten geben. In diesem Falle ist dann natürlich die Genauigkeit noch weniger gewährleistet.

Leider sind alle Quellen für den Abruf von Güterzug-Echtzeit-Daten versiegt. Es tut mir leid für die zahlreichen Güterzug-Fans, aber die Bahn ist offensichtlich weder kooperativ noch irgendwie interessiert daran, die Öffentlichkeit an diesen Daten teil haben zu lassen. Bis auf weiteres ist nicht absehbar, dass Güterzüge wieder in Echtzeit im Zugfinder sichtbar werden.

Zugfinder Verspätungsprognose BETA

Gemeinsam mit Dr. Lisardo Prieto González bauen wir an einer künstlichen Intelligenz, die zukünftige Zugverspätungen prognostizieren soll. Unser Ziel ist es, mit einer möglichst hohen Trefferquote eine ungefähre Aussage zur Verspätung in Minuten machen zu können.

Die aktuelle Version ermittelt statistische Wahrscheinlichkeiten für eine Zugverspätung am Zielbahnhof. Da die Menge an Einflussfaktoren für eine Verspätung extrem groß ist, können wir derzeit leider nur Tendenzen ermitteln. Wir sind mit den Ergebnissen aber im Großen und Ganzen schon mal recht zufrieden :-)

Dies bedeuten die einzelnen Ausgabewerte:

  • sehr geringe Wahrscheinlichkeit: man kann tendenziell damit rechnen, am Ziel pünktlich (bis 5 Minuten Verspätung) anzukommen
  • geringe Wahrscheinlichkeit: unter üblichen betrieblichen Bedingungen ist mit einer Zielankunft unterhalb der durchschnittlichen Verspätung des Zuges zu rechnen
  • mittlere Wahrscheinlichkeit: man kann damit rechnen, dass der Zug verspätet am Ziel ankommt und sich dabei an der durchschnittlichen Verspätung orientieren
  • hohe Wahrscheinlichkeit: man sollte damit rechnen, dass der Zug verspätet am Ziel ankommt und tendenziell die durchschnittliche Verspätung erreichen wird
  • sehr hohe Wahrscheinlichkeit: man sollte damit rechnen, dass der Zug mit einer überdurchschnittlichen Verspätung am Ziel ankommt

Derzeit sind dies alles Schätzwerte. In jedem Falle wünschen wir allen Reisenden eine pünktliche Ankunft! Und wenn eine hohe Wahrscheinlichkeit nicht eintreten sollte, dann ist das zwar für uns Statistiker schade, aber doch aus Sicht des Fahrgastes eigentlich erfreulich :-)

Verifikation der Vorhersagen (Anteil der korrekten Prognosen für die letzten 7 Tage):
01.07.2020: 95,1%
02.07.2020: 95,3%
03.07.2020: 94,6%
04.07.2020: 95,3%
05.07.2020: 93,4%
06.07.2020: 93,1%

Bekannte Fehler

Achtung, bitte zuerst lesen: Bitte melden Sie keine Fehler, die sich auf einen aktuellen Zustand beziehen (also z.B. "momentan ist der Zug XYZ nicht zu sehen") - dies kann ich nachträglich nicht nachvollziehen. Und auch fehlerhafte historische Daten sind weder beeinfluss- noch veränderbar, weil sie jeweils live beschafft werden und somit auch nachträglich nicht mehr nachvollzogen werden können.

Es wird mit Hochdruck an der Beseitigung von Fehlern gearbeitet. Dennoch tauchen immer wieder neue auf, die nicht so schnell behoben werden können. Falls Sie einen Fehler entdecken, der noch nicht in der folgenden Liste steht, teilen Sie mir diesen bitte mit!

  • Strecke München-Salzburg (Netz Süden) nicht proportional
  • Ein Zug wird zwischen 2 Bahnhöfen angezeigt, die sich auf einer Strecke befinden, obwohl er tatsächlich auf einer anderen (parallelen) Strecke fährt.
  • Selten sind Start- und Zielposition identisch
  • Bei Zügen, die nach 24 Uhr den Zielort erreichen, werden (logischerweise) zunächst die Verspätungsdaten vom "Vortags"-Zug eingetragen. Diese Daten werden folglich erst am nächsten Abend überschrieben. Dies ist logisch aber kein echter Fehler.
  • Die Zugnummern entsprechen nicht den Informationsfenstern: Dies ist kein Fehler, sondern taucht nur dann auf, wenn 2 Zugnummern zusammengekoppelt fahren - dann liegen quasi beide Züge "übereinander".

Unterstützen

Das System hat zwischen erster Idee und aktuellem Stand grob geschätzt 1400 Arbeitsstunden gekostet. Allein schon deshalb freue ich mich über jede Unterstützung. Besorgen Sie sich einen Pro Account, mit dem Sie auch einige interessante Zusatzfunktionen nutzen können!