Navigation | Seiteninhalt | Zusätzliche Informationen

Seiteninhalt

Datamining im ÖPNV

Datamining und Big Data – die Zukunft der Forschung

Als Data Mining wird im Allgemeinen das automatisierte Anwenden statistischer und computergestützter Verfahren zur Analyse von Datensätzen bezeichnet.1 Ziel dieser Analyse ist es, die meist großen Datenmengen auf bisher unbekannte Muster und Zusammenhänge zu untersuchen, aus denen sich schließlich konkrete Lösungsansätze und Handlungsstrategien für diverse Bereiche ableiten lassen.

Zu unterscheiden ist der Begriff des Datamining von der übergeordneten Bezeichnung „Big Data“ – die ein ähnliches, jedoch nicht identisches Phänomen beschreibt. Zwar ist das Erkennen bestimmter Zusammenhänge oder Muster ebenfalls als Ziel von Big Data zu definieren, der Begriff beschreibt jedoch zunächst die der Analyse zugrundeliegende Datenmenge im Allgemeinen.

„Big Data“ ergibt sich aus der Datenerfassung in sämtlichen Bereichen der Wirtschaft, der Kommunikation oder des Gesundheitswesens und liegt zunächst in unstrukturierter Form vor. Auch über Mobilfunknetze, soziale Medien und das Internet in seiner Gesamtheit werden kontinuierlich Daten erfasst und gespeichert. Es handelt sich dabei um Datenmengen, die in ihrem Umfang nicht mehr durch herkömmliche Systeme und Tools erfasst werden können.2 So werden automatisierte digitale Verfahren notwendig, welche die enorme Menge an Daten entsprechend verarbeiten und für andere Zwecke nutzbar machen können.

Durch analytische Methoden wie das Datamining ist es schließlich möglich, diesen Datenpool auszuwerten und damit Verkaufsmuster zu erkennen, Datenprofile zu erstellen und Zusammenhänge zwischen verschiedenen Bereichen zu erforschen. Vor allem für Wirtschaftsunternehmen sind diese Verfahren von großem Vorteil, da sie das Kundenverhalten und seinen Zusammenhang mit bestimmten Faktoren anhand der ausgewerteten Daten vorhersagen und so die Verkaufsstrategie dementsprechend optimieren können.

Doch auch im Verkehrsbereich birgt die Auswertung von Big Data großes Potential. Der öffentliche Personennahverkehr ÖPNV sowie die Weiterentwicklung der Mobilität im Generellen können vom Verfahren des Datamining erheblich profitieren, wie im Folgenden erläutert werden soll.

Mobile Ticketing Systeme als Datenquelle

Einen Schwerpunkt der Datenanalyse im Datamining bildet die Prognose bestimmter Entwicklungsprozesse sowie die datengestützte Aufschlüsselung des Kundenverhaltens. Im Mobilitätsbereich gewinnt dadurch das Ticketing als Datenquelle immer mehr an Bedeutung.

Bundesweit rund 30 Verkehrsunternehmen bieten laut einer im Rahmen der Nahverkehrstage 2017 durchgeführten Untersuchung der Freien Universität Berlin3 derzeit digitale Ticketing-Verfahren an. Die Daten der Fahrgäste und ihrer Transaktionen werden dabei über entsprechende Apps automatisiert erhoben. Wie die Studie am Beispiel der Berliner Verkehrsbetriebe darlegt, werden folgende Daten erfasst:

  • Stammdaten
    Sogenannte Stammdaten umfassen unter anderem den Namen, die Adresse und das Geburtsdatum eines Nutzers sowie den Zeitpunkt seiner Registrierung, des letzten Logins oder der letzten Bestellung.
  • Transaktionsdaten
    Als Transaktionsdaten gelten Ticket- und Bestellinformationen, wie die Ticketnummer und der Preis des Tickets, aber auch räumliche und zeitliche Daten, wie der Kaufzeitpunkt oder die Starthaltestelle.

Aus der Analyse dieser Daten ergeben sich schließlich statistische Informationen über die demographische Struktur der Kunden – und damit über die Zielgruppe des digitalen Ticketing-Services – sowie über Verkaufszahlen und den Absatz der jeweiligen Produkte.

So hat beispielsweise lediglich die Hälfte der BVG-Kunden ihren Wohnsitz in der Hauptstadt, 58% der Kunden sind zwischen 25 und 40 Jahre alt. Das meist gekaufte Ticket ist der Einzelfahrausweis im Tarifbereich AB.

Auf der Basis solcher Ergebnisse der Datenanalyse lassen sich im nächsten Schritt wiederum Rückschlüsse auf den Zusammenhang der einzelnen Datenkategorien sowie auf das Kaufverhalten bestimmter Kundengruppen ziehen. Zum Beispiel folgt der Verkauf touristischer Ticketangebote, wie die Berliner „WelcomeCard“, laut der Untersuchung der FU Berlin klaren Mustern und ist stark vom Wochentag abhängig.

Mithilfe unterschiedlicher Methoden gelingt es so dem Verfahren des Datamining, aus den erhobenen Datenbeständen Prognosen zum Kaufverhalten der Kunden abzuleiten, auf deren Grundlage wiederum das digitale Ticketing in seinen Prozessen weiter optimiert werden kann.

Neben den Ticket-Apps diverser Verkehrsbetriebe werden auch Elektronische Fahrgeldmanagementsysteme, kurz EFM-Systeme, auch in Deutschland immer mehr zum Thema: Nach dem sogenannten CICO (engl. Check-In Check-Out) Prinzip, wird die Nutzung des ÖPNV bei jedem Kunden automatisiert erfasst und auf Basis dieser Erfassungen gemäß des geeigneten Tarifs abgerechnet. Getestet wird ein solches Ticketing System derzeit im Nordhessischen Verkehrsbund NVV sowie im Kreisverkehr Schwäbisch Hall KSH.4

Zwar bieten EFM-Systeme für langfristiges und umfassendes Datamining eine verlässliche und vor allem automatisierte Grundlage, jedoch sind die Datensätze nicht für alle Kunden des ÖPNV repräsentativ, wie aus einer entsprechenden Untersuchung der Universität Kassel hervorgeht.5 Durch Gelegenheitsnutzer und die Überschneidung mit anderweitig abgerechneten Ticketkäufen bei EFM-Kunden liefern die Datensätze keine vollständigen und damit womöglich verfälschte Datenergebnisse.

Vernetzung durch dynamische Fahrgastinformationssysteme

Auch Fahrgastinformationssysteme liefern zunehmend verlässliche Informationen zu Zeitpunkt, Frequenz und Ort der Nutzung öffentlicher Verkehrsmittel.

Bereits am 01. Januar 2017 begann das Bundesministerium für Verkehr und digitale Infrastruktur BMVI die Umsetzung des Forschungs- und Förderprogramms „eTicketing und digitale Vernetzung im Öffentlichen Personenverkehr“ und unterstützt seither in diesem Rahmen zukunftsweisende Projekte im Mobilitätsbereich. So forscht in Dresden zum Beispiel unter anderem das Fraunhofer-Institut an einem Softwaresystem „zur Entwicklung flexibler Tarife im ÖPNV“, die Hamburger Verkehrsbetriebe und Partner arbeiten an der Entwicklung einer „Hamburger Dispositionsplattform für flexible Bedienung“, kurz HaDif, im Sinne einer „flexiblen Verkehrslösung im städtischen Ballungsraum“.6 Auch der Ausbau und die Weiterentwicklung dynamischer Fahrgastinformationssysteme bilden hier einen klaren Schwerpunkt.

Für das Datamining vorrangig relevant ist dabei die digitale Vernetzung zwischen Fahrgastinformationssystemen und den Nutzern des ÖPNV: Durch mobile Endgeräte wie Smartphones oder Smartwatches und die entsprechenden Apps werden der individuelle Nutzer und das Informationssystem unmittelbar miteinander verknüpft. Und generieren damit im Gegensatz zu stationären Fahrgastinformationssystemen, die zwar Informationen für Fahrgäste bereitstellen, jedoch keine Daten über die Nutzung dieses Informationsservices erfassen können, wertvolle Datensätze über das Nutzungsverhalten der ÖPNV-Fahrgäste.

So ist die Digitalisierung des ÖPNV beiden Seiten von Nutzen: Dem Fahrgast durch die flexibel zugängliche Echtzeitinformation, den Verkehrsbetrieben durch statistische Daten, aus denen wichtige Zusammenhänge zur Optimierung des ÖPNV abgeleitet werden können.

Das innovative Potential der Vernetzung von Informationssystem, Ticketing und Nutzerdaten wird zum Beispiel im Konzept des Berliner Startups MotionTag7 deutlich, dem erst im Januar 2018 die weiterführende Unterstützung mehrerer Investoren zugesagt wurde.8 Die Idee: Ein virtueller Ticketservice, der Fahrgästen das passende ÖPNV-Ticket sowie entsprechende Echtzeitfahrpläne bundesweit und tarifgebietsübergreifend zugänglich macht. Darüber hinaus sollen das Nutzungsverhalten sowie das Bewegungsprofil der App-Nutzer anonymisiert an die jeweiligen Verkehrsbetriebe übermittelt werden und damit wiederum zur Optimierung ihres Angebots dienen. Dem hier greifenden Prinzip des Datamining liegt also ein Algorithmus zugrunde, der die Rohdatensätze der Reisenden anonymisiert erfasst und anschließend relevante Zusammenhänge erkennt – eine Technologie, die die Mobilität der Zukunft nicht nur digitalisiert, sondern vor allem zielgruppengerecht optimiert.

Daten nutzbar machen: Optimierungspotentiale im ÖPNV

Wie genau aber vollzieht sich die Optimierung des ÖPNV auf der Grundlage einer solchen Datenanalyse? Das Nutzungspotential des Datamining-Verfahrens im Mobilitätsbereich ist groß und die konkreten Anwendungsbereiche vielfältig. Unter anderem können folgende Bereiche des öffentlichen Personenverkehrs auf Grundlage der erhobenen Daten verbessert werden, wie in einem anlässlich der Nahverkehrstage 2017 an der Universität Kassel veröffentlichten Aufsatz von Andreas Schmidt9 hervorgeht:

Die Auslastung regulieren

Die Auslastung von Fahrzeugen im ÖPNV kann durch eine entsprechende Auswertung der erhobenen Daten erheblich verbessert werden. Relevant sind dafür vor allem sogenannte Strukturdaten, welche zum Beispiel Auskunft über den Anteil von Studenten, Schülern und Auszubildenden unter den Fahrgästen sowie ihren Wohnort geben. Anhand dieser Informationen können Kernzeiten und gefragte Strecken genau ermittelt, und Entwicklungen oder Tendenzen bezüglich der Bewohnerdichte erkannt werden.

Die Auswertung solcher Daten kann darüber hinaus mit dem Verfahren der Simulation erfolgen. Auf Grundlage der erhobenen Datensätze werden Zukunftsszenarien simuliert, aus denen Prognosen über die Entwicklung der Nachfrage im ÖPNV abgeleitet werden können. Die Verkehrsplanung kann dann entsprechend angepasst, und die Auslastung somit optimiert werden.

Das Fuhrparkmanagement effizienter gestalten

Auch für ein zuverlässiges und effizientes Fuhrparkmanagement ist das Verfahren des Datamining hilfreich. Durch das Erfassen von Störungen und ihren Ursachen können Werte für Fahr- und Verlustzeiten im ÖPNV ermittelt und daraus ein reeller Zeitbedarf ermittelt werden. Auch die Merkmale der eingesetzten Fahrzeuge, wie die Anzahl der Türen bei Omnibussen, kann mit den Zeitwerten in Bezug gesetzt werden. Die aus der Datenanalyse gewonnenen Erkenntnisse ermöglichen schließlich ein an den tatsächlichen Bedarf angepasstes Fuhrparkmanagement.

Zudem können auch Verkehrsmeldungen als Datenquelle dienen: Ihre zeitgenaue Erfassung und Auswertung trägt zur frühzeitigen Erkennung von potentiellen Verzögerungen bei und erleichtert damit die Planung von Reservefahrzeugen, um eine zuverlässige Fahrzeugverfügbarkeit zu garantieren.

Das Verkehrsnetz verbessern

Einen erheblichen Aspekt der Verkehrsplanung stellt außerdem der Ausbau des Verkehrsnetztes dar. Die Auswertung von Stammdaten der ÖPNV-Kunden sowie deren Nutzungsdaten – zum Beispiel über E-Ticketing-Systeme – gibt Aufschluss über den Einzugsbereich von Haltestellen und lässt damit Rückschlüsse auf eine angemessene Haltestellendichte oder den Bedarf zusätzlicher Haltestellen ziehen.

Auch die Nachfrage bestimmter Verbindungen spielt für die Streckenplanung im ÖPNV eine große Rolle. Durch die Erfassung der entsprechenden Daten können schwerpunktmäßige Fahrstrecken und -Ziele erkannt und bei der Strukturierung der Linienführung entsprechend berücksichtigt werden. Auch über den Erweiterungsbedarf des Streckennetzes auf ländlichere Gebiete gibt die Nachfrageanalyse Aufschluss. So nutzten bereits im Jahr 2016 Geografen aus Dänemark die Nutzungsdaten des Busverkehrs, um die Nachfrage nach öffentlichen Verkehrsmitteln im nördlichen Jütland zu erforschen und besonders gefragte Routen herauszufiltern.10

Weiteres Potential birgt außerdem die Vernetzung der öffentlichen Verkehrsmittel untereinander. Auf erhöhte Fahrgastaufkommen zu Stoßzeiten, unvermittelt auftretende Störungen oder andere spontan erforderliche Anpassungen des ÖPNV-Betriebs könnte dadurch in Echtzeit reagiert werden. Dafür erforderlich sind jedoch nicht nur zuverlässige Verfahren zur Datenerfassung, sondern auch die entsprechende technische Ausstattung der eingesetzten Verkehrsmittel im öffentlichen Nahverkehr.11

Big Data im digitalen ÖPNV – Lösung oder Problem?

Die Digitalisierung des öffentlichen Nahverkehrs, und Datenanalyse-Verfahren wie das Datamining als Teil dieser Entwicklung, bedeuten Verbesserung und Fortschritt für die Mobilität der Zukunft. Dennoch lässt die zunehmende Automatisierung von Verkehrsprozessen zum jetzigen Zeitpunkt einige Fragen offen, auf die zum Beispiel Prof. Dr. Stephan Rammler, Autor und Professor am Institut für Transportdesign an der Hochschule für Bildende Künste in Braunschweig, verweist.12

Datenschutz als Herausforderung für Big Data

Was in Zeiten von Social Media und digitaler Vernetzung eine immer größere Rolle spielt, ist auch im Bereich der Mobilität von großer Wichtigkeit. Zwar bringt das Verfahren des Datamining im ÖPNV viele Vorteile mit sich, von denen nicht nur Verkehrsbetriebe, sondern auch die Fahrgäste selbst profitieren können. Dennoch stehen die entsprechenden Nutzungsdaten, wie das Bewegungsprofil, Fahrzeiten, und regelmäßig genutzte Strecken, nicht selten in direktem Bezug zu Informationen über die individuelle Lebensführung der ÖPNV-Nutzer. Es ist deshalb unabdingbar, klare Richtlinien zum Umgang mit solchen personenbezogenen Daten im Bereich der Mobilität zu definieren.

Auch das ab Mai 2018 wirksame Datenschutzrecht stellt die Datenverarbeitung bei Big Data Prozessen in Frage. Der datenschutzrechtliche Umgang mit Big Data ist in den neuen Bestimmungen nicht explizit erwähnt und gibt damit nicht eindeutig Aufschluss darüber, ob automatisch erhobene Datenmassen, wie sie zum Beispiel im ÖPNV erhoben werden, als personenbezogene Daten gelten und ihre Verarbeitung damit an die neuen Regelungen angepasst werden muss.13

Erhöhte Umweltbelastung durch die Digitalisierung des ÖPNV?

Ziel einer digital vernetzten Mobilität ist es, die Prozesse im öffentlichen Nahverkehr möglichst effizient und fahrgastfreundlich zu gestalten. Jedoch gilt es, auch die ökologischen Aspekte dieser technischen Optimierung nicht außer Acht zu lassen, wie Prof. Dr. Rammler im Gespräch mit Dr. Michael Benz, einem Mitveranstalter des Deutschen Mobilitätskongresses, deutlich macht.

Die zunehmende Technisierung des Straßenverkehrs bedeutet auch einen erhöhten Bedarf an Rohstoffen, die für die Produktion entsprechender Hardware benötigt werden. Besonders datenanalytische Verfahren wie das Datamining erfordern zudem energieintensive Serverzentren. Es ist daher davon auszugehen, dass der aus den technischen Neuerungen resultierende Energieaufwand die Umweltbelastung durch den öffentlichen Nahverkehr, zusätzlich zum Energieverbrauch der ÖPNV-Fahrzeuge selbst, weiter erhöht.

Wie also kann eine ökologisch verantwortungsvolle Produktion technischer Endgeräte auch bei einem immer weiterwachsenden Bedarf gewährleistet und im ÖPNV eine vertretbare Umweltbilanz beibehalten werden?

Die Mobilität der Zukunft

Die zunehmende Weiterentwicklung des ÖPNV durch Technik und Verfahren der Datenanalyse macht eine Neudefinition des Mobilitätsbegriffs erforderlich, die Wege und Ziele einer Mobilität der Zukunft beinhaltet. Ziel der Analyse und Weiterentwicklung verkehrsbetrieblicher Abläufe durch datengestützte Verfahren wie das Datamining, ist freilich die vollständige Optimierung mobilitätsbezogener Prozesse. Dabei ist jedoch zu betonen, dass die Technisierung und Automatisierung dieser Prozesse, die „harten Infrastrukturen“15 keinesfalls ersetzen, sondern viel mehr bereichern soll. Nach wie vor sind die Verkehrsträger und -Strukturen in ihrer physischen Form die Grundlage für ein funktionierendes öffentliches Verkehrsnetz. Durch die Datenanalyse und andere automatisierte Prozesse gewinnen diese grundlegenden Strukturen an Effizienz und Zielgruppengerechtigkeit, werden jedoch nicht von ihnen abgelöst.

1 Vgl. https://www.bigdata-insider.de/was-ist-data-mining-a-593421/ (Stand 10.05.2018)

2 Vgl. http://www.enzyklopaedie-der-wirtschaftsinformatik.de/lexikon/daten-wissen/Datenmanagement/Datenmanagement--Konzepte-des/Big-Data (Stand 10.05.2018)

3 Vgl. http://www.mowin.net/fileadmin/mowin/dokumente/Nahverkehrstage/2017/Praesentationen/04_FreieUniBerlin_Pfannenschmidt.pdf

4 Vgl. https://www.uni-kassel.de/fb14bau/institute/ifv/verkehrsplanung-und-verkehrssysteme/forschung-und-dienstleistungen/forschungsprojekte/flexitarife-entwicklung-anwendung-und-wirkungsermittlung-flexibler

5 Vgl. Uni Kassel: Fachgebiet Verkehrsplanung und Verkehrssysteme

6 Vgl http://mobilitaet21.de/eticket-deutschland/

7 https://motion-tag.com/

8 https://ngin-mobility.com/artikel/finanzierung-motiontag-virtuelles-ticket/

9 Schmidt, Andreas (2017): Nutzung von Daten in der Angebots- und Betriebsplanung. In: Institut für Verkehrswesen der Universität Kassel: Nahverkehrs-Tage 2017. Digital und Disruptiv – Neue Daten und Methoden für einen kundengerechten ÖPNV. Kassel: University Press, S.5-24.

10 http://www.deutschlandfunk.de/big-bus-data-mit-daten-von-bussen-den-verkehr-verbessern.676.de.html?dram:article_id=360045

11 Vgl. Deutsches Zentrum für Luft- und Raumfahrt (Hg.) (2017): Digital mobil in Deutschlands Städten.

12 Vgl. http://www.frankfurt-holm.de/de/die-digitalisierung-der-mobilitaet-prof-dr-michael-benz-interviewt-im-gespaech-mit-prof-dr-stephan

13 Vgl. https://www.heise.de/ix/heft/Neue-Spielregeln-3866422.html

14 http://www.frankfurt-holm.de/de/die-digitalisierung-der-mobilitaet-prof-dr-michael-benz-interviewt-im-gespaech-mit-prof-dr-stephan