Weiter zum Ihnhalt

Prognose der täglichen Gästezahl für das Skigebiet Flumserberg

24. Februar 2022

Besucherzahlen Vorhersage mit Machine Learning im Skigebiet

Je nach Wetter, Schneequalität oder Wochentag kann die Auslastung eines Skiresorts stark variieren. Für das Skigebiet Flumserberg hat das Team von Datahouse ein Tool erarbeitet, welches die tägliche Anzahl Eintritte der nächsten Woche prognostiziert.

Hintergrund

An einem sonnigen Samstagnachmittag tummeln sich tausende Leute auf den Pisten – an einem nebligen Dienstagmorgen fast keine. Oder anders gesagt: Die tägliche Anzahl Eintritte, welche ein Skigebiet verzeichnet, ist nicht konstant, sondern stark abhängig von Faktoren wie Wetter, Schnee, Wochentag oder kantonalem Ferienstatus. Dies stellt für die Ressourcenplanung der Betriebe eine Herausforderung dar. Wie nämlich stellt man vorzeitig sicher, dass an einem Top-Tag alle Kassenmitarbeitenden vor Ort sind? Und wie verhindert man, dass an einem Regentag die Belegschaft vergebens im Einsatz ist?

Um solche Fragen zu beantworten, haben wir für das St. Galler Wintersportgebiet Flumserberg ein Prognosetool entwickelt. Dieses nutzt Muster aus historischen Zahlen sowie aus Wettervariablen, prognostiziert damit automatisch die tägliche Anzahl Eintritte der nächsten Woche und visualisiert diese in intuitiver Form. Flumserberg kann so frühzeitig abschätzen, wie die Auslastung an einem bestimmten Tag ausfallen wird.

Prognosen mit Machine Learning

Anhand von Vorwerten und weiteren Einflussvariablen Vorhersagen abzuleiten, ist ein klassisches Machine-Learning-Problem: Computergestützte mathematische Modelle können an einem historischen Datensatz „lernen“ wie eine Zielgrösse (hier die Anzahl Eintritte im Skigebiet) mit anderen Variablen (Wetter, Wochentag, etc.) assoziiert ist. Das Modell lernt also beispielsweise, wie viele Eintritte mehr zu erwarten sind, wenn der Wetterbericht für morgen sehr gut ist. Sind solche Assoziationen gelernt, kann das Modell die Zielgrösse für zukünftige Fälle prognostizieren und darüber hinaus auch quantitative Aussagen über die Unsicherheit der Prognose machen.

Prognose Anzahl Eintritte Flumserberg

Um die Vorhersagen für Flumserberg zu erstellen, wurden folgende Schritte durchlaufen:

  1. Auswahl und Vorbereitung der Datenquellen: Wir verwendeten die Eintrittsdaten des Skigebiets seit dem Jahr 2010 als Basis. Diese stellten die Zielvariable, also jede Grösse, die wir letztlich voraussagen wollen, dar. Ergänzt wurde der historische Datensatz mit relevanten Wettervariablen (Niederschlag, Temperatur, Bewölkung, etc.) sowie mit Information zu Spezialevents im Skigebiet, Feiertagen und Ferien in den umliegenden Kantonen.
  2. Konstruktion von Zusatzvariablen: Basierend auf den Rohdaten wurden weitere Variablen errechnet (sog. „Feature-Engineering“), welche für die Anpassung eines Modells potentiell nützlich sein können. Beispielsweise wurde für jedes Datum die Anzahl Eintritte der jeweils vorangegangenen Tage miteinbezogen. Der fertige Datensatz beinhaltete neben der Zielvariable (Eintritte pro Tag) im ganzen 50 sogenannter erklärender Variablen – Grössen also, die dem Modell für die Vorhersage der Zielvariable zur Verfügung stehen.
  3. Anpassen des Modells: Wir verwendeten ein „Random-Forest-Modell“ für die Vorhersage. Dieser Modelltyp basiert auf der Kombination von hunderten Entscheidungsbäumen (daher „Forest“) und hat sich in der Mustererkennung unterschiedlichster Art als sehr robust herausgestellt. Darüber hinaus kann ein Random-Forest komplexe Zusammenhänge wie Variabel-Interaktionen lernen. Es sind damit also prinzipiell Aussagen möglich wie „ein Feiertag wirkt sich umso stärker auf die Anzahl Eintritte aus, wenn die Sonne scheint“.
  4. Generierung der Vorhersagen: Mit einem fertig angepassten Modell können nun neue Prognosen berechnet werden. Dazu wird für jede der 50 erklärenden Variablen (Wetter, Schnee, Ferientag, etc.) ein Wert eingegeben und das Modell prognostiziert anhand der gelernten Regeln die Zielvariable (Eintritte). Natürlich besteht bei jeder Vorhersage eine gewisse Unsicherheit – schliesslich kennt man ja auch das Wetter in drei Tagen nicht mit perfekter Sicherheit. Um diese Unsicherheit zu kommunizieren, wurde anhand des Modells auch die jeweilige Wahrscheinlichkeit bestimmt, dass sich die Anzahl Eintritte an einem Tag im tiefen (grün), im mittleren (gelb), oder im kritisch hohen Bereich (rot) befindet.
Road, Architecture, Building
Ansicht des Barometers über Besucherzahlen auf dem Flumserberg

Datahouse: Modellevaluierung

Das Vorhersagetool für Flumserberg ist seit letzter Skisaison (2020 / 21) im Einsatz. Wir haben also bereits eine Saison an gemachten Vorhersagen, die wir mit den tatsächlichen Werten vergleichen und somit die Performance des Tools beurteilen können. Bei dieser Beurteilung muss man sich vor Augen führen, dass der Winter 2020 / 21 stark von der Corona-Pandemie beeinflusst war. Es waren die Skigebiete oft unüblich wenig besucht und manchmal gar ganz geschlossen. Dies führte natürlich zu einer tendenziell zu hohen Vorhersage des Modells, welches ausschliesslich an Daten von vor der Pandemie trainiert wurde.

Wie sah also die Modellperformance aus? Trotz Corona-Situation waren die Prognosen überraschend gut: Durchschnittlich betrug die Abweichung der Vorhersagen zum echten Wert nämlich ~1000 Personen. Wie die folgende Abbildung zeigt, war die genauere Struktur der Abweichung die erwartete: Generell zu hohe Vorhersagen aufgrund des Corona-Effekts.

Modellperformance des Vorhersagetools für Flumserberg
Grafik: Vergleich Prognose und Realität in der Saison 2021

Wichtiger für die Anwengung des Modells ist jedoch der Fakt, dass das Modell in > 80% der Fälle korrekt vorhersagte, ob ein von Flumserberg definierter kritischer Grenzwert überschritten würde oder nicht. Noch konkreter: Aus 98 Fällen, an denen dieser Grenzwert in Wahrheit überschritten wurde, hatte unser Modell dies 97 mal prognostiziert.

«Die Prognosen von Datahouse halfen uns – zusätzlich zu unserer Erfahrung – einzuschätzen, mit welcher Auslastung wir in den nächsten Tagen zu rechnen haben und so unsere personellen Ressourcen richtig zu planen.»

sagt Michael Ackermann, Mitglied der Geschäftsleitung der Bergbahnen Flumserberg.

Transfer auf andere Fälle durch Datahouse

Machine-Learning-basierte Mustererkennung in historischen Daten und darauf aufbauende Vorhersagen sind natürlich nicht auf die Anwendung in Skigebieten beschränkt. Im Gegenteil: In sehr vielen Branchen existieren Datensätze, welche nützliche Information beinhalten, um businessrelevante Vorhersagen zu berechnen. Die spezifische Methodik der angewandten Machine-Learning-Modelle hängt dabei vom genauen Use-Case ab und muss sorgfältig erarbeitet werden.

Sind Sie an Mustererkennung und Vorhersagen interessiert oder möchten herausfinden, welches Potential diesbezüglich in Ihren Daten steckt? Wir beraten Sie gerne! Zögern Sie also nicht, mit uns in Kontakt zu treten.