Kontaktieren Sie uns

Blog, Data science

Bier, Brezn und Big Data: Statistik am Oktoberfest

26 Sep 23

Das Oktoberfest in München, Deutschland, zieht jedes Jahr Millionen von Menschen aus der ganzen Welt an. Jenseits der ausgelassenen Feierlichkeiten offenbart sich eine faszinierende Welt statistischer Zusammenhänge. In diesem Blog werden wir uns mit dem Thema „Korrelation und Kausalität“ auseinandersetzen und besuchen das legendäre Bierfest und Zusammenhänge auf eine etwas andere Art. Also schnappen Sie sich Ihren Bierkrug, schlüpfen Sie in Ihre Lederhose und machen Sie sich bereit für einen statistischen Kurzausflug auf das Oktoberfest!

Korrelation und Kausalität: Eine kurze Übersicht

Bevor wir uns in die Beispiele des Oktoberfests vertiefen, klären wir, was Korrelation und Kausalität bedeuten. Korrelation bezieht sich auf die statistische Beziehung zwischen zwei oder mehr Variablen. Wenn zwei Variablen (x, y) korreliert sind, sind Veränderungen in einer mit Veränderungen in der anderen verbunden, aber dies bedeutet nicht notwendigerweise eine Ursache-Wirkungs-Beziehung und kann durch einen aussenstehenden Faktor (z) beeinflusst sein (siehe Abbildung 1).

Abbildung 1: Korrelation, die durch eine weitere Variable beeinflusst sein kann.

Kausalität hingegen bezeichnet einen direkten Ursache-Wirkungszusammenhang zwischen zwei korrelierenden Variablen, bei dem Veränderungen in einer Variablen direkt zu Veränderungen in der anderen führen. Deshalb erfordert Kausalität in der Regel sorgfältige Untersuchungen, Experimente und eine tiefgreifende Kenntnis der Zusammenhänge zwischen den Variablen (siehe Abbildung 2). Das Verständnis des Unterschieds zwischen diesen beiden Konzepten ist entscheidend, wenn Daten analysiert und Schlussfolgerungen gezogen werden, um Fehlinterpretationen und Fehlentscheide zu vermeiden.

Abbildung 2: Korrelation mit datenbasierter Kausalität.

Backhendl und Bier: Eine unerwartete Korrelationsentdeckung

In den Daten aus vergangenen Oktoberfesten gibt es beispielsweise eine negative Korrelation zwischen dem Verzehr von Backhendl, einer traditionell bayrischen Speise mit knusprig-paniertem Hühnchen, und dem Bierkonsum (siehe Abbildung 3). Das bedeutet, dass an Oktoberfesten mit höherem Bierkonsum tendenziell weniger Backhendl verschlungen werden.

Abbildung 3: Korrelation der historischen Hendl- und Bierkonsum Daten.

Bei dieser Korrelation kann aber keine Ursache-Wirkungs-Beziehung impliziert werden, da ein höherer Bierkonsum nicht direkt eine reduzierte Backhendlnachfrage verursacht. Stattdessen reagieren beide Variablen auf ähnliche Einflüsse wie die Anzahl Besucher am Oktoberfest oder die Zahlungsbereitschaft der Festbesucher, was unter anderem zu dieser Korrelation führt (siehe Abbildung 4).

Abbildung 4: Faktoren, die Korrelation zwischen Bier- und Backhendlkonsum beeinflussen könnten.

Denn mit einer erhöhten Anzahl an Besucher ist es naheliegend, dass eine grössere Menge an Bier und an Backhendl konsumiert wird. Die Zahlungsbereitschaft hingegen könnte die negative Korrelation bestärken, da sich Besucher überlegen, ob sie für das Geld lieber ein Mass Bier oder ein Backhendl kaufen. Backhendl stehen zudem mit weiteren Essensangeboten in Konkurrenz und Oktoberfestbesucher können auf andere (günstigere) Schlemmereien wie Würste oder Brezen ausweichen. Die Zahlungsbereitschaft für ein Backhendl wird somit also kleiner. Zusammen mit einer steigenden Preisentwicklung kann sich dies auf den Backhendl-Verzehr ausbreiten, wie dies auch in Abbildung 5 ersichtlich ist. Dies macht intuitiv auch Sinn: je teurer ein Produkt ist, desto tiefer ist die Nachfrage.

Abbildung 5: Relation von Backhendlpreis und -konsum an vergangenen Oktoberfesten.

Das Bier ist auf der anderen Seite einer der Hauptgründe, um das Oktoberfest zu besuchen, weshalb   sich die Oktoberfest-Besucher hier weniger preissensibel zeigen. Zudem hat Bier auch keine wirkliche Konkurrenz am Oktoberfest. Diese Vermutungen lassen sich auch aus den Daten herauslesen: Obwohl der Preis für ein Mass (Stand 2022: 13.45 € / Mass) in den letzten Jahren stark angestiegen ist, ist auch der Konsum gewachsen (siehe Abbildung 6). Die Zahlungsbereitschaft für ein Mass Bier ist also hoch, während sie für ein Backhendl eher tief ist, da auf alternative Essangebote ausgewichen werden kann.

Abbildung 6: Relation von Bierpreis und -konsum an vergangenen Oktoberfesten.

Eine weitere interessante Korrelation lässt sich zwischen dem Bierkonsum am Oktoberfest und den weltweiten UFO-Sichtungen erkennen (siehe Abbildung 7). Diese Korrelation besagt, je mehr Bier an einem Oktoberfest getrunken wird, desto mehr UFOs werden weltweit gesichtet. Da der Bierkonsum am Oktoberfest jedoch sehr lokal ausfällt, die UFO-Sichtungen aber weltweit geschehen, kann in dieser Hinsicht ebenfalls keine Kausalität zwischen den beiden Variablen festgestellt werden. Ebenfalls ist es bei dieser Relation möglich, dass kein externer Faktor die Korrelation dieser beiden Variablen beeinflusst, wie es im oberen Beispiel der Fall ist. Dann handelt es sich bei der Bierkonsum-UFO-Sichtungen Korrelation um reinen Zufall.

Abbildung 7: Korrelation von Bierkonsum und den weltweiten UFO-Sichtungen.

Übrigens: Wer sich für mehr lustige Korrelationen interessiert, wird auf der Webseite https://www.tylervigen.com/spurious-correlations fündig. Dort sieht man beispielsweise, dass die Anzahl Todesfälle durch Ertrinken in einem Pool stark mit den Anzahl Filmen mit Nicolas Cage korreliert.

Bierkonsum und Alkoholspiegel: Die Kausalitätsverbindung

Betrachten wir nun ein Szenario, in dem Korrelation und Kausalität nebeneinander existieren. Wir untersuchen den Einfluss von Bierkonsum auf den Alkoholwert im Blut. Nehmen wir an, eine Datenanalyse ergibt eine starke positive Korrelation zwischen Bierkonsum und Alkohol im Blut. Also je mehr Bier eine Oktoberfestbesucherin konsumiert, desto höher wird der Alkoholspiegel in deren Blut. Zudem führen wir sorgfältige Analysen und Experimente durch, die bestätigen, dass Bierkonsum zu erhöhtem Alkoholwert im Blut führt. Dann hätten wir in diesem Fall eine Kausalität festgestellt (Abbildung 8).

Abbildung 8: Durch Experimente und Analysen festgestellte Kausalität.

Die Bedeutung von Kausalität in der KI

In der Welt des Machine Learnings und der künstlichen Intelligenz spielt die Kausalität eine zunehmend wichtige Rolle. Während Korrelationen in grossen Datenmengen leicht zu finden sind, ist es oft entscheidend zu verstehen, ob und wie eine Variable eine andere beeinflusst.

Kausalitätsmodelle helfen dabei, Muster und Zusammenhänge in Daten besser zu verstehen. Sie ermöglichen es, gezielt Einflussfaktoren zu identifizieren und Interventionen zu planen, um gewünschte Ergebnisse zu erzielen. Hier sind einige Beispiele, wie Kausalität in verschiedenen Anwendungsbereichen des Machine Learnings zum Einsatz kommt:

Medizinische Diagnose: In der medizinischen Forschung ist es entscheidend zu verstehen, welche Faktoren tatsächlich die Gesundheit eines Patienten beeinflussen. Kausale Modelle helfen dabei, die Auswirkungen von Behandlungen auf Patienten genau zu analysieren und zu bewerten. Zum Beispiel kann die Untersuchung von Kausalitätsbeziehungen zwischen bestimmten Medikamenten und der Verbesserung von Krankheitssymptomen dazu beitragen, effektivere Therapien zu entwickeln.

Marketingoptimierung: Unternehmen nutzen Kausalitätsanalysen, um die Auswirkungen von Marketingkampagnen und Werbemassnahmen auf den Verkauf ihrer Produkte oder Dienstleistungen zu verstehen. Wenn sie beispielsweise herausfinden können, welche spezifischen Werbemassnahmen tatsächlich zu einem Anstieg der Verkäufe führen, können sie ihr Marketingbudget effizienter einsetzen.

In diesen und vielen anderen Anwendungsbereichen des Machine Learnings ist die Berücksichtigung von Kausalität ein wichtiger Schritt in Richtung robustere und interpretierbare Modelle. Sie ermöglicht es, nicht nur Zusammenhänge zu erkennen, sondern auch die zugrunde liegenden Ursachen und Effekte zu verstehen, was entscheidend ist, um präzise Vorhersagen zu treffen und fundierte Entscheidungen zu treffen.

Nun sind Sie am Zug

Zum Abschluss schauen wir uns noch die monatliche Verteilung der durchschnittlichen Geburten von 1990 bis 2022 im Bundesland Bayern an (Abbildung 9).

Abbildung 9: Verteilung der monatlichen Geburten in Bayern.

Kann es sein, dass das Oktoberfest für die „überdurchschnittliche“ Geburtenzahl im Juli verantwortlich ist? Wir laden Sie ein, gemeinsam mit uns in diese spannende Welt einzutauchen, Zusammenhänge zu erkennen und richtige Schlüsse zu ziehen. Kontaktieren Sie uns, denn Ihre Daten sind zu wertvoll, um falsch interpretiert zu werden.


Tauchen sie noch tiefer in die Welt der Künstlichen Intelligenz ein und nehmen Sie am 23. November 2023 teil an unserer Online-Veranstaltung zum Thema KI.