Weiter zum Ihnhalt

Recommender Systems: Datenbasierte Personalisierte Empfehlungen

2. Mai 2022

Person, Human, Mobile Phone

Empfehlungen zu personalisieren ist aus zwei Perspektiven wertvoll: erstens erhalten Kundinnen und Kunden für sie massgeschneiderte Vorschläge, zweitens können Geschäfte ein grösseres Interesse mit ihren Produkten auslösen. Es lohnt sich also ein genauer Blick auf  datenbasierten persönlichen Empfehlungen.

Personalisierte Empfehlungen

Empfehlungsalgorithmen – genereller sogenannte “Recommender Systems” – sind in der heutigen Businesswelt weit verbreitet und enorm wichtig: Netflix schätzt beispielsweise, dass 60% der geschauten Inhalte aus persönlichen Vorschlägen hervorgehen, während Google mit individuellen Vorschlägen in der Suchmaschine bis zu 40% höhere Klickraten generieren kann.

Generell geht es bei Recommender-Systemen darum, eine implizite Vorhersage zu machen, wie gut verschiedene Objekte einer spezifischen Person entsprechen und dann die passendsten Objekte zu empfehlen. Es bestehen „kollaborative“ Systeme, welche Empfehlungen anhand der Ähnlichkeit von User:innen ableiten und inhaltsbasierte Systeme, welche die Ähnlichkeiten von verschiedenen Objekten beurteilen. Viele der heutigen Systeme sind Hybride aus beiden Varianten und nutzen daher Ähnlichkeitsbeziehungen innerhalb von sowohl Käufer:innen als auch Produkten.

Auch wenn die genauen Funktionsweisen der Recommender-Algorithmen von Facebook, YouTube und Co. geheim sind, lassen sich folgende, generische Merkpunkte formulieren:

  • Geeignete Datenbasis: Daten zu allen zur Verfügung stehenden Objekten (historische Ratings, Lage bei Restaurants, Anzahl Seiten bei Büchern, etc.) und User:innen (Alter, Wohnort, Geschlecht, abgegebene Ratings, etc.) werden erhoben und gespeichert.
  • Zielgerichtete Personalisierung: Weiter wird entschieden, bezüglich welcher Variablen die Empfehlungen personalisiert werden soll. Soll eine Empfehlung für alle Personen an einem speziellen Ort gelten? Oder nur für die Frauen? Oder gar nur für eine einzige Person mit speziellen Charakteristika?
  • Sinnvolle Sortierung: Schliesslich wird ein Algorithmus gebraucht, welcher alle möglichen Objekte der Datenbasis beurteilt und sortiert. Dabei wird auf der Basis aller Variablen zu Objekt und Person eine Score errechnet, welche das Interesse einer Person oder einer Gruppe an einem Objekt abschätzt.

Mit diesen Schritten können in verschiedensten Bereichen personalisierte Empfehlungen berechnet und so verschiedene Fragen beantworten werden: „Welches Video möchte User X als nächstes anschauen?“,  „welches Produkt kauft Kundin Y noch dazu?“ oder „in welchem Restaurant würde die Gruppe Z am liebsten essen?“

Restaurant-Empfehlung gefällig?

In einem Projekt Ende 2021 haben wir verschiedenen Personen automatisiert und datenbasiert Restaurants für ihr Weihnachtsessen empfohlen. Ziel dabei war, das jeweils „sicherste“ Restaurant für das Weihnachtsessen zu empfehlen. Ein sehr gutes Restaurant, bei welchem „nichts schiefgehen kann“ – dies galt es, in den Recommender-Algorithmus zu übersetzen. 

Unser System bestand aus den drei oben beschriebenen Komponenten eines jeden Recommender-Systems:

  • Datenbasis: Zuerst bezogen wir tausende Restaurantreviews der ganzen Schweiz aus Google Maps. Somit standen uns für jedes Restaurant jede dafür abgegebene Bewertung (1 bis 5) zur Verfügung. Dazu kannten wir die Firmenadressen aller Personen, welchen wir eine Empfehlung abgeben wollten.
  • Personalisierung: Unsere Personalisierung war Ort-gebunden. Das heisst: Jeder Person wurde eine Empfehlung in Funktion ihrer Adresse abgegeben. Wir zogen also für jede Person nur die Restaurants in Betracht, welche sich in naher Umgebung befanden.  
  • Sortierung: Wir berechneten für alle Restaurants aus jeweils allen dafür abgegebenen Ratings eine Metrik, welche die „Mindestqualität“ jedes Restaurants charakterisierte (möglichst sichere Wahl). Diese Berechnung geschah mit dem eigens entwickelten „Mindestqualität-Algorithmus“ (s. unten). Schliesslich wurde das Restaurant mit der höchsten Mindestqualität ausgewählt und empfohlen.

Unser „Mindestqualität-Algorithmus“

Warum könnte man – auf der Suche nach der “sichersten” Restaurant-Empfehlung – nicht einfach jeder Person das Restaurant mit dem höchsten Google-Rating-Mittelwert in der Nähe empfehlen? Der Grund dafür ist, dass jeder geschätzte Mittelwert eine statistische Unsicherheit aufweist. Diese Unsicherheit (technisch “Standardfehler”) kommt zustande, da jeder Mittelwert anhand einer begrenzten Anzahl Restaurantreviews berechnet wird. Je kleiner diese Anzahl, desto grösser die Unsicherheit. Um also die “sicherste” Restaurant-Empfehlung zu finden, brauchten wir den Mittelwert und seinen Standardfehler.

Aus den einzelnen Ratings jedes Restaurants, errechnet unser Mindestqualität-Algorithmus mit einem statistischen Resampling-Verfahren, dem sog. “Bootstrapping”, den Mittelwert der Ratings jedes Restaurants sowie den dazugehörigen Standardfehler. Damit lässt sich das Vertrauensintervall des Mittelwerts berechnen und folgendes aussagen: Der wahre Mittelwert des Restaurants (der Wert also, welcher eine zufällige Person am ehesten abgeben würde) liegt “mindestens” an der Untergrenze des Vertrauensintervalls. Die Untergrenze des Vertrauensintervalls stellt also eine Art Sicherheits-metrik des Restaurants dar. Sortiert man nach dieser Metrik, sind demnach Restaurants zuoberst, welche nicht nur eine hohe mittlere Bewertung haben, sondern bei denen dieser auch noch sehr sicher ist. Solche also, welche eine “sichere Wahl” darstellen. Und diese zu finden war unser Ziel.

Personalisierte Empfehlungen by Datahouse

Im obigen Beispiel wurde jeder Person das sicherste Restaurant in der persönlichen Umgebung empfohlen. Es ist klar, dass ein solcher Prozess auf viele weitere Situationen und Projekte angepasst werden kann.

Sehen Sie in Ihren Daten das Potential für personalisierte Empfehlungen? Oder haben Sie eine Idee für einen cleveren Personalisierungs-Algorithmus, den Sie in ihrem Business implementieren möchten? Wir unterstützen Sie gerne! Melden Sie sich für eine unverbindliche Erstberatung.