Aktuell 18. Februar 2021

Transfer Learning zur Sortierung von Immobilienbildern

Durch “Transfer Learning” können Deep-Learning-Systeme effizient auf neue Probleme angewendet werden. Unsere Anwendung sortiert Bilder von Immobilien automatisch nach ihrem Inhalt.

Deep Learning und Transfer Learning

Deep Learning ist eine Unterkategorie des maschinellen Lernens, bei der künstliche neuronale Netze angewendet werden, um komplexe Datensätze zu verarbeiten. Dies hat sich unter anderem bei der Analyse von Bildern bewährt. Auf Bildanalyse spezialisierte neuronale Netzwerke (sog. „Convolutional Neural Networks“) extrahieren Informationen aus Bildern und lernen, welche Aspekte des Bildes für eine gegebene Aufgabe relevant sind. Das Hindernis bei der praktischen Anwendung solcher Netze ist, dass ihre Erstellung nebst kostspieliger Infrastruktur grosse Mengen qualitativ guter Bilder braucht, die bereits mit Informationen zum tatsächlichen Inhalt versehen sind.

Transfer Learning reduziert dieses Problem: Nämlich können neuronale Netzwerke, die zur Lösung eines spezifischen Problems angepasst wurden, auf andere, verwandte Probleme transferiert werden. Beispielsweise werden bestehende Netzwerke zur Extraktion der wichtigsten Bildinformationen (sog. „Features“) benutzt um diese danach in leichter trainierbaren Machine Learning Modellen problemspezifisch weiterzuverwenden. Diese Methode ist effizient in der Anwendung und liefert dennoch gute Ergebnisse, was sie für den kommerziellen Einsatz attraktiv macht.

«Transfer learning will be the next driver of commercial machine learning success.» Andrew Ng, Chief Scientist von Baidu

Sortieren von Immobilienbildern

Küche oder Bad? Garage oder Heizung? In unserer Anwendung sortieren wir Bilder von Immobilien automatisch in eine der folgenden elf Kategorien:

  • Balkon
  • Bad
  • Schlafzimmer
  • Garage
  • Heizung
  • Küche
  • Waschküche
  • Wohnzimmer
  • Aussensicht
  • Dach
  • Treppenhaus

Wir transferieren dazu ein mächtiges neuronales Netz: Das „Mobilenet“ von Google, welches auf der sehr grossen „ImageNet“ Bilddatenbank vortrainiert wurde. Es besteht aus dutzenden Schichten künstlicher Neuronen und extrahiert tausende Features aus einem Bild. Wir verwenden die generierten Features aus der letzten Schicht des Netzwerks als Input für ein zweites Modell, welches dann das Bild einer unserer Kategorien zuordnet. Als zweites Modell benutzen wir einen „Random Forest“, einen Algorithmus, der auf Entscheidungsbäumen basiert und komplexe Zusammenhänge lernen kann.

Das finale Modell (also Mobilenet plus Random Forest) erkennt die Kategorien zuverlässig: 85% der Bilder ordnet es richtig zu. Die nicht korrekt erkannten Bilder sind oft Grenzfälle, bei denen beispielsweise die Heizung in der Waschküche oder eine Waschmaschine im Bad steht. Das System kann aber auch mit Unsicherheit umgehen: Technisch gesehen beurteilt es nämlich bei jedem Bild die Wahrscheinlichkeit aller Kategorien und wählt die Wahrscheinlichste.


Das Modell erkennt, dass es sich mit höchster Wahrscheinlichkeit um einen Balkon handelt. Mit geringerer Wahrscheinlichkeit könnte es sich aber auch um ein Bild der Kategorie "Aussensicht" oder "Dach" handeln.


Probieren Sie es aus!

In unserem Online-Tool können Sie ein Immobilienbild hochladen und bekommen dessen Kategorie zurück. Stimmen die Zuordnungen bei Ihren Bildern? Und was passiert, wenn Sie anstatt einem Immobilienbild etwas ganz anderes hochladen?

Interesse geweckt?

Haben Sie weiteres Interesse an diesem Tool oder einen anderen Anwendungsfall für Transfer Learning, bei dem wir Sie unterstützen können? Zögern Sie nicht, unser Data-Science-Team zu kontaktieren.


Autor

Severin Trösch

Severin Trösch

Senior Data Scientist
+41 44 289 92 35
E-Mail

Severin Trösch arbeitet seit September 2020 im Data Science Team und beschäftigt sich mit den Themen Modellierung, Statistik und Prognosen