Weiter zum Ihnhalt

Künstliche Intelligenz verstehen – Teil 1: Technologie

13. Juni 2023

KI verstehen: 1. Teil Technologie

Folgende Fragen behandeln wir in unserer neuen Blog-Miniserie «Künstliche Intelligenz verstehen»: Was ist künstliche Intelligenz (KI)? Was steckt hinter ChatGPT? Wo finden wir KI in unserem Alltag? Was sind die modernsten Anwendungen? Und was bedeutet die «KI-Revolution» für uns als Gesellschaft?
In drei Teilen geben wir eine Übersicht zu den technischen Grundlagen (→ Teil 1: Technologie), zeigen konkrete Anwendungsfälle auf (→ Teil 2: Anwendung) und besprechen gesellschaftliche Implikationen von KI (→ Teil 3: Gesellschaft).
Dies ist der erste Teil der dreiteiligen Blog-Serie. Falls Sie noch tiefer gehen möchten: Wir besprechen mehr Details zur künstlichen Intelligenz in unserem Onlinekurs «Künstliche Intelligenz verstehen – ChatGPT and beyond».

Begin at the beginning: Was ist KI?

Künstliche Intelligenz – oder englisch «Artificial Intelligence» (AI) – kann verstanden werden als die Fähigkeit einer Maschine, zu lernen und Probleme zu lösen. Ursprünglich beinhaltete das Feld vor allem Systeme, welche anhand fester, von Menschenhand einprogrammierter Regeln arbeiteten. In den letzten Jahrzehnten wurden jedoch Algorithmen immer wichtiger, welche durch Interaktion mit Daten lernen und ihre Leistung schrittweise verbessern können (sogenanntes «Machine Learning»). Machine Learning ist heute die zentrale Komponente der KI und umfasst «Deep Learning» (Systeme, die auf künstlichen neuronalen Netzwerken basieren) sowie GPT-Modelle (auf Sprachgenerierung spezialisierte Netzwerke wie ChatGPT). Abbildung 1 zeigt den Zusammenhang dieser Begriffe graphisch.

Page, Text, Diagram
Abbildung 1: Venn-Diagramm der künstlichen Intelligenz

Haben verschiedene Machine-Learning-Anwendungen auch teilweise völlig verschiedene Ziele und Ausprägungen, so basieren sie doch alle auf dem gleichen Grundprinzip.

Das technische Grundprinzip: Modell lernen und Vorhersagen machen

Beim Machine Learning finden Computersysteme Muster in bestehenden Daten, formalisieren diese mathematisch und wenden die gelernten Zusammenhänge danach auf neue Fälle an. Ein Beispiel: Abbildung 2 zeigt Grösse (X-Achse) und Gewicht (Y-Achse) von 30 Personen (blaue Punkte). Es lässt sich schon von Auge klar der generelle Zusammenhang «je grösser, desto schwerer» erkennen.

Abbildung 2: Lineares Modell von Grösse und Gewicht.

Mittels eines geeigneten Machine-Learning-Modells – in diesem Fall ein einfaches lineares Modell – lässt sich dieses Muster mathematisch festhalten: Der Computer bestimmt anhand der 30 Datenpunkte den genauen, linearen Zusammenhang zwischen Grösse und Gewicht (grüne Linie) und kann dann für alle möglichen Körpergrössen ein Gewicht «vorhersagen» (also die Zielvariable «Gewicht» anhand des angepassten Modells berechnen; siehe Abbildung 3). Vereinfacht gesagt beschreibt dieses Modell, wie viele Kilogramm mehr ein zusätzlicher Zentimeter Körpergrösse ausmacht.

Abbildung 3: Vom Input «Grösse» zum Output «Gewicht».

Komplexere KI: Bilderkennung und ChatGPT

Dieses Input-Modell-Output-Prinzip lässt sich über den linearen Fall hinaus auf beliebig komplexe Funktionen verallgemeinern. Der Modelltyp (im Beispiel oben ein lineares Modell) wird dabei passend zur jeweiligen Aufgabenstellung (welcher Input kommt links rein und welcher Output soll rechts raus?) gewählt. Soll ein Modell beispielsweise bestimmen, welcher Inhalt auf einem Foto zu sehen ist, werden die Pixel des Bildes als Input einem auf Bilderkennung spezialisierten neuronalen Netzwerk («Convolutional Neural Network» oder CNN) übergeben. Werden einem CNN tausende solcher Bilder gezeigt, kann es die wichtigen Muster darin lernen und neue Bilder richtig klassieren:

Abbildung 4: Bildklassierung mit spezialisierten neuronalen Netzwerken.

Auch für Sprachverarbeitung gibt es spezialisierte Modelle: Sogenannte «Transformer» (das «T» in «ChatGPT» steht für Transformer) werden an riesigen Textbibliotheken trainiert, um Muster in menschlicher Sprache zu lernen. Sie können dann gebraucht werden, um das jeweils nächste Wort in einer Sequenz vorherzusagen (Lesen Sie mehr zu ChatGPT in unserem entsprechenden Post [LINK]). Abbildung 5 illustriert dies anhand des Datahouse-Clamis:

Abbildung 5: Vorhersage des jeweils nächsten Worts durch ChatGPT.

Somit variiert zwar die Komplexität der angewendeten Modelle und die damit vorherzusagende Variable, jedoch sind alle Machine-Learning-Systeme letztlich Ausdruck des gleichen, simplen Grundprinzips: Ein mathematisches Modell erkennt Zusammenhänge in Daten und leitet daraus Vorhersagen für neue Fälle ab.

Im zweiten Teil unserer Serie werden wir auf diesem Wissen aufbauen und uns mit konkreten Anwendungen von KI-Systemen beschäftigen: Wo finden wir KI in unserem Alltag? Und welches sind die «cutting-edge» Anwendungen? Bleiben Sie an der Blog-Serie dran, um es herauszufinden.


Tauchen sie noch tiefer in die Welt der Künstlichen Intelligenz ein und nehmen Sie am 23. November 2023 teil an unserer Online-Veranstaltung zum Thema KI.