Titelbild Roboter hält Glühbirne

Künstliches Wissen, das Probleme löst

Im Überblick: Die vier Methoden des Machine Learning

Von: Emil Vinčazović

Je nach Anwendung des maschinellen Lernens kommen unterschiedliche Methoden zum Einsatz. Diese variieren sowohl in der Herangehens- als auch in der Funktionsweise. Grundsätzlich werden vier verschiedene Methoden unterschieden: Überwachtes Lernen (supervised learning), Unüberwachtes Lernen (unsupervised learning), Teilweise überwachtes Lernen (semi-supervised learning) und Verstärkendes Lernen (Reinforcment learning). Schauen wir sie uns mal an.

Überwachtes Lernen

Überwachtes Lernen ist die älteste und wahrscheinlich am weitesten verbreitete Methode der maschinellen Lernverfahren. Hier folgt der Algorithmus strikten Regeln. Ihm werden Eingabedaten und Zieldaten gegeben. Sein Ziel ist es, mit dem Input den effizientesten bzw. besten Weg zum Output zu finden. Dies geschieht meist durch eine von ihm definierte Faustregel. Ist der Algorithmus einmal trainiert und beherrscht er die Regel, benötigt er nur noch den Input und kann selbstständig Aussagen über den Output machen.

Beispiel: Ein Unternehmen möchte aus betrügerischen Transaktionen der Vergangenheit lernen. Deshalb soll mit Hilfe alter Daten eine KI entwickelt werden, die in Zukunft bösartige Online-Transaktionen sofort erkennt. Dadurch wird der Verlust reduziert. Überwachtes Lernen wird entweder in der Klassifikation oder in der Regression verwendet.

Unüberwachtes Lernen

Das unüberwachte Lernen ist eine Form des Lernens mit weniger strengen Regeln. Der Grund dafür ist, dass dem Algorithmus kein Output vorgegeben wird. Er muss aus dem gegebenen Input selbstständig Strukturen erkennen. Dies geschieht durch eigenständiges Analysieren und Suchen von Mustern in den Daten.

Beispiel: Ein Start-Up möchte mit Hilfe von Machine-Learning-Algorithmen aus den ersten erhaltenen Daten Ausreißer identifizieren. So können in Zukunft möglicherweise neue Kundengruppen erschlossen oder Produkte besser an die Kundenbedürfnisse angepasst werden. Unüberwachtes Lernen kann in Clustering und Assoziation unterschieden werden.

Teilweise überwachtes Lernen

Wie der Name schon sagt, ist das teilweise überwachte Lernen eine Mischung aus den ersten beiden Methoden. Es kann sowohl die Ziele des unüberwachten als auch des überwachten Lernens verfolgen. Teilweise überwachtes Lernen wird normalerweise verwendet, wenn die Eingabedaten nur teilweise strukturiert und beschriftet sind. Die Algorithmen des unüberwachten Lernens können mit beiden Datensituationen umgehen.

Bestärkendes Lernen

Dynamisches Lernen unterscheidet sich grundlegend von den drei vorhergehenden Kategorien. Im Gegensatz zu diesen findet das bestärkende Lernen in einer dynamischen Umgebung statt. Der Algorithmus soll eine bestimmte Aufgabe ausführen. Dies kann ein Schachspiel sein oder das Steuern eines Fahrzeugs/einer Figur durch einen vorgegebenen Parcours. Während der Aktionen wird der Algorithmus durch ein Feedbacksystem unterstützt. So erhält er für gute Aktionen Belohnungen. Für schlechte bekommt er Strafen. So lernt er das richtige Verhalten für das zu erreichende Ziel.

Die Belohnungen und Bestrafungen können beim Reinforcement Learning auf zwei verschiedene Arten vergeben werden: Entweder man wählt den Monte-Carlo-Ansatz und gibt Feedback immer am Ende einer Runde, oder man wählt den Ansatz des Temporal-Difference-Learning und gibt Feedback nach jeder Aktion. Für unser Boxbeispiel würde dies bedeuten, dass Feedback nach jedem Boxkampf (Monte Carlo) oder nach jeder ausgeführten Bewegung der KI (TD-Learning-Ansatz) gegeben wird.

Beispiel: Für ein Box-Videospiel wird eine KI benötigt, die in verschiedenen Schwierigkeitsstufen agieren kann. Nehmen wir die Stufen Anfänger, Fortgeschrittene und Experten an. Nun werden drei KIs trainiert, die in dem was sie tun, unterschiedlich stark sind. Sie verfolgen jedoch das gleiche Vorhaben, nämlich gegen den vom Menschen gesteuerten Gegner zu boxen.

Fazit

Zusammenfassend lässt sich sagen, dass das maschinelle Lernen eine breite Palette von Methoden bietet, um verschiedene Probleme anzugehen. Überwachtes Lernen ermöglicht die Entwicklung klarer Regeln für die Ausgabenprognose, während unüberwachtes Lernen verborgene Muster in den Daten aufdecken kann. Teilweise überwachtes Lernen füllt die Lücke zwischen den beiden Ansätzen und eignet sich für weniger strukturierte Daten. Bestärkendes Lernen hingegen ermöglicht es Algorithmen, in dynamischen Umgebungen zu lernen und auf Feedback zu reagieren, um optimales Verhalten zu erlernen.

Die Wahl der geeigneten Methode hängt von der Art der Daten und den spezifischen Anforderungen des Problems ab. In der Praxis werden oft Kombinationen dieser Methoden eingesetzt, um komplexe Aufgaben zu lösen. Die Welt des maschinellen Lernens bleibt dynamisch und spannend, da ständig neue Techniken und Anwendungen entwickelt werden. Die Wahl der richtigen Methode und die sorgfältige Anpassung an den jeweiligen Anwendungsfall sind entscheidend für die erfolgreiche Nutzung des Potenzials des maschinellen Lernens.

Über den Autor: Emil Vincazovic

Emil Vinčazović ist als Data Engineer bei der arelium GmbH tätig. Seine Schwerpunkte liegen im Bereich der Ökonometrie und der Künstlichen Intelligenz. Er gibt auch Kurse bei der heise academy.


Empfehlung

Videokurs: Einstieg in das Azure Machine Learning Studio

Mache dich mit den Features und Tools des Azure ML Studio vertraut und lerne die wichtigsten Metriken der Klassifizierung und Regression zur Auswertung von ML-Modellen kennen. IT-Experte Emil Vinčazović zeigt in seinem Videokurs alle Inhalte Schritt für Schritt. Du kannst direkt mitmachen und dein Wissen in Quizfragen überprüfen.


Diese Beiträge könnten dich auch interessieren: