Machine Learning ist ein Teilgebiet der Informatik und ein zentraler Bestandteil der künstlichen Intelligenz. Es befasst sich mit dem Bau von Systemen, die aus Daten lernen. Anstatt vom Programmierer festgelegte Anweisungen Schritt für Schritt zu befolgen, erkennt ein Machine-Learning-Modell statistische Muster in Beispielen und nutzt diese Muster, um Vorhersagen oder Entscheidungen für neue, bisher ungesehene Daten zu treffen. Je mehr relevante Daten es sieht, desto besser arbeitet es in der Regel.
So funktioniert Machine Learning
Auf hoher Ebene beginnt Machine Learning mit einem Datensatz von Beispielen – wobei jedes Beispiel üblicherweise aus Merkmalen (den Eingaben) und in vielen Fällen einem Label (der gewünschten Ausgabe) besteht. Ein Modell – etwa ein Entscheidungsbaum, ein neuronales Netz oder eine lineare Regression – wird mit zufälligen oder vorgegebenen Parametern initialisiert und anschließend trainiert, indem seine Vorhersagen wiederholt mit den bekannten Antworten verglichen werden. Ein Optimierungsverfahren, meist Gradient Descent, passt die Parameter an, um den Vorhersagefehler zu verringern. Das Training wird so lange fortgesetzt, bis die Leistung des Modells auf einem zurückgehaltenen Validierungsset nicht mehr besser wird.
Denken Sie an einen einfachen Spamfilter. Der Trainingsdatensatz enthält Tausende von E-Mails, die als „Spam" oder „Kein Spam" gelabelt sind. Das Modell lernt, dass bestimmte Wörter, Absender-Muster und Linkstrukturen mit Spam korrelieren. Wenn eine neue E-Mail eingeht, bewertet das Modell sie und leitet sie entsprechend weiter – ohne dass jemand explizite Regeln für jedes Spam-Muster schreibt.
Warum es wichtig ist
Machine Learning treibt die meisten modernen KI-Anwendungen an – von Sprachassistenten und medizinischer Bildanalyse bis hin zu Kredit-Scoring, Bedarfsprognosen und Empfehlungssystemen. Die Methode glänzt bei Aufgaben, für die handgeschriebene Regeln unpraktisch wären, weil die Muster zu komplex, zu subtil oder zu zahlreich sind. Die Disziplin bildet zudem die Grundlage für Durchbrüche im Deep Learning, bei dem mehrschichtige neuronale Netze hierarchische Repräsentationen erlernen, die Bereiche wie Computer Vision und Natural Language Processing deutlich vorangebracht haben. Eine ausführlichere Behandlung finden Sie im Grundlagenlehrbuch von Mitchell und im IBM-Überblick zu Machine Learning.
Wichtige Arten
- Überwachtes Lernen: Das Modell lernt aus gelabelten Beispielen, etwa zur Klassifikation von Bildern oder zur Vorhersage von Hauspreisen.
- Unüberwachtes Lernen: Das Modell findet Strukturen in ungelabelten Daten, etwa bei Kundensegmentierung oder Anomalieerkennung.
- Bestärkendes Lernen: Das Modell lernt durch Interaktion mit einer Umgebung und den Erhalt von Belohnungen, eingesetzt im Game-Playing und in der Robotik.
- Halbüberwachtes und selbstüberwachtes Lernen: Hybride, die kleine Mengen gelabelter Daten zusammen mit großen Pools ungelabelter Daten nutzen und heute bei modernen Sprach- und Bildmodellen üblich sind.
Machine Learning lässt sich am besten als eine Sammlung von Techniken verstehen, die Daten in Verhalten verwandeln. Ihre Wirksamkeit hängt von der Qualität und Menge der Trainingsdaten, der Wahl des Modells und der Passung zwischen dem Lernziel und der realen Aufgabe ab, die es lösen soll.