Was ist ein KI-Agent?

KI-Agenten nutzen LLMs, um über mehrere Schritte hinweg zu planen, zu handeln und Werkzeuge einzusetzen, um ein Ziel zu erreichen. Verständliche Definition, Funktionsweise und Bedeutung.

Ein KI-Agent ist ein Softwaresystem, das um ein großes Sprachmodell (LLM) herum aufgebaut ist und eigenständig Ziele verfolgen kann, statt nur jeweils eine einzelne Eingabeaufforderung zu beantworten. Er nimmt Eingaben wahr, schlussfolgert, was als Nächstes zu tun ist, und führt Aktionen aus, etwa das Aufrufen einer API, das Durchsuchen des Webs, das Ausführen von Code oder das Schreiben in eine Datenbank. Anschließend bewertet er das Ergebnis und entscheidet über den nächsten Schritt. Diese Schleife aus Wahrnehmen, Schlussfolgern und Handeln unterscheidet einen Agenten von einem einfachen Chatbot.

Wie ein KI-Agent funktioniert

Die meisten KI-Agenten kombinieren drei Bestandteile: ein Basismodell als Kern für das Schlussfolgern, einen Satz von Werkzeugen, die das Modell aufrufen darf, und eine Steuerschleife, die das Modell so lange arbeiten lässt, bis die Aufgabe erledigt ist. Wird dem Agenten ein Ziel gegeben, erstellt das LLM typischerweise einen Plan, wählt ein Werkzeug aus, beobachtet dessen Ausgabe und aktualisiert den Plan. Dieses Muster wird oft als ReAct bezeichnet, kurz für Reasoning plus Acting (Schlussfolgern plus Handeln).

Wird ein Agent beispielsweise angewiesen, „die Kundenbeschwerden dieser Woche zusammenzufassen", listet er möglicherweise aktuelle Dateien auf, liest jede einzelne, extrahiert mit einem Sprachmodellaufruf die Hauptthemen und schreibt einen Bericht in ein Dokument – alles ohne dass ein Mensch jeden Schritt festlegt. Viele Agenten verfügen außerdem über ein Kurz- oder Langzeitgedächtnis, um Kontext über mehrere Durchläufe hinweg zu bewahren und sich von Fehlern zu erholen. Frameworks wie LangGraph, das OpenAI Agents SDK und die Tool-Use-API von Anthropic stellen Entwicklern diese Grundbausteine zur Verfügung.

Warum das wichtig ist

KI-Agenten verwandeln Sprachmodelle von passiven Antwortgebern in Systeme, die echte Arbeitsabläufe erledigen können. Deshalb hat sich der Begriff „agentic AI" (agentenbasierte KI) in der Unternehmenssoftware so schnell verbreitet. Sie werden eingesetzt für Rechercheunterstützung, Coding-Copiloten, die Pull Requests öffnen, Kundensupport-Bots, die Kontodaten abrufen, sowie für operative Aufgaben wie Terminplanung oder Dateneingabe. Da Agenten Aktionen verketten und Werkzeuge nutzen können, können sie auch auf neue Weise fehlschlagen – durch falsche Werkzeugaufrufe, Endlosschleifen oder Prompt-Injection durch nicht vertrauenswürdige Inhalte. Deshalb werden sie in der Regel mit Leitplanken, menschlicher Kontrolle und eingeschränkten Berechtigungen bereitgestellt.

Wichtige Arten

  • Ein-Schritt-Werkzeugnutzer: Modelle, die ein oder zwei Werkzeugaufrufe tätigen, um eine Frage zu beantworten, etwa ein Chatbot, der das Web einmal durchsucht.
  • Mehrschritt-Aufgabenagenten: Systeme, die mehrere Aktionen hintereinander planen und ausführen, beispielsweise ein Recherche-Agent, der liest, zusammenfasst und einen Bericht schreibt.
  • Multi-Agenten-Systeme: Konstellationen, in denen spezialisierte Agenten Aufgaben untereinander weiterreichen, zum Beispiel ein Planer, ein Codierer und ein Reviewer, die gemeinsam an einer Softwareaufgabe arbeiten.
  • Computer- und embodied Agenten: Agenten, die einen Browser steuern, einen Desktop kontrollieren oder Roboter bedienen, indem sie Ziele in UI- oder physische Aktionen übersetzen.

Da Basismodelle immer besser im strukturierten Schlussfolgern und im Umgang mit Werkzeugen werden, wechseln KI-Agenten von Demos zu Produktionssystemen, die End-to-End-Arbeit übernehmen – wobei Zuverlässigkeit, Bewertung und Sicherheit weiterhin die schwierigen Punkte bleiben.

You might also like

Verwandte Beiträge