📖

Was ist KI-Agent?

KI-Agenten nutzen LLMs, um über mehrere Schritte hinweg zu planen, zu handeln und Werkzeuge einzusetzen, um ein Ziel zu erreichen. Verständliche Definition, Funktionsweise und Bedeutung.

Ein KI-Agent ist ein Softwaresystem, das um ein großes Sprachmodell (LLM) herum aufgebaut ist und eigenständig Ziele verfolgen kann, statt nur jeweils eine einzelne Eingabeaufforderung zu beantworten. Er nimmt Eingaben wahr, schlussfolgert, was als Nächstes zu tun ist, und führt Aktionen aus, etwa das Aufrufen einer API, das Durchsuchen des Webs, das Ausführen von Code oder das Schreiben in eine Datenbank. Anschließend bewertet er das Ergebnis und entscheidet über den nächsten Schritt. Diese Schleife aus Wahrnehmen, Schlussfolgern und Handeln unterscheidet einen Agenten von einem einfachen Chatbot.

Wie ein KI-Agent funktioniert

Die meisten KI-Agenten kombinieren drei Bestandteile: ein Basismodell als Kern für das Schlussfolgern, einen Satz von Werkzeugen, die das Modell aufrufen darf, und eine Steuerschleife, die das Modell so lange arbeiten lässt, bis die Aufgabe erledigt ist. Wird dem Agenten ein Ziel gegeben, erstellt das LLM typischerweise einen Plan, wählt ein Werkzeug aus, beobachtet dessen Ausgabe und aktualisiert den Plan. Dieses Muster wird oft als ReAct bezeichnet, kurz für Reasoning plus Acting (Schlussfolgern plus Handeln).

Wird ein Agent beispielsweise angewiesen, „die Kundenbeschwerden dieser Woche zusammenzufassen", listet er möglicherweise aktuelle Dateien auf, liest jede einzelne, extrahiert mit einem Sprachmodellaufruf die Hauptthemen und schreibt einen Bericht in ein Dokument – alles ohne dass ein Mensch jeden Schritt festlegt. Viele Agenten verfügen außerdem über ein Kurz- oder Langzeitgedächtnis, um Kontext über mehrere Durchläufe hinweg zu bewahren und sich von Fehlern zu erholen. Frameworks wie LangGraph, das OpenAI Agents SDK und die Tool-Use-API von Anthropic stellen Entwicklern diese Grundbausteine zur Verfügung.

Warum das wichtig ist

KI-Agenten verwandeln Sprachmodelle von passiven Antwortgebern in Systeme, die echte Arbeitsabläufe erledigen können. Deshalb hat sich der Begriff „agentic AI" (agentenbasierte KI) in der Unternehmenssoftware so schnell verbreitet. Sie werden eingesetzt für Rechercheunterstützung, Coding-Copiloten, die Pull Requests öffnen, Kundensupport-Bots, die Kontodaten abrufen, sowie für operative Aufgaben wie Terminplanung oder Dateneingabe. Da Agenten Aktionen verketten und Werkzeuge nutzen können, können sie auch auf neue Weise fehlschlagen – durch falsche Werkzeugaufrufe, Endlosschleifen oder Prompt-Injection durch nicht vertrauenswürdige Inhalte. Deshalb werden sie in der Regel mit Leitplanken, menschlicher Kontrolle und eingeschränkten Berechtigungen bereitgestellt.

Wichtige Arten

  • Ein-Schritt-Werkzeugnutzer: Modelle, die ein oder zwei Werkzeugaufrufe tätigen, um eine Frage zu beantworten, etwa ein Chatbot, der das Web einmal durchsucht.
  • Mehrschritt-Aufgabenagenten: Systeme, die mehrere Aktionen hintereinander planen und ausführen, beispielsweise ein Recherche-Agent, der liest, zusammenfasst und einen Bericht schreibt.
  • Multi-Agenten-Systeme: Konstellationen, in denen spezialisierte Agenten Aufgaben untereinander weiterreichen, zum Beispiel ein Planer, ein Codierer und ein Reviewer, die gemeinsam an einer Softwareaufgabe arbeiten.
  • Computer- und embodied Agenten: Agenten, die einen Browser steuern, einen Desktop kontrollieren oder Roboter bedienen, indem sie Ziele in UI- oder physische Aktionen übersetzen.

Da Basismodelle immer besser im strukturierten Schlussfolgern und im Umgang mit Werkzeugen werden, wechseln KI-Agenten von Demos zu Produktionssystemen, die End-to-End-Arbeit übernehmen – wobei Zuverlässigkeit, Bewertung und Sicherheit weiterhin die schwierigen Punkte bleiben.

Häufig gestellte Fragen

What is the difference between an AI agent and a chatbot?
A chatbot mainly generates a reply to a single user message and stops. An AI agent plans across multiple steps, uses tools such as search, code execution, or APIs, and keeps working until a goal is met or it decides it cannot proceed. The agent pattern is about acting over time, not just responding in one turn.
Do AI agents require a large language model?
Nearly all modern AI agents are built on top of a large language model because the LLM provides the reasoning and planning ability that lets the system choose tools and interpret results. The agent itself is the surrounding loop, memory, and tools, while the LLM is the brain inside it.
What are the main risks of AI agents?
Agents can take unintended or harmful actions because they call real tools with real side effects, such as sending emails or modifying databases. Common risks include hallucinated tool calls, infinite loops, leaking data through logs, and prompt injection from untrusted web content. Production systems usually add permission scopes, human approval steps, and continuous monitoring to reduce these risks.
What are popular frameworks for building AI agents?
Common options include LangGraph and LangChain for orchestrating tool-using agents, the OpenAI Agents SDK and Anthropic's tool-use API for native model integrations, and open frameworks like CrewAI and AutoGen for multi-agent collaboration. The ecosystem changes quickly, so most teams choose based on which models and tool integrations they need.