📖

Was ist KI-Halluzination?

Ein Glossareintrag in einfachem Englisch, der erklärt, was KI-Halluzinationen sind, warum Sprachmodelle Fakten erfinden und wie man sie erkennt und reduziert.

Eine KI-Halluzination ist eine zuversichtliche, flüssige Antwort, die von einem System der künstlichen Intelligenz erzeugt wird und fabrizierte, ungenaue oder nicht überprüfbare Informationen enthält, die als Tatsache dargestellt werden. Der Begriff wird am häufigsten auf große Sprachmodelle (LLMs) und andere generative KI-Systeme angewendet, die Texte, Bilder, Quellenangaben oder numerische Behauptungen erzeugen können, die zwar autoritativ klingen, aber keinerlei Bezug zu realen Daten haben. Da diese Systeme darauf ausgelegt sind, plausible Ausgaben zu erzeugen, statt verifizierte Wahrheit abzurufen, sind Halluzinationen eine strukturelle Eigenschaft ihrer Funktionsweise und kein gelegentlicher Fehler.

Wie KI-Halluzination funktioniert

Große Sprachmodelle erzeugen Ausgaben Token für Token, indem sie vorhersagen, was statistisch gesehen als Nächstes folgt, basierend auf Mustern, die während des Trainings gelernt wurden. Das Modell hat keinen eingebauten Begriff von einer verifizierten Fakten-Datenbank; es weiß lediglich, welche Wörter und Phrasen tendenziell aufeinander folgen. Wenn eine Eingabe spezifische Details wie eine Quellenangabe, ein Datum oder die Biografie einer Person verlangt, kann das Modell Text erzeugen, der aussieht wie die richtige Form einer Antwort, ohne dass ihn irgendetwas an reale Fakten bindet. Wenn die Trainingsdaten zu einem Thema dünn sind oder die Frage ungewöhnlich ist, füllt das Modell die Lücken im Grunde mit seiner besten Vermutung.

Ein einfaches Beispiel: Bittet man ein LLM um einen Titel und Autor eines Fachartikels, kann es einen realistisch klingenden Titel erfinden, der einem realen Forscher zugeschrieben wird, der ihn nie geschrieben hat. Das Modell lügt nicht absichtlich; es tut genau das, worauf es trainiert wurde – eine wahrscheinliche Fortsetzung zu produzieren. Retrieval-Augmented Generation (RAG), Werkzeugnutzung und eingeschränkte Decodierung sind gängige Techniken, um dieses Verhalten zu reduzieren – wenn auch nicht vollständig zu beseitigen.

Warum es wichtig ist

Halluzinationen sind wichtig, weil Nutzer KI-Ausgaben häufig als autoritativ behandeln, insbesondere wenn sie in einem zuversichtlichen, polierten Format präsentiert werden. In Bereichen wie Medizin, Recht, Journalismus und Softwareentwicklung kann bereits eine einzige erfundene Quellenangabe oder eine erfundene API echten Schaden anrichten. Deshalb kombinieren die meisten Unternehmens- und Produktionsumgebungen generative Modelle mit Abrufsystemen, Faktenprüfungsschichten und menschlicher Überprüfung. Zu verstehen, dass Halluzination ein Standardverhalten und kein seltener Fehler ist, ist für alle, die KI-generierte Inhalte veröffentlichen oder sich auf sie verlassen, unerlässlich.

Häufige Arten von KI-Halluzinationen

  • Faktische Halluzination: zuversichtlich geäußerte Tatsachen, die falsch sind, wie erfundene Statistiken, Daten oder historische Ereignisse.
  • Erfundene Quellenangabe: Verweise auf Fachartikel, Beiträge oder URLs, die nicht existieren oder reale Werke dem falschen Autor zuschreiben.
  • Intrinsisch vs. extrinsisch: Eine intrinsische Halluzination widerspricht dem Quellmaterial, das dem Modell gegeben wurde (z. B. ein bereitgestelltes Dokument), während eine extrinsische Halluzination Informationen einführt, die durch keinerlei Quelle gestützt werden.
  • Argumentations-Halluzination: logische Schritte, die zwar gültig erscheinen, aber fehlerhafte Schlussfolgerungen enthalten, wie beispielsweise korrekt aussehende Mathematik, die zu einem falschen Ergebnis führt.

Halluzinationen sind ein inhärenter Kompromiss der heutigen generativen KI: Dieselbe Sprachgewandtheit und Flexibilität, die Modelle nützlich machen, befähigen sie auch, plausible Falschaussagen zu erfinden. Modellausgaben als Entwurf zu behandeln, der überprüft werden muss, und nicht als fertige Quelle der Wahrheit, bleibt die zuverlässigste Abwehr. Werkzeuge, die Modelle in abgerufenen Dokumenten verankern, strukturierte Ausgaben erzwingen oder Behauptungen gegen vertrauenswürdige Datenbanken prüfen, können die Rate der Halluzinationen deutlich senken, beseitigen aber nicht die zugrunde liegende Ursache.

Häufig gestellte Fragen

Can AI hallucinations be completely eliminated?
No. Hallucinations are a consequence of how generative models predict likely text rather than look up verified facts. Techniques like retrieval-augmented generation, grounding, and constrained decoding reduce how often they occur, but no current method eliminates them entirely. Human review remains important for high-stakes use cases.
Are hallucinations the same as lies?
Not really. A lie implies intent to deceive. AI models do not have beliefs or intentions; they generate statistically likely continuations. When a model produces a false statement, it is performing pattern matching, not deliberately misleading the user. That is why framing hallucination as a technical limitation, not a moral failure of the AI, is more accurate.
Which AI models hallucinate the most?
Hallucination rates vary by model, task, and prompt. Smaller or older models tend to hallucinate more because they have less coverage of the world in their training data. Even frontier models hallucinate on niche topics, edge cases, and when asked for precise citations. There is no single authoritative benchmark, but independent evaluations like the Vectara HHEM Leaderboard publish comparative hallucination scores for popular LLMs.
How can users spot an AI hallucination?
Verify any specific claim, especially names, numbers, dates, and citations, against a trusted independent source. Be cautious when a response is unusually confident about an obscure fact, when citations look plausible but cannot be found online, or when the model hedges strangely. Cross-checking with retrieval-based tools or asking the model to show its sources can help, but the most reliable safeguard is still human verification.