Eine KI-Halluzination ist eine zuversichtliche, flüssige Antwort, die von einem System der künstlichen Intelligenz erzeugt wird und fabrizierte, ungenaue oder nicht überprüfbare Informationen enthält, die als Tatsache dargestellt werden. Der Begriff wird am häufigsten auf große Sprachmodelle (LLMs) und andere generative KI-Systeme angewendet, die Texte, Bilder, Quellenangaben oder numerische Behauptungen erzeugen können, die zwar autoritativ klingen, aber keinerlei Bezug zu realen Daten haben. Da diese Systeme darauf ausgelegt sind, plausible Ausgaben zu erzeugen, statt verifizierte Wahrheit abzurufen, sind Halluzinationen eine strukturelle Eigenschaft ihrer Funktionsweise und kein gelegentlicher Fehler.
Wie KI-Halluzination funktioniert
Große Sprachmodelle erzeugen Ausgaben Token für Token, indem sie vorhersagen, was statistisch gesehen als Nächstes folgt, basierend auf Mustern, die während des Trainings gelernt wurden. Das Modell hat keinen eingebauten Begriff von einer verifizierten Fakten-Datenbank; es weiß lediglich, welche Wörter und Phrasen tendenziell aufeinander folgen. Wenn eine Eingabe spezifische Details wie eine Quellenangabe, ein Datum oder die Biografie einer Person verlangt, kann das Modell Text erzeugen, der aussieht wie die richtige Form einer Antwort, ohne dass ihn irgendetwas an reale Fakten bindet. Wenn die Trainingsdaten zu einem Thema dünn sind oder die Frage ungewöhnlich ist, füllt das Modell die Lücken im Grunde mit seiner besten Vermutung.
Ein einfaches Beispiel: Bittet man ein LLM um einen Titel und Autor eines Fachartikels, kann es einen realistisch klingenden Titel erfinden, der einem realen Forscher zugeschrieben wird, der ihn nie geschrieben hat. Das Modell lügt nicht absichtlich; es tut genau das, worauf es trainiert wurde – eine wahrscheinliche Fortsetzung zu produzieren. Retrieval-Augmented Generation (RAG), Werkzeugnutzung und eingeschränkte Decodierung sind gängige Techniken, um dieses Verhalten zu reduzieren – wenn auch nicht vollständig zu beseitigen.
Warum es wichtig ist
Halluzinationen sind wichtig, weil Nutzer KI-Ausgaben häufig als autoritativ behandeln, insbesondere wenn sie in einem zuversichtlichen, polierten Format präsentiert werden. In Bereichen wie Medizin, Recht, Journalismus und Softwareentwicklung kann bereits eine einzige erfundene Quellenangabe oder eine erfundene API echten Schaden anrichten. Deshalb kombinieren die meisten Unternehmens- und Produktionsumgebungen generative Modelle mit Abrufsystemen, Faktenprüfungsschichten und menschlicher Überprüfung. Zu verstehen, dass Halluzination ein Standardverhalten und kein seltener Fehler ist, ist für alle, die KI-generierte Inhalte veröffentlichen oder sich auf sie verlassen, unerlässlich.
Häufige Arten von KI-Halluzinationen
- Faktische Halluzination: zuversichtlich geäußerte Tatsachen, die falsch sind, wie erfundene Statistiken, Daten oder historische Ereignisse.
- Erfundene Quellenangabe: Verweise auf Fachartikel, Beiträge oder URLs, die nicht existieren oder reale Werke dem falschen Autor zuschreiben.
- Intrinsisch vs. extrinsisch: Eine intrinsische Halluzination widerspricht dem Quellmaterial, das dem Modell gegeben wurde (z. B. ein bereitgestelltes Dokument), während eine extrinsische Halluzination Informationen einführt, die durch keinerlei Quelle gestützt werden.
- Argumentations-Halluzination: logische Schritte, die zwar gültig erscheinen, aber fehlerhafte Schlussfolgerungen enthalten, wie beispielsweise korrekt aussehende Mathematik, die zu einem falschen Ergebnis führt.
Halluzinationen sind ein inhärenter Kompromiss der heutigen generativen KI: Dieselbe Sprachgewandtheit und Flexibilität, die Modelle nützlich machen, befähigen sie auch, plausible Falschaussagen zu erfinden. Modellausgaben als Entwurf zu behandeln, der überprüft werden muss, und nicht als fertige Quelle der Wahrheit, bleibt die zuverlässigste Abwehr. Werkzeuge, die Modelle in abgerufenen Dokumenten verankern, strukturierte Ausgaben erzwingen oder Behauptungen gegen vertrauenswürdige Datenbanken prüfen, können die Rate der Halluzinationen deutlich senken, beseitigen aber nicht die zugrunde liegende Ursache.