Was ist ein Kontextfenster?

Ein Kontextfenster ist die maximale Textmenge, die ein großes Sprachmodell in einer einzelnen Interaktion verarbeiten kann, gemessen in Tokens. Erfahren Sie, wie es funktioniert und warum es wichtig ist.

HyperStore · Veröffentlicht am 2026-06-20

#AI fundamentals #context window #large language models #LLM #tokens

Ein Kontextfenster ist die maximale Textmenge, gemessen in Tokens, die ein großes Sprachmodell (LLM) in einer einzelnen Interaktion verarbeiten kann. Es definiert die gesamte Informationsspanne, auf die sich das Modell gleichzeitig konzentrieren kann, einschließlich der Eingabeaufforderung des Nutzers, angehängter Dokumente, früherer Gesprächsverläufe und der vom Modell selbst generierten Antwort. Wenn ein Gespräch oder Dokument das Kontextfenster überschreitet, werden frühere Inhalte in der Regel abgeschnitten oder verworfen, was dazu führen kann, dass das Modell Details „vergisst“, die ihm nur Augenblicke zuvor gegeben wurden.

Wie ein Kontextfenster funktioniert

Bevor Text ein LLM erreicht, wird er in Tokens zerlegt – die kleinen Einheiten (ungefähr Wörter oder Wortteile), die das Modell tatsächlich liest. Das Kontextfenster ist das feste Token-Budget, das das Modell gleichzeitig im Arbeitsspeicher halten kann. Wenn ein Modell ein Kontextfenster von 128.000 Tokens angibt, muss alles – Systemanweisungen, abgerufene Dokumente, der gesamte Chatverlauf und die zu erstellende Antwort – in dieses 128.000-Token-Limit passen.

Intern verwendet das Modell einen Mechanismus namens Attention (Aufmerksamkeit), um die Beziehungen zwischen jedem Token in diesem Fenster zu gewichten. Da jedes Token jedes andere Token beachtet, steigen die Rechen- und Speicherkosten ungefähr im Quadrat zur Fenstergröße, weshalb die Erweiterung des Kontextfensters ein aktives Forschungsgebiet ist. Praktische Auswirkungen zeigen sich schnell: Ein „Nadel im Heuhaufen“-Test mit 200.000 Tokens, bei dem eine bestimmte Tatsache in einem langen Dokument versteckt ist, zeigt, ob das Modell diese Tatsache noch abrufen kann, wenn später in der Eingabeaufforderung danach gefragt wird.

Warum es wichtig ist

Das Kontextfenster ist die mit Abstand wichtigste Einschränkung dafür, was ein LLM in einer bestimmten Runde tun kann. Ein kleines Fenster zwingt Nutzer, lange Dokumente in Abschnitte aufzuteilen, frühere Teile zusammenzufassen oder sich auf Retrieval-Augmented Generation (RAG) zu verlassen, um nur die relevantesten Passagen einzuspeisen. Ein größeres Fenster ermöglicht es einem Modell, ganze Codebasen, lange juristische Verträge, vollständige Transkripte oder stundenlange Gespräche aufzunehmen, ohne den Überblick über frühere Details zu verlieren.

Für Entwickler bestimmt die Fenstergröße Architekturentscheidungen: wie Retrieval-Pipelines aufgebaut werden, wie der Chat-Speicher verwaltet wird und wie Eingabeaufforderungen gestaltet werden, um unter dem Limit zu bleiben. Für Endnutzer ist es der Unterschied zwischen dem Einfügen eines Kapitels in einen Chatbot und dem Einfügen eines ganzen Buches – und ob das Modell bei Seite fünfzig noch eine Frage zu Seite drei beantworten kann.

Wichtige Typen und aktuelle Größen

Kurzer Kontext (2K–8K Tokens): die frühe Generation von Verbraucher-LLMs, ungefähr die Länge einer langen E-Mail oder einiger Seiten Prosa.
Standardkontext (32K–128K Tokens): üblich in modernen Spitzenmodellen, ausreichend für einen ganzen Roman, eine mittelgroße Codebasis oder ein langes Besprechungstranskript.
Langer Kontext (200K–1M+ Tokens): neuere „Long-Context“-Modelle, die ganze Bücher, Repositories mit mehreren Dateien oder mehrstündige Gespräche in einem Durchgang aufnehmen können.
Effektiver vs. angegebener Kontext: das angegebene Fenster ist die maximale Eingabegröße, während das effektive Fenster der Teil ist, über den das Modell Informationen zuverlässig abruft und darüber nachdenkt. Unabhängige Benchmarks zeigen oft, dass das effektive Fenster kleiner ist als das angegebene.

Kontextfenster haben sich seit 2023 dramatisch erweitert, aber größer ist nicht immer besser: Längere Fenster kosten mehr Speicher, laufen langsamer und können den Fokus des Modells verwässern. Für die meisten Aufgaben ist es nützlicher, ein Modell mit einem Kontextfenster zu wählen, das die Eingabe bequem aufnimmt, als der größten Zahl auf dem Datenblatt hinterherzujagen.

Wie ein Kontextfenster funktioniert

Warum es wichtig ist

Wichtige Typen und aktuelle Größen

Das könnte Ihnen auch gefallen

Was ist Deep Learning?

Was ist generative KI?

Was ist Natural Language Processing (NLP)?

Verwandte Beiträge

Was ist Deep Learning?

Was ist generative KI?

Was ist Natural Language Processing (NLP)?