Was ist ein Foundation Model?

Ein Foundation Model ist ein großes, allgemein einsetzbares KI-Modell, das auf umfangreichen Daten trainiert und für viele nachgelagerte Aufgaben angepasst werden kann. Erfahren Sie, wie es funktioniert und warum es wichtig ist.

HyperStore · Veröffentlicht am 2026-06-20

#AI concepts #foundation model #large language model #machine learning #transfer learning

Ein Foundation Model ist ein großes Machine-Learning-Modell, das mit Methoden wie dem selbstüberwachten Lernen auf massiven, vielfältigen Datensätzen trainiert wird. Nach diesem breiten Pre-Training kann dasselbe Modell angepasst oder feinjustiert werden, um eine Vielzahl nachgelagerter Aufgaben zu erfüllen – von der Beantwortung von Fragen und der Übersetzung von Sprachen bis hin zur Erzeugung von Bildern und der Analyse von Proteinen. Das Konzept wurde 2021 vom Center for Research on Foundation Models (CRFM) der Stanford University formalisiert, das den Begriff prägte, um ein neues Paradigma in der KI zu beschreiben.

Wie Foundation Models funktionieren

Foundation Models werden in der Regel mit einer neuronalen Netzwerkarchitektur – meist dem Transformer – erstellt und auf Hunderten Milliarden von Wörtern, Bildern oder anderen Datenpunkten trainiert, die aus dem offenen Web, Büchern, Code-Repositorys und lizenzierten Korpora zusammengetragen werden. Das Training stützt sich üblicherweise auf selbstüberwachtes Lernen, bei dem das Modell fehlende oder nächste Teile seiner eigenen Eingabe vorhersagt, sodass keine manuell beschrifteten Beispiele in großem Umfang erforderlich sind. Das Ergebnis ist ein Modell mit breitem statistischem Wissen über Sprache, Code, Bilder oder andere Modalitäten, das allgemeine Muster statt einer einzelnen Aufgabe kodiert.

Sobald das Pre-Training abgeschlossen ist, wird das Modell zur Foundation: Entwickler passen es über Techniken wie Fine-Tuning, Prompt Engineering oder Retrieval-Augmented Generation an bestimmte Anwendungen an. Dasselbe Basismodell kann daher einen Kundensupport-Chatbot, einen Zusammenfasser für Krankenakten und einen Code-Assistenten betreiben – jede Anwendung baut auf gemeinsamen Fähigkeiten auf, anstatt von Grund auf neu trainiert zu werden.

Warum es wichtig ist

Foundation Models haben die KI-Ökonomie neu geprägt, da ein einziges vortrainiertes Modell Hunderte nachgelagerter Anwendungen bedienen kann, was die Kosten und den Datenaufwand für die Entwicklung neuer Anwendungen drastisch senkt. Sie treiben weit verbreitete Systeme wie große Sprachmodelle für Text, Diffusionsmodelle zur Bilderzeugung und multimodale Modelle an, die Text, Bilder und Audio gemeinsam verarbeiten. Gleichzeitig bündelt ihre Größe Fähigkeiten, Risiken und Verzerrungen, was wichtige Fragen zu Bewertung, Sicherheit und Governance aufwirft.

Wichtige Arten von Foundation Models

Large Language Models (LLMs): textbasierte Modelle wie die GPT-Familie, Claude und Llama, die auf massiven Textkorpora trainiert werden, um Sprache zu erzeugen und darüber zu argumentieren.
Diffusionsmodelle: Bilderzeugungsmodelle wie Stable Diffusion, die darauf trainiert werden, einen Rauschhinzufügungsprozess umzukehren und Bilder aus Text-Prompts zu synthetisieren.

Multimodale Modelle: Systeme wie CLIP und GPT-4V, die Text, Bilder, Audio oder Video innerhalb einer einzigen Foundation gemeinsam verarbeiten.

Domänenspezifische Foundations: Modelle, die auf wissenschaftlicher Literatur, Proteinsequenzen oder Code vortrainiert und dann für spezialisierte Aufgaben wie Wirkstoffentdeckung oder Softwareentwicklung angepasst werden.

Indem Foundation Models das alte Paradigma, für jedes neue Problem ein enges Modell zu trainieren, durch eine einzige anpassbare Basis ersetzen, sind sie zum Standardausgangspunkt der modernen KI-Entwicklung geworden.

Das könnte Ihnen auch gefallen

Was ist Text-zu-Video?

Text-zu-Video-KI verwandelt geschriebene Eingaben in kurze Videoclips. Erfahren Sie, wie die Technologie funktioniert, warum sie wichtig ist und wo sie heute eingesetzt wird.

2026-06-20 Mehr lesen →

Was sind KI-Guardrails?

KI-Guardrails sind die Richtlinien und technischen Kontrollen, die KI-Systeme sicher, themenbezogen und innerhalb ihres genehmigten Geltungsbereichs halten. Erfahren Sie, wie sie funktionieren und warum sie wichtig sind.

2026-06-20 Mehr lesen →

Was ist ein Wissensgraph?

Ein Wissensgraph stellt reale Entitäten und die Beziehungen zwischen ihnen als Netzwerk aus Knoten und Kanten dar und ermöglicht es Maschinen, vernetzte Fakten abzufragen, zu verknüpfen und darüber zu schlussfolgern.

2026-06-20 Mehr lesen →

Verwandte Beiträge

Was sind synthetische Daten?

Synthetische Daten sind algorithmisch erzeugte Informationen, die die statistischen Muster echter Daten widerspiegeln, ohne reale Datensätze offenzulegen. Erfahren Sie, wie sie entstehen und warum sie wichtig sind.

2026-06-20 Mehr lesen →

Was ist Overfitting?

Overfitting liegt vor, wenn ein Machine-Learning-Modell die Trainingsdaten auswendig lernt, statt verallgemeinerbare Muster zu erlernen, was die Leistung bei neuen Daten verschlechtert.

2026-06-20 Mehr lesen →

Was sind Trainingsdaten?

Trainingsdaten sind die Beispiele, aus denen ein Machine-Learning-Modell lernt. Erfahren Sie, was als Trainingsdaten zählt, wie sie das Modellverhalten prägen und warum Qualität entscheidend ist.

2026-06-20 Mehr lesen →

← Zurück zu allen Beiträgen