📖

Was ist Open-Source-LLM?

Ein Open-Source-LLM ist ein großes Sprachmodell, das mit öffentlichen Gewichten und Lizenzen veröffentlicht wird, sodass jeder es ausführen, prüfen und verändern kann. Erfahren Sie, wie diese Modelle funktionieren und warum sie wichtig sind.

Ein Open-Source-LLM ist ein großes Sprachmodell, dessen trainierte Parameter – und häufig auch der zugehörige Trainings- und Inferenzcode – unter einer Lizenz veröffentlicht werden, die das Herunterladen, Prüfen, Feintuning und Weiterverbreiten des Modells erlaubt. Die Idee folgt der Tradition von Open-Source-Software: Indem die Funktionsweise eines Modells offen geteilt wird, können alle – vom einzelnen Entwickler bis zum Großunternehmen – darauf aufbauen, anstatt sich ausschließlich auf geschlossene APIs zu verlassen. In der Praxis deckt die Bezeichnung ein breites Spektrum ab, von vollständig offenen Veröffentlichungen, die Trainingsdaten und -rezepte offenlegen, bis hin zu "Open-Weight"-Veröffentlichungen, die das Modell teilen, Daten und Methoden jedoch teilweise proprietär halten.

Wie Open-Source-LLMs funktionieren

Das Training eines LLM verläuft in zwei Phasen. Zunächst lernt das Modell allgemeine Sprachmuster, indem es das nächste Token über riesige Textkorpora hinweg vorhersagt – dies wird als Pretraining bezeichnet. Anschließend wird es mit menschlichem Feedback oder kuratierten Beispielen verfeinert, sodass seine Antworten nützlicher werden; diese Phase nennt man Post-Training oder Alignment. Bei einer Open-Source-LLM-Veröffentlichung ist das wichtigste Artefakt die Gewichtedatei: ein Snapshot der Milliarden (oder Billionen) numerischer Parameter, die das Gelernte des Modells kodieren.

Sobald die Gewichte veröffentlicht sind – typischerweise auf einer Plattform wie Hugging Face – kann jeder mit ausreichend GPU-Speicher das Modell lokal laden, Inferenz auf eigener Hardware ausführen, es auf einem eigenen Datensatz feintunen oder sogar das Pretraining für ein neues Fachgebiet fortsetzen. Ein kleines Community-Modell wie Mistral kann auf einem Laptop laufen, während ein Modell mit 70 Milliarden Parametern mehrere High-End-GPUs benötigt. Da die Gewichte sichtbar sind, können Forschende das Modell auch auf Verzerrungen, Sicherheitsprobleme und Fähigkeiten untersuchen – eine Auditierbarkeit, die geschlossene APIs nicht bieten.

Warum es wichtig ist

Open-Source-LLMs geben Organisationen Kontrolle über Kosten, Datenschutz und Bereitstellung. Ein Krankenhaus, eine Anwaltskanzlei oder eine Behörde kann ein Modell auf eigenen Servern betreiben, sodass sensible Prompts das Netzwerk nie verlassen. Entwickler in Regionen mit eingeschränktem API-Zugang können trotzdem KI-Anwendungen entwickeln. Forschende können untersuchen, wie sich Modelle verhalten, und veröffentlichte Ergebnisse reproduzieren, was die Wissenschaft der KI-Sicherheit stärkt.

Offene Veröffentlichungen erzeugen zudem Wettbewerbsdruck auf geschlossene Anbieter, beschleunigen Innovation, indem sie Communities ermöglichen, Verbesserungen zu bündeln, und reduzieren Vendor Lock-in. Die Kompromisse sind real: Offene Gewichte können für Desinformation oder schädliche Werkzeuge missbraucht werden, und die Lizenzlandschaft ist uneinheitlich – einige "offene" Modelle schränken die kommerzielle Nutzung ein oder enthalten Nutzungsklauseln, die von der klassischen Open-Source-Definition der Open Source Initiative abweichen.

Wichtige Beispiele und Lizenztypen

  • Metas Llama-Familie – hochwertige Open-Weight-Modelle mit einer Lizenz, die kommerzielle Nutzung erlaubt, jedoch Nutzungseinschränkungen und eine umsatzabhängige Klausel enthält.
  • Mistral- und Mixtral-Modelle – veröffentlicht unter der permissiven Apache-2.0-Lizenz, die breite kommerzielle und abgeleitete Nutzung ermöglicht.
  • DeepSeek, Qwen und Yi – in China entwickelte Open-Weight-Modelle, die westliche Pendants in Benchmarks schnell erreicht haben.
  • OLMo von Allen AI – eine vollständig offene Veröffentlichung, die Trainingscode, Daten und Evaluierungswerkzeuge umfasst, nicht nur Gewichte.
  • Pythia und BLOOM – forschungsorientierte Modelle, die mit umfangreicher Dokumentation für Reproduzierbarkeitsstudien veröffentlicht wurden.

Ob man es nun Open-Source oder Open-Weight nennt – der praktische Wandel ist erheblich: Die Fähigkeiten, die früher nur hinter einer Handvoll API-Endpunkten lebten, liegen jetzt in einem öffentlichen Verzeichnis, das jeder Entwickler klonen kann. Für Teams, die zwischen dem Aufbau auf geschlossenen APIs und Self-Hosting abwägen, sind die entscheidenden Faktoren meist Daten-Governance, Latenzanforderungen, Gesamtbetriebskosten und der Grad an Anpassung, den die Anwendung benötigt.

Häufig gestellte Fragen

Is Llama truly open-source?
It depends on your definition. Meta's Llama models publish their weights and allow commercial use, but the license includes use-case restrictions and a clause for very large commercial deployments. By the strict Open Source Initiative definition, it is usually classified as "open-weight" rather than fully open-source, because not all training artifacts are released and redistribution is constrained.
What is the difference between open-source and open-weight LLMs?
Open-weight models release the trained parameters so anyone can run and fine-tune them, but may withhold training data or code. Open-source LLMs aim to release everything — weights, training code, data, and recipes — under a permissive license. The stricter the release, the easier it is for independent researchers to reproduce and audit the model.
Can I run an open-source LLM on my own computer?
Smaller open-source models in the 1B–8B parameter range can run on consumer hardware, sometimes on a laptop with sufficient RAM or a single consumer GPU. Larger models in the 30B–70B range typically need multiple high-end data-center GPUs and significant memory. Quantized versions, which store weights in lower precision, make running bigger models on modest hardware more feasible.
Why would a company choose an open-source LLM over a closed API?
Common reasons include data privacy (prompts never leave the company), predictable costs at scale, the ability to fine-tune on proprietary data, no vendor lock-in, and compliance with regulations that restrict sending data to third-party APIs. The trade-off is that the company takes on the operational burden of hosting, updating, and securing the model itself.