Ein Open-Source-LLM ist ein großes Sprachmodell, dessen trainierte Parameter – und häufig auch der zugehörige Trainings- und Inferenzcode – unter einer Lizenz veröffentlicht werden, die das Herunterladen, Prüfen, Feintuning und Weiterverbreiten des Modells erlaubt. Die Idee folgt der Tradition von Open-Source-Software: Indem die Funktionsweise eines Modells offen geteilt wird, können alle – vom einzelnen Entwickler bis zum Großunternehmen – darauf aufbauen, anstatt sich ausschließlich auf geschlossene APIs zu verlassen. In der Praxis deckt die Bezeichnung ein breites Spektrum ab, von vollständig offenen Veröffentlichungen, die Trainingsdaten und -rezepte offenlegen, bis hin zu "Open-Weight"-Veröffentlichungen, die das Modell teilen, Daten und Methoden jedoch teilweise proprietär halten.
Wie Open-Source-LLMs funktionieren
Das Training eines LLM verläuft in zwei Phasen. Zunächst lernt das Modell allgemeine Sprachmuster, indem es das nächste Token über riesige Textkorpora hinweg vorhersagt – dies wird als Pretraining bezeichnet. Anschließend wird es mit menschlichem Feedback oder kuratierten Beispielen verfeinert, sodass seine Antworten nützlicher werden; diese Phase nennt man Post-Training oder Alignment. Bei einer Open-Source-LLM-Veröffentlichung ist das wichtigste Artefakt die Gewichtedatei: ein Snapshot der Milliarden (oder Billionen) numerischer Parameter, die das Gelernte des Modells kodieren.
Sobald die Gewichte veröffentlicht sind – typischerweise auf einer Plattform wie Hugging Face – kann jeder mit ausreichend GPU-Speicher das Modell lokal laden, Inferenz auf eigener Hardware ausführen, es auf einem eigenen Datensatz feintunen oder sogar das Pretraining für ein neues Fachgebiet fortsetzen. Ein kleines Community-Modell wie Mistral kann auf einem Laptop laufen, während ein Modell mit 70 Milliarden Parametern mehrere High-End-GPUs benötigt. Da die Gewichte sichtbar sind, können Forschende das Modell auch auf Verzerrungen, Sicherheitsprobleme und Fähigkeiten untersuchen – eine Auditierbarkeit, die geschlossene APIs nicht bieten.
Warum es wichtig ist
Open-Source-LLMs geben Organisationen Kontrolle über Kosten, Datenschutz und Bereitstellung. Ein Krankenhaus, eine Anwaltskanzlei oder eine Behörde kann ein Modell auf eigenen Servern betreiben, sodass sensible Prompts das Netzwerk nie verlassen. Entwickler in Regionen mit eingeschränktem API-Zugang können trotzdem KI-Anwendungen entwickeln. Forschende können untersuchen, wie sich Modelle verhalten, und veröffentlichte Ergebnisse reproduzieren, was die Wissenschaft der KI-Sicherheit stärkt.
Offene Veröffentlichungen erzeugen zudem Wettbewerbsdruck auf geschlossene Anbieter, beschleunigen Innovation, indem sie Communities ermöglichen, Verbesserungen zu bündeln, und reduzieren Vendor Lock-in. Die Kompromisse sind real: Offene Gewichte können für Desinformation oder schädliche Werkzeuge missbraucht werden, und die Lizenzlandschaft ist uneinheitlich – einige "offene" Modelle schränken die kommerzielle Nutzung ein oder enthalten Nutzungsklauseln, die von der klassischen Open-Source-Definition der Open Source Initiative abweichen.
Wichtige Beispiele und Lizenztypen
- Metas Llama-Familie – hochwertige Open-Weight-Modelle mit einer Lizenz, die kommerzielle Nutzung erlaubt, jedoch Nutzungseinschränkungen und eine umsatzabhängige Klausel enthält.
- Mistral- und Mixtral-Modelle – veröffentlicht unter der permissiven Apache-2.0-Lizenz, die breite kommerzielle und abgeleitete Nutzung ermöglicht.
- DeepSeek, Qwen und Yi – in China entwickelte Open-Weight-Modelle, die westliche Pendants in Benchmarks schnell erreicht haben.
- OLMo von Allen AI – eine vollständig offene Veröffentlichung, die Trainingscode, Daten und Evaluierungswerkzeuge umfasst, nicht nur Gewichte.
- Pythia und BLOOM – forschungsorientierte Modelle, die mit umfangreicher Dokumentation für Reproduzierbarkeitsstudien veröffentlicht wurden.
Ob man es nun Open-Source oder Open-Weight nennt – der praktische Wandel ist erheblich: Die Fähigkeiten, die früher nur hinter einer Handvoll API-Endpunkten lebten, liegen jetzt in einem öffentlichen Verzeichnis, das jeder Entwickler klonen kann. Für Teams, die zwischen dem Aufbau auf geschlossenen APIs und Self-Hosting abwägen, sind die entscheidenden Faktoren meist Daten-Governance, Latenzanforderungen, Gesamtbetriebskosten und der Grad an Anpassung, den die Anwendung benötigt.