📖

Qu'est-ce que LLM open source ?

Un LLM open source est un grand modèle de langage publié avec des poids et des licences publiques permettant à quiconque de l'exécuter, de l'inspecter et de le modifier. Découvrez le fonctionnement de ces modèles et pourquoi ils sont importants.

Un LLM open source est un grand modèle de langage dont les paramètres entraînés, et souvent le code d'entraînement et d'inférence associé, sont rendus publics sous une licence qui autorise le téléchargement, l'inspection, le fine-tuning et la redistribution du modèle. L'idée s'inscrit dans la tradition du logiciel open source : en partageant le fonctionnement interne d'un modèle, n'importe qui — du développeur indépendant à la grande entreprise — peut construire dessus au lieu de dépendre uniquement d'API fermées. En pratique, l'appellation couvre un large spectre, allant des publications totalement ouvertes qui partagent les données et les recettes d'entraînement aux publications « open weight » qui partagent le modèle tout en gardant les données et les méthodes partiellement propriétaires.

Comment fonctionnent les LLM open source

L'entraînement d'un LLM se fait en deux étapes. D'abord, le modèle apprend les schémas généraux du langage en prédisant le token suivant sur d'énormes corpus de texte — c'est ce qu'on appelle le pré-entraînement. Ensuite, il est affiné grâce à des retours humains ou à des exemples sélectionnés pour rendre ses réponses plus utiles, une étape connue sous le nom de post-entraînement ou d'alignement. Dans une publication de LLM open source, l'élément le plus important est le fichier de poids : un instantané des milliards (voire des milliers de milliards) de paramètres numériques qui encodent ce que le modèle a appris.

Une fois les poids publiés, généralement sur une plateforme comme Hugging Face, toute personne disposant d'une mémoire GPU suffisante peut charger le modèle en local, exécuter l'inférence sur son propre matériel, le fine-tuner sur un jeu de données personnalisé, ou même poursuivre son pré-entraînement pour un nouveau domaine. Un petit modèle construit par la communauté comme Mistral peut tourner sur un ordinateur portable, tandis qu'un modèle à 70 milliards de paramètres nécessite plusieurs GPU haut de gamme. Comme les poids sont visibles, les chercheurs peuvent aussi sonder le modèle pour détecter des biais, des problèmes de sécurité et des capacités — une auditabilité que les API fermées ne permettent pas.

Pourquoi c'est important

Les LLM open source donnent aux organisations le contrôle sur les coûts, la confidentialité des données et le déploiement. Un hôpital, un cabinet d'avocats ou une agence gouvernementale peut exécuter un modèle sur ses propres serveurs afin que les prompts sensibles ne quittent jamais le réseau. Les développeurs situés dans des régions à l'accès limité aux API peuvent tout de même construire des applications d'IA. Les chercheurs peuvent étudier le comportement des modèles et reproduire les résultats publiés, ce qui renforce la science de la sécurité de l'IA.

Les publications ouvertes exercent aussi une pression concurrentielle sur les fournisseurs fermés, accélèrent l'innovation en permettant aux communautés de mutualiser les améliorations, et réduisent la dépendance vis-à-vis d'un fournisseur unique. Les compromis sont bien réels : les poids ouverts peuvent être détournés à des fins de désinformation ou pour créer des outils nuisibles, et le paysage des licences est inégal — certains modèles dits « open » restreignent l'usage commercial ou imposent des clauses d'usage qui s'écartent de la définition classique de l'open source défendue par l'Open Source Initiative.

Exemples clés et types de licences

  • La famille Llama de Meta — des modèles open weight de haute qualité avec une licence autorisant l'usage commercial mais comportant des restrictions d'usage et une clause de revenus basée sur la taille.
  • Les modèles Mistral et Mixtral — publiés sous la licence permissive Apache 2.0, autorisant un large usage commercial et dérivé.
  • DeepSeek, Qwen et Yi — des modèles open weight développés en Chine qui ont rapidement rattrapé leurs homologues occidentaux sur les benchmarks.
  • OLMo d'Allen AI — une publication totalement ouverte qui inclut le code d'entraînement, les données et les outils d'évaluation, et pas seulement les poids.
  • Pythia et BLOOM — des modèles orientés recherche publiés avec une documentation approfondie pour les études de reproductibilité.

Que vous l'appeliez open source ou open weight, le changement pratique est significatif : les capacités qui autrefois ne vivaient qu'à l'intérieur de quelques points d'accès d'API se trouvent désormais dans un répertoire public que n'importe quel développeur peut cloner. Pour les équipes qui hésitent entre construire sur des API fermées ou auto-héberger, les facteurs décisifs sont généralement la gouvernance des données, les exigences de latence, le coût total de possession et le niveau de personnalisation dont l'application a besoin.

Questions fréquemment posées

Is Llama truly open-source?
It depends on your definition. Meta's Llama models publish their weights and allow commercial use, but the license includes use-case restrictions and a clause for very large commercial deployments. By the strict Open Source Initiative definition, it is usually classified as "open-weight" rather than fully open-source, because not all training artifacts are released and redistribution is constrained.
What is the difference between open-source and open-weight LLMs?
Open-weight models release the trained parameters so anyone can run and fine-tune them, but may withhold training data or code. Open-source LLMs aim to release everything — weights, training code, data, and recipes — under a permissive license. The stricter the release, the easier it is for independent researchers to reproduce and audit the model.
Can I run an open-source LLM on my own computer?
Smaller open-source models in the 1B–8B parameter range can run on consumer hardware, sometimes on a laptop with sufficient RAM or a single consumer GPU. Larger models in the 30B–70B range typically need multiple high-end data-center GPUs and significant memory. Quantized versions, which store weights in lower precision, make running bigger models on modest hardware more feasible.
Why would a company choose an open-source LLM over a closed API?
Common reasons include data privacy (prompts never leave the company), predictable costs at scale, the ability to fine-tune on proprietary data, no vendor lock-in, and compliance with regulations that restrict sending data to third-party APIs. The trade-off is that the company takes on the operational burden of hosting, updating, and securing the model itself.