Un LLM open source est un grand modèle de langage dont les paramètres entraînés, et souvent le code d'entraînement et d'inférence associé, sont rendus publics sous une licence qui autorise le téléchargement, l'inspection, le fine-tuning et la redistribution du modèle. L'idée s'inscrit dans la tradition du logiciel open source : en partageant le fonctionnement interne d'un modèle, n'importe qui — du développeur indépendant à la grande entreprise — peut construire dessus au lieu de dépendre uniquement d'API fermées. En pratique, l'appellation couvre un large spectre, allant des publications totalement ouvertes qui partagent les données et les recettes d'entraînement aux publications « open weight » qui partagent le modèle tout en gardant les données et les méthodes partiellement propriétaires.
Comment fonctionnent les LLM open source
L'entraînement d'un LLM se fait en deux étapes. D'abord, le modèle apprend les schémas généraux du langage en prédisant le token suivant sur d'énormes corpus de texte — c'est ce qu'on appelle le pré-entraînement. Ensuite, il est affiné grâce à des retours humains ou à des exemples sélectionnés pour rendre ses réponses plus utiles, une étape connue sous le nom de post-entraînement ou d'alignement. Dans une publication de LLM open source, l'élément le plus important est le fichier de poids : un instantané des milliards (voire des milliers de milliards) de paramètres numériques qui encodent ce que le modèle a appris.
Une fois les poids publiés, généralement sur une plateforme comme Hugging Face, toute personne disposant d'une mémoire GPU suffisante peut charger le modèle en local, exécuter l'inférence sur son propre matériel, le fine-tuner sur un jeu de données personnalisé, ou même poursuivre son pré-entraînement pour un nouveau domaine. Un petit modèle construit par la communauté comme Mistral peut tourner sur un ordinateur portable, tandis qu'un modèle à 70 milliards de paramètres nécessite plusieurs GPU haut de gamme. Comme les poids sont visibles, les chercheurs peuvent aussi sonder le modèle pour détecter des biais, des problèmes de sécurité et des capacités — une auditabilité que les API fermées ne permettent pas.
Pourquoi c'est important
Les LLM open source donnent aux organisations le contrôle sur les coûts, la confidentialité des données et le déploiement. Un hôpital, un cabinet d'avocats ou une agence gouvernementale peut exécuter un modèle sur ses propres serveurs afin que les prompts sensibles ne quittent jamais le réseau. Les développeurs situés dans des régions à l'accès limité aux API peuvent tout de même construire des applications d'IA. Les chercheurs peuvent étudier le comportement des modèles et reproduire les résultats publiés, ce qui renforce la science de la sécurité de l'IA.
Les publications ouvertes exercent aussi une pression concurrentielle sur les fournisseurs fermés, accélèrent l'innovation en permettant aux communautés de mutualiser les améliorations, et réduisent la dépendance vis-à-vis d'un fournisseur unique. Les compromis sont bien réels : les poids ouverts peuvent être détournés à des fins de désinformation ou pour créer des outils nuisibles, et le paysage des licences est inégal — certains modèles dits « open » restreignent l'usage commercial ou imposent des clauses d'usage qui s'écartent de la définition classique de l'open source défendue par l'Open Source Initiative.
Exemples clés et types de licences
- La famille Llama de Meta — des modèles open weight de haute qualité avec une licence autorisant l'usage commercial mais comportant des restrictions d'usage et une clause de revenus basée sur la taille.
- Les modèles Mistral et Mixtral — publiés sous la licence permissive Apache 2.0, autorisant un large usage commercial et dérivé.
- DeepSeek, Qwen et Yi — des modèles open weight développés en Chine qui ont rapidement rattrapé leurs homologues occidentaux sur les benchmarks.
- OLMo d'Allen AI — une publication totalement ouverte qui inclut le code d'entraînement, les données et les outils d'évaluation, et pas seulement les poids.
- Pythia et BLOOM — des modèles orientés recherche publiés avec une documentation approfondie pour les études de reproductibilité.
Que vous l'appeliez open source ou open weight, le changement pratique est significatif : les capacités qui autrefois ne vivaient qu'à l'intérieur de quelques points d'accès d'API se trouvent désormais dans un répertoire public que n'importe quel développeur peut cloner. Pour les équipes qui hésitent entre construire sur des API fermées ou auto-héberger, les facteurs décisifs sont généralement la gouvernance des données, les exigences de latence, le coût total de possession et le niveau de personnalisation dont l'application a besoin.