Un LLM open-source è un grande modello linguistico i cui parametri addestrati, e spesso anche il codice di addestramento e inferenza, sono resi pubblici con una licenza che consente di scaricare, ispezionare, ottimizzare e ridistribuire il modello. L'idea segue la tradizione del software open source: condividendo il funzionamento interno di un modello, chiunque, dai singoli sviluppatori alle grandi aziende, può costruirci sopra invece di affidarsi esclusivamente ad API chiuse. In pratica, l'etichetta copre un ampio spettro, dai rilasci completamente aperti che pubblicano dati e ricette di addestramento, ai rilasci "open-weight" che condividono il modello ma mantengono dati e metodi in parte proprietari.
Come funzionano gli LLM open-source
L'addestramento di un LLM è un processo in due fasi. Innanzitutto, il modello apprende i pattern linguistici generali prevedendo il token successivo su enormi corpora di testo — questa fase si chiama pretraining. In secondo luogo, viene raffinato con feedback umano o esempi curati, in modo che le sue risposte diventino più utili: una fase nota come post-training o allineamento. In un rilascio di LLM open-source, l'artefatto più importante è il file dei pesi: un'istantanea dei miliardi (o trilioni) di parametri numerici che codificano ciò che il modello ha appreso.
Una volta pubblicati i pesi, tipicamente su un hub come Hugging Face, chiunque disponga di sufficiente memoria GPU può caricare il modello in locale, eseguire l'inferenza sul proprio hardware, ottimizzarlo su un dataset personalizzato o persino continuare il pretraining per un nuovo dominio. Un piccolo modello creato dalla community come Mistral può girare su un laptop, mentre un modello da 70 miliardi di parametri richiede più GPU di fascia alta. Poiché i pesi sono visibili, i ricercatori possono anche analizzare il modello per individuare bias, problemi di sicurezza e capacità — un'auditabilità che le API chiuse non consentono.
Perché è importante
Gli LLM open-source offrono alle organizzazioni il controllo su costi, privacy dei dati e deployment. Un ospedale, uno studio legale o un ente governativo può eseguire un modello sui propri server, così che i prompt sensibili non lascino mai la rete. Gli sviluppatori in regioni con accesso limitato alle API possono comunque creare applicazioni di IA. I ricercatori possono studiare come si comportano i modelli e riprodurre risultati pubblicati, il che rafforza la scienza della sicurezza dell'IA.
I rilasci aperti creano anche pressione competitiva sui fornitori chiusi, accelerano l'innovazione permettendo alle community di mettere in comune i miglioramenti e riducono il vendor lock-in. I compromessi sono reali: i pesi aperti possono essere usati in modo improprio per disinformazione o strumenti dannosi, e il panorama delle licenze è disomogeneo — alcuni modelli "aperti" limitano l'uso commerciale o impongono clausole sui casi d'uso che si discostano dalla classica definizione di open source promossa dalla Open Source Initiative.
Esempi chiave e tipi di licenza
- Famiglia Llama di Meta — modelli open-weight di alta qualità con una licenza che consente l'uso commerciale ma include restrizioni sui casi d'uso e una clausola sui ricavi basata sulla dimensione.
- Modelli Mistral e Mixtral — rilasciati con la permissiva licenza Apache 2.0, che consente un ampio uso commerciale e derivato.
- DeepSeek, Qwen e Yi — modelli open-weight sviluppati in Cina che hanno rapidamente eguagliato le controparti occidentali nei benchmark.
- OLMo di Allen AI — un rilascio completamente aperto che include codice di addestramento, dati e strumenti di valutazione, non solo i pesi.
- Pythia e BLOOM — modelli orientati alla ricerca, pubblicati con un'ampia documentazione per studi di riproducibilità.
Lo si chiami open-source o open-weight, il cambiamento pratico è significativo: le capacità che un tempo risiedevano solo all'interno di una manciata di endpoint API ora si trovano in una directory pubblica che qualsiasi sviluppatore può clonare. Per i team che scelgono se costruire su API chiuse o auto-ospitare, i fattori decisivi sono di solito la governance dei dati, i requisiti di latenza, il costo totale di possesso e quanto personalizzazione richiede l'applicazione.