📖

Cos'è LLM open source?

Un LLM open-source è un grande modello linguistico rilasciato con pesi e licenze pubbliche che permettono a chiunque di eseguirlo, analizzarlo e modificarlo. Scopri come funzionano questi modelli e perché sono importanti.

Un LLM open-source è un grande modello linguistico i cui parametri addestrati, e spesso anche il codice di addestramento e inferenza, sono resi pubblici con una licenza che consente di scaricare, ispezionare, ottimizzare e ridistribuire il modello. L'idea segue la tradizione del software open source: condividendo il funzionamento interno di un modello, chiunque, dai singoli sviluppatori alle grandi aziende, può costruirci sopra invece di affidarsi esclusivamente ad API chiuse. In pratica, l'etichetta copre un ampio spettro, dai rilasci completamente aperti che pubblicano dati e ricette di addestramento, ai rilasci "open-weight" che condividono il modello ma mantengono dati e metodi in parte proprietari.

Come funzionano gli LLM open-source

L'addestramento di un LLM è un processo in due fasi. Innanzitutto, il modello apprende i pattern linguistici generali prevedendo il token successivo su enormi corpora di testo — questa fase si chiama pretraining. In secondo luogo, viene raffinato con feedback umano o esempi curati, in modo che le sue risposte diventino più utili: una fase nota come post-training o allineamento. In un rilascio di LLM open-source, l'artefatto più importante è il file dei pesi: un'istantanea dei miliardi (o trilioni) di parametri numerici che codificano ciò che il modello ha appreso.

Una volta pubblicati i pesi, tipicamente su un hub come Hugging Face, chiunque disponga di sufficiente memoria GPU può caricare il modello in locale, eseguire l'inferenza sul proprio hardware, ottimizzarlo su un dataset personalizzato o persino continuare il pretraining per un nuovo dominio. Un piccolo modello creato dalla community come Mistral può girare su un laptop, mentre un modello da 70 miliardi di parametri richiede più GPU di fascia alta. Poiché i pesi sono visibili, i ricercatori possono anche analizzare il modello per individuare bias, problemi di sicurezza e capacità — un'auditabilità che le API chiuse non consentono.

Perché è importante

Gli LLM open-source offrono alle organizzazioni il controllo su costi, privacy dei dati e deployment. Un ospedale, uno studio legale o un ente governativo può eseguire un modello sui propri server, così che i prompt sensibili non lascino mai la rete. Gli sviluppatori in regioni con accesso limitato alle API possono comunque creare applicazioni di IA. I ricercatori possono studiare come si comportano i modelli e riprodurre risultati pubblicati, il che rafforza la scienza della sicurezza dell'IA.

I rilasci aperti creano anche pressione competitiva sui fornitori chiusi, accelerano l'innovazione permettendo alle community di mettere in comune i miglioramenti e riducono il vendor lock-in. I compromessi sono reali: i pesi aperti possono essere usati in modo improprio per disinformazione o strumenti dannosi, e il panorama delle licenze è disomogeneo — alcuni modelli "aperti" limitano l'uso commerciale o impongono clausole sui casi d'uso che si discostano dalla classica definizione di open source promossa dalla Open Source Initiative.

Esempi chiave e tipi di licenza

  • Famiglia Llama di Meta — modelli open-weight di alta qualità con una licenza che consente l'uso commerciale ma include restrizioni sui casi d'uso e una clausola sui ricavi basata sulla dimensione.
  • Modelli Mistral e Mixtral — rilasciati con la permissiva licenza Apache 2.0, che consente un ampio uso commerciale e derivato.
  • DeepSeek, Qwen e Yi — modelli open-weight sviluppati in Cina che hanno rapidamente eguagliato le controparti occidentali nei benchmark.
  • OLMo di Allen AI — un rilascio completamente aperto che include codice di addestramento, dati e strumenti di valutazione, non solo i pesi.
  • Pythia e BLOOM — modelli orientati alla ricerca, pubblicati con un'ampia documentazione per studi di riproducibilità.

Lo si chiami open-source o open-weight, il cambiamento pratico è significativo: le capacità che un tempo risiedevano solo all'interno di una manciata di endpoint API ora si trovano in una directory pubblica che qualsiasi sviluppatore può clonare. Per i team che scelgono se costruire su API chiuse o auto-ospitare, i fattori decisivi sono di solito la governance dei dati, i requisiti di latenza, il costo totale di possesso e quanto personalizzazione richiede l'applicazione.

Domande frequenti

Is Llama truly open-source?
It depends on your definition. Meta's Llama models publish their weights and allow commercial use, but the license includes use-case restrictions and a clause for very large commercial deployments. By the strict Open Source Initiative definition, it is usually classified as "open-weight" rather than fully open-source, because not all training artifacts are released and redistribution is constrained.
What is the difference between open-source and open-weight LLMs?
Open-weight models release the trained parameters so anyone can run and fine-tune them, but may withhold training data or code. Open-source LLMs aim to release everything — weights, training code, data, and recipes — under a permissive license. The stricter the release, the easier it is for independent researchers to reproduce and audit the model.
Can I run an open-source LLM on my own computer?
Smaller open-source models in the 1B–8B parameter range can run on consumer hardware, sometimes on a laptop with sufficient RAM or a single consumer GPU. Larger models in the 30B–70B range typically need multiple high-end data-center GPUs and significant memory. Quantized versions, which store weights in lower precision, make running bigger models on modest hardware more feasible.
Why would a company choose an open-source LLM over a closed API?
Common reasons include data privacy (prompts never leave the company), predictable costs at scale, the ability to fine-tune on proprietary data, no vendor lock-in, and compliance with regulations that restrict sending data to third-party APIs. The trade-off is that the company takes on the operational burden of hosting, updating, and securing the model itself.