Um LLM de código aberto é um modelo de linguagem de grande dimensão cujos parâmetros treinados, e frequentemente o código de treino e inferência associado, são disponibilizados ao público sob uma licença que permite descarregar, inspeccionar, ajustar e redistribuir o modelo. A ideia segue a tradição do software de código aberto: ao partilhar o funcionamento interno de um modelo, qualquer pessoa — desde programadores individuais a grandes empresas — pode construir sobre ele em vez de depender exclusivamente de APIs fechadas. Na prática, a designação abrange um vasto leque, desde lançamentos totalmente abertos que publicam dados e receitas de treino até lançamentos "open-weight" que partilham o modelo mas mantêm os dados e métodos parcialmente proprietários.
Como funcionam os LLMs de código aberto
Treinar um LLM é um processo em duas fases. Primeiro, o modelo aprende padrões gerais de linguagem ao prever o próximo token em enormes corpora de texto — a isto chama-se pré-treino. Depois, é refinado com feedback humano ou exemplos seleccionados para que as suas respostas se tornem mais úteis, uma fase conhecida como pós-treino ou alinhamento. Num lançamento de um LLM de código aberto, o artefacto mais importante é o ficheiro de pesos: um instantâneo dos milhares de milhões (ou biliões) de parâmetros numéricos que codificam aquilo que o modelo aprendeu.
Uma vez publicados os pesos, tipicamente numa plataforma como o Hugging Face, qualquer pessoa com memória GPU suficiente pode carregar o modelo localmente, executar inferência no seu próprio hardware, ajustá-lo num conjunto de dados personalizado, ou até continuar o pré-treino para um novo domínio. Um modelo pequeno criado pela comunidade como o Mistral pode correr num portátil, enquanto um modelo de 70 mil milhões de parâmetros precisa de várias GPUs de topo. Como os pesos são visíveis, os investigadores podem também analisar o modelo em busca de enviesamentos, questões de segurança e capacidades — uma auditabilidade que as APIs fechadas não permitem.
Porque é importante
Os LLMs de código aberto dão às organizações controlo sobre custo, privacidade de dados e implementação. Um hospital, um escritório de advocacia ou uma agência governamental pode correr um modelo nos seus próprios servidores para que prompts sensíveis nunca saiam da rede. Programadores em regiões com acesso limitado a APIs podem ainda assim construir aplicações de IA. Os investigadores podem estudar o comportamento dos modelos e reproduzir resultados publicados, o que reforça a ciência da segurança em IA.
Os lançamentos abertos também criam pressão competitiva sobre os fornecedores fechados, aceleram a inovação ao permitir que as comunidades juntem melhorias, e reduzem o aprisionamento tecnológico. As concessões são reais: pesos abertos podem ser mal utilizados para desinformação ou tooling prejudicial, e o panorama de licenciamento é irregular — alguns modelos "abertos" restringem o uso comercial ou impõem cláusulas de caso de uso que divergem da definição clássica de código aberto promovida pela Open Source Initiative.
Exemplos-chave e tipos de licença
- Família Llama da Meta — modelos open-weight de alta qualidade com uma licença que permite uso comercial mas inclui restrições de caso de uso e uma cláusula de receita baseada no tamanho.
- Modelos Mistral e Mixtral — lançados sob a licença permissiva Apache 2.0, permitindo amplo uso comercial e derivativo.
- DeepSeek, Qwen e Yi — modelos open-weight desenvolvidos na China que rapidamente igualaram as contrapartes ocidentais nos benchmarks.
- OLMo da Allen AI — um lançamento totalmente aberto que inclui código de treino, dados e ferramentas de avaliação, não apenas pesos.
- Pythia e BLOOM — modelos orientados para investigação, publicados com documentação extensa para estudos de reprodutibilidade.
Quer lhe chamemos código aberto ou open-weight, a mudança prática é significativa: as capacidades que antes viviam apenas dentro de algumas APIs estão agora num directório público que qualquer programador pode clonar. Para equipas que escolhem entre construir sobre APIs fechadas ou auto-hospedar, os factores decisivos são normalmente a governação de dados, requisitos de latência, custo total de propriedade e a personalização que a aplicação exige.