📖

O que é LLM de Código Aberto?

Um LLM de código aberto é um modelo de linguagem de grande dimensão disponibilizado com pesos e licenças públicos que permitem a qualquer pessoa executá-lo, inspeccioná-lo e modificá-lo. Saiba como estes modelos funcionam e porque são importantes.

Um LLM de código aberto é um modelo de linguagem de grande dimensão cujos parâmetros treinados, e frequentemente o código de treino e inferência associado, são disponibilizados ao público sob uma licença que permite descarregar, inspeccionar, ajustar e redistribuir o modelo. A ideia segue a tradição do software de código aberto: ao partilhar o funcionamento interno de um modelo, qualquer pessoa — desde programadores individuais a grandes empresas — pode construir sobre ele em vez de depender exclusivamente de APIs fechadas. Na prática, a designação abrange um vasto leque, desde lançamentos totalmente abertos que publicam dados e receitas de treino até lançamentos "open-weight" que partilham o modelo mas mantêm os dados e métodos parcialmente proprietários.

Como funcionam os LLMs de código aberto

Treinar um LLM é um processo em duas fases. Primeiro, o modelo aprende padrões gerais de linguagem ao prever o próximo token em enormes corpora de texto — a isto chama-se pré-treino. Depois, é refinado com feedback humano ou exemplos seleccionados para que as suas respostas se tornem mais úteis, uma fase conhecida como pós-treino ou alinhamento. Num lançamento de um LLM de código aberto, o artefacto mais importante é o ficheiro de pesos: um instantâneo dos milhares de milhões (ou biliões) de parâmetros numéricos que codificam aquilo que o modelo aprendeu.

Uma vez publicados os pesos, tipicamente numa plataforma como o Hugging Face, qualquer pessoa com memória GPU suficiente pode carregar o modelo localmente, executar inferência no seu próprio hardware, ajustá-lo num conjunto de dados personalizado, ou até continuar o pré-treino para um novo domínio. Um modelo pequeno criado pela comunidade como o Mistral pode correr num portátil, enquanto um modelo de 70 mil milhões de parâmetros precisa de várias GPUs de topo. Como os pesos são visíveis, os investigadores podem também analisar o modelo em busca de enviesamentos, questões de segurança e capacidades — uma auditabilidade que as APIs fechadas não permitem.

Porque é importante

Os LLMs de código aberto dão às organizações controlo sobre custo, privacidade de dados e implementação. Um hospital, um escritório de advocacia ou uma agência governamental pode correr um modelo nos seus próprios servidores para que prompts sensíveis nunca saiam da rede. Programadores em regiões com acesso limitado a APIs podem ainda assim construir aplicações de IA. Os investigadores podem estudar o comportamento dos modelos e reproduzir resultados publicados, o que reforça a ciência da segurança em IA.

Os lançamentos abertos também criam pressão competitiva sobre os fornecedores fechados, aceleram a inovação ao permitir que as comunidades juntem melhorias, e reduzem o aprisionamento tecnológico. As concessões são reais: pesos abertos podem ser mal utilizados para desinformação ou tooling prejudicial, e o panorama de licenciamento é irregular — alguns modelos "abertos" restringem o uso comercial ou impõem cláusulas de caso de uso que divergem da definição clássica de código aberto promovida pela Open Source Initiative.

Exemplos-chave e tipos de licença

  • Família Llama da Meta — modelos open-weight de alta qualidade com uma licença que permite uso comercial mas inclui restrições de caso de uso e uma cláusula de receita baseada no tamanho.
  • Modelos Mistral e Mixtral — lançados sob a licença permissiva Apache 2.0, permitindo amplo uso comercial e derivativo.
  • DeepSeek, Qwen e Yi — modelos open-weight desenvolvidos na China que rapidamente igualaram as contrapartes ocidentais nos benchmarks.
  • OLMo da Allen AI — um lançamento totalmente aberto que inclui código de treino, dados e ferramentas de avaliação, não apenas pesos.
  • Pythia e BLOOM — modelos orientados para investigação, publicados com documentação extensa para estudos de reprodutibilidade.

Quer lhe chamemos código aberto ou open-weight, a mudança prática é significativa: as capacidades que antes viviam apenas dentro de algumas APIs estão agora num directório público que qualquer programador pode clonar. Para equipas que escolhem entre construir sobre APIs fechadas ou auto-hospedar, os factores decisivos são normalmente a governação de dados, requisitos de latência, custo total de propriedade e a personalização que a aplicação exige.

Perguntas Frequentes

Is Llama truly open-source?
It depends on your definition. Meta's Llama models publish their weights and allow commercial use, but the license includes use-case restrictions and a clause for very large commercial deployments. By the strict Open Source Initiative definition, it is usually classified as "open-weight" rather than fully open-source, because not all training artifacts are released and redistribution is constrained.
What is the difference between open-source and open-weight LLMs?
Open-weight models release the trained parameters so anyone can run and fine-tune them, but may withhold training data or code. Open-source LLMs aim to release everything — weights, training code, data, and recipes — under a permissive license. The stricter the release, the easier it is for independent researchers to reproduce and audit the model.
Can I run an open-source LLM on my own computer?
Smaller open-source models in the 1B–8B parameter range can run on consumer hardware, sometimes on a laptop with sufficient RAM or a single consumer GPU. Larger models in the 30B–70B range typically need multiple high-end data-center GPUs and significant memory. Quantized versions, which store weights in lower precision, make running bigger models on modest hardware more feasible.
Why would a company choose an open-source LLM over a closed API?
Common reasons include data privacy (prompts never leave the company), predictable costs at scale, the ability to fine-tune on proprietary data, no vendor lock-in, and compliance with regulations that restrict sending data to third-party APIs. The trade-off is that the company takes on the operational burden of hosting, updating, and securing the model itself.