📖

O que é Alucinação de IA?

Uma entrada de glossário em linguagem simples que explica o que são alucinações de IA, por que os modelos de linguagem inventam factos e como detetá-las e reduzi-las.

Uma alucinação de IA é uma resposta confiante e fluente gerada por um sistema de inteligência artificial que contém informação fabricada, incorreta ou impossível de verificar, apresentada como facto. O termo é mais frequentemente aplicado a modelos de linguagem de grande dimensão (LLMs) e a outros sistemas de IA generativa, que podem produzir texto, imagens, citações ou afirmações numéricas que parecemautorizadas, mas que não têm qualquer fundamento em dados reais. Como estes sistemas foram concebidos para gerar resultados plausíveis em vez de recuperar verdades verificadas, as alucinações são uma propriedade estrutural do seu funcionamento, não uma falha ocasional.

Como funciona a alucinação de IA

Os grandes modelos de linguagem geram saída um token de cada vez, prevendo o que é estatisticamente provável a seguir, com base em padrões aprendidos durante o treino. O modelo não tem uma noção incorporada de uma base de dados de factos verificados; apenas sabe que palavras e frases tendem a seguir-se umas às outras. Quando um pedido pede detalhes específicos, como uma citação, uma data ou a biografia de uma pessoa, o modelo pode produzir texto que parece ter a forma certa de uma resposta, sem qualquer restrição que o ligue a factos do mundo real. Se os dados de treino forem escassos sobre um tema, ou se a pergunta for invulgar, o modelo preenche eficazmente as lacunas com o seu melhor palpite.

Um exemplo simples: peça a um LLM um título e autor de um artigo científico e ele pode inventar um título com som realista atribuído a um investigador real que nunca o escreveu. O modelo não está a mentir deliberadamente; está a fazer aquilo para que foi treinado, que é produzir uma continuação provável. A geração aumentada por recuperação (RAG), o uso de ferramentas e a descodificação condicionada são técnicas comuns usadas para reduzir, embora não eliminar, este comportamento.

Porque é importante

As alucinações são importantes porque os utilizadores tratam frequentemente o resultado da IA como autorizado, especialmente quando este é apresentado num formato confiante e polido. Em domínios como a medicina, o direito, o jornalismo e a engenharia de software, uma única citação fabricada ou uma API inventada podem causar danos reais. É por isso que a maioria das implementações empresariais e em produção combina modelos generativos com sistemas de recuperação, camadas de verificação de factos e revisão humana. Compreender que a alucinação é um comportamento padrão, e não uma falha rara, é essencial para qualquer pessoa que disponibilize ou dependa de conteúdo gerado por IA.

Tipos comuns de alucinação de IA

  • Alucinação factual: factos afirmados com confiança que estão errados, como estatísticas, datas ou eventos históricos inventados.
  • Citação fabricada: referências a artigos, trabalhos ou URLs que não existem, ou que atribuem trabalho real ao autor errado.
  • Intrínseca vs. extrínseca: uma alucinação intrínseca contradiz o material de origem fornecido ao modelo (por exemplo, um documento fornecido), enquanto uma alucinação extrínseca introduz informação não suportada por qualquer fonte.
  • Alucinação de raciocínio: passos lógicos que parecem válidos, mas contêm inferências erradas, como matemática com aspeto correto que chega a uma resposta errada.

As alucinações são uma compensação inerente da IA generativa atual: a mesma fluência e flexibilidade que tornam os modelos úteis também os tornam capazes de inventar falsidades plausíveis. Tratar o resultado do modelo como um rascunho a verificar, e não como uma fonte de verdade acabada, continua a ser a defesa mais fiável. Ferramentas que fundamentam os modelos em documentos recuperados, impõem saídas estruturadas ou verificam afirmações em bases de dados fidedignas podem reduzir significativamente a taxa de alucinações, mas não eliminam a causa subjacente.

Perguntas Frequentes

Can AI hallucinations be completely eliminated?
No. Hallucinations are a consequence of how generative models predict likely text rather than look up verified facts. Techniques like retrieval-augmented generation, grounding, and constrained decoding reduce how often they occur, but no current method eliminates them entirely. Human review remains important for high-stakes use cases.
Are hallucinations the same as lies?
Not really. A lie implies intent to deceive. AI models do not have beliefs or intentions; they generate statistically likely continuations. When a model produces a false statement, it is performing pattern matching, not deliberately misleading the user. That is why framing hallucination as a technical limitation, not a moral failure of the AI, is more accurate.
Which AI models hallucinate the most?
Hallucination rates vary by model, task, and prompt. Smaller or older models tend to hallucinate more because they have less coverage of the world in their training data. Even frontier models hallucinate on niche topics, edge cases, and when asked for precise citations. There is no single authoritative benchmark, but independent evaluations like the Vectara HHEM Leaderboard publish comparative hallucination scores for popular LLMs.
How can users spot an AI hallucination?
Verify any specific claim, especially names, numbers, dates, and citations, against a trusted independent source. Be cautious when a response is unusually confident about an obscure fact, when citations look plausible but cannot be found online, or when the model hedges strangely. Cross-checking with retrieval-based tools or asking the model to show its sources can help, but the most reliable safeguard is still human verification.