Uma alucinação de IA é uma resposta confiante e fluente gerada por um sistema de inteligência artificial que contém informação fabricada, incorreta ou impossível de verificar, apresentada como facto. O termo é mais frequentemente aplicado a modelos de linguagem de grande dimensão (LLMs) e a outros sistemas de IA generativa, que podem produzir texto, imagens, citações ou afirmações numéricas que parecemautorizadas, mas que não têm qualquer fundamento em dados reais. Como estes sistemas foram concebidos para gerar resultados plausíveis em vez de recuperar verdades verificadas, as alucinações são uma propriedade estrutural do seu funcionamento, não uma falha ocasional.
Como funciona a alucinação de IA
Os grandes modelos de linguagem geram saída um token de cada vez, prevendo o que é estatisticamente provável a seguir, com base em padrões aprendidos durante o treino. O modelo não tem uma noção incorporada de uma base de dados de factos verificados; apenas sabe que palavras e frases tendem a seguir-se umas às outras. Quando um pedido pede detalhes específicos, como uma citação, uma data ou a biografia de uma pessoa, o modelo pode produzir texto que parece ter a forma certa de uma resposta, sem qualquer restrição que o ligue a factos do mundo real. Se os dados de treino forem escassos sobre um tema, ou se a pergunta for invulgar, o modelo preenche eficazmente as lacunas com o seu melhor palpite.
Um exemplo simples: peça a um LLM um título e autor de um artigo científico e ele pode inventar um título com som realista atribuído a um investigador real que nunca o escreveu. O modelo não está a mentir deliberadamente; está a fazer aquilo para que foi treinado, que é produzir uma continuação provável. A geração aumentada por recuperação (RAG), o uso de ferramentas e a descodificação condicionada são técnicas comuns usadas para reduzir, embora não eliminar, este comportamento.
Porque é importante
As alucinações são importantes porque os utilizadores tratam frequentemente o resultado da IA como autorizado, especialmente quando este é apresentado num formato confiante e polido. Em domínios como a medicina, o direito, o jornalismo e a engenharia de software, uma única citação fabricada ou uma API inventada podem causar danos reais. É por isso que a maioria das implementações empresariais e em produção combina modelos generativos com sistemas de recuperação, camadas de verificação de factos e revisão humana. Compreender que a alucinação é um comportamento padrão, e não uma falha rara, é essencial para qualquer pessoa que disponibilize ou dependa de conteúdo gerado por IA.
Tipos comuns de alucinação de IA
- Alucinação factual: factos afirmados com confiança que estão errados, como estatísticas, datas ou eventos históricos inventados.
- Citação fabricada: referências a artigos, trabalhos ou URLs que não existem, ou que atribuem trabalho real ao autor errado.
- Intrínseca vs. extrínseca: uma alucinação intrínseca contradiz o material de origem fornecido ao modelo (por exemplo, um documento fornecido), enquanto uma alucinação extrínseca introduz informação não suportada por qualquer fonte.
- Alucinação de raciocínio: passos lógicos que parecem válidos, mas contêm inferências erradas, como matemática com aspeto correto que chega a uma resposta errada.
As alucinações são uma compensação inerente da IA generativa atual: a mesma fluência e flexibilidade que tornam os modelos úteis também os tornam capazes de inventar falsidades plausíveis. Tratar o resultado do modelo como um rascunho a verificar, e não como uma fonte de verdade acabada, continua a ser a defesa mais fiável. Ferramentas que fundamentam os modelos em documentos recuperados, impõem saídas estruturadas ou verificam afirmações em bases de dados fidedignas podem reduzir significativamente a taxa de alucinações, mas não eliminam a causa subjacente.