Cos'è l'allucinazione dell'IA?

Una voce di glossario in linguaggio semplice che spiega cosa sono le allucinazioni dell'IA, perché i modelli linguistici inventano fatti e come individuarle e ridurle.

Un'allucinazione dell'IA è una risposta sicura e fluente generata da un sistema di intelligenza artificiale che contiene informazioni fabbricate, imprecise o non verificabili presentate come fatti. Il termine si applica più comunemente ai grandi modelli linguistici (LLM) e ad altri sistemi di IA generativa, che possono produrre testi, immagini, citazioni o affermazioni numeriche che sembrano autorevoli ma non hanno alcun fondamento in dati reali. Poiché questi sistemi sono progettati per generare output plausibili anziché recuperare verità verificate, le allucinazioni sono una proprietà strutturale del loro funzionamento, non un bug occasionale.

Come funziona l'allucinazione dell'IA

I grandi modelli linguistici generano output un token alla volta, prevedendo ciò che è statisticamente probabile che venga dopo, sulla base di schemi appresi durante l'addestramento. Il modello non ha una nozione integrata di un database di fatti verificati; conosce solo quali parole e frasi tendono a seguirne altre. Quando un prompt chiede dettagli specifici come una citazione, una data o la biografia di una persona, il modello può produrre un testo che sembra avere la forma giusta di una risposta senza alcun vincolo che lo colleghi a fatti del mondo reale. Se i dati di addestramento sono scarsi su un argomento, o se la domanda è insolita, il modello di fatto riempie i vuoti con la sua migliore ipotesi.

Un esempio semplice: chiedi a un LLM il titolo e l'autore di un articolo scientifico, e potrebbe inventare un titolo dal suono realistico attribuito a un ricercatore reale che non lo ha mai scritto. Il modello non sta mentendo deliberatamente; sta facendo ciò per cui è stato addestrato, cioè produrre una continuazione probabile. La generazione aumentata da recupero (RAG), l'uso di strumenti e il decoding vincolato sono tecniche comuni utilizzate per ridurre, sebbene non eliminare, questo comportamento.

Perché è importante

Le allucinazioni sono importanti perché gli utenti trattano spesso l'output dell'IA come autorevole, specialmente quando viene presentato in un formato sicuro e curato. In ambiti come la medicina, il diritto, il giornalismo e l'ingegneria del software, una singola citazione fabbricata o un'API inventata possono causare danni reali. Ecco perché la maggior parte delle distribuzioni aziendali e in produzione abbina i modelli generativi a sistemi di recupero, livelli di fact-checking e revisione umana. Comprendere che l'allucinazione è un comportamento predefinito, piuttosto che un guasto raro, è essenziale per chiunque distribuisca o faccia affidamento su contenuti generati dall'IA.

Tipi comuni di allucinazione dell'IA

  • Allucinazione fattuale: fatti affermati con sicurezza che sono sbagliati, come statistiche, date o eventi storici inventati.
  • Citazione fabbricata: riferimenti ad articoli, lavori o URL che non esistono o che attribuiscono lavori reali all'autore sbagliato.
  • Intrinseca vs. estrinseca: un'allucinazione intrinseca contraddice il materiale sorgente fornito al modello (ad esempio, un documento fornito), mentre un'allucinazione estrinseca introduce informazioni non supportate da alcuna fonte.
  • Allucinazione di ragionamento: passaggi logici che sembrano validi ma contengono inferenze errate, come calcoli matematici dall'aspetto corretto che arrivano a una risposta sbagliata.

Le allucinazioni sono un compromesso intrinseco dell'IA generativa odierna: la stessa fluidità e flessibilità che rendono i modelli utili li rendono anche capaci di inventare false verosimili. Trattare l'output del modello come una bozza da verificare, piuttosto che come una fonte di verità finita, resta la difesa più affidabile. Gli strumenti che ancorano i modelli a documenti recuperati, impongono output strutturati o verificano le affermazioni rispetto a database affidabili possono ridurre in modo significativo il tasso di allucinazioni, ma non rimuovono la causa sottostante.

You might also like

Articoli correlati