Cos'è il Chain-of-Thought Prompting?

Il chain-of-thought prompting è una tecnica che chiede a un LLM di ragionare passo dopo passo prima di rispondere, aumentando l'accuratezza su problemi matematici, logici e multi-step.

HyperStore · Pubblicato il 2026-06-20

#AI glossary #chain-of-thought #LLM reasoning #prompt engineering #prompting techniques

Il chain-of-thought prompting è una tecnica di prompt engineering in cui un utente indica a un large language model di affrontare un problema un passo alla volta, esponendo il ragionamento intermedio che porta alla risposta finale. Invece di saltare direttamente a una conclusione, il modello scrive i passaggi logici in linguaggio naturale, proprio come uno studente che mostra il proprio lavoro in un compito di matematica. La tecnica è stata resa popolare da Wei et al. (2022) in Chain-of-Thought Prompting Elicits Reasoning in Large Language Models ed è diventata una pietra miliare del moderno prompt design.

Come funziona il Chain-of-Thought Prompting

L'idea di base è ingannevolmente semplice. Quando un prompt contiene uno o più esempi svolti in cui il modello dimostra una catena di ragionamento — "prima faccio X, poi calcolo Y, quindi Z" — il modello tende a imitare quella struttura sul nuovo problema. Questo è noto come chain-of-thought prompting few-shot e non richiede modifiche ai pesi del modello; cambia solo il prompt.

Una variante più recente, chiamata chain-of-thought zero-shot, è stata introdotta da Kojima et al. (2022). Funziona aggiungendo una singola frase magica come Let's think step by step a qualsiasi domanda, che da sola è sufficiente a indurre il modello a scomporre il problema. Entrambe le varianti si basano sulla stessa capacità sottostante: i modelli linguistici sufficientemente grandi hanno appreso procedure interne per l'aritmetica e la logica, e rendere esplicite queste procedure sotto forma di testo migliora misurabilmente l'accuratezza delle risposte.

Perché è importante

Il chain-of-thought prompting è importante perché attacca direttamente una delle modalità di errore più evidenti degli LLM: risposte one-shot sicure ma sbagliate su problemi multi-step. Costringendo il modello a esternalizzare il proprio ragionamento, la tecnica riduce gli errori aritmetici, migliora le prestazioni sui benchmark di commonsense e rende il comportamento del modello più facile da verificare, perché un essere umano può esaminare ogni passaggio. È ora un elemento fondamentale per metodi più avanzati come la self-consistency (campionando molte catene e votando la risposta), la ricerca tree-of-thought e le tracce di ragionamento prodotte dai moderni reasoning model.

Varianti principali

Few-shot CoT: il prompt include diversi esempi scritti manualmente che dimostrano un ragionamento passo dopo passo prima della domanda reale. Solitamente è l'approccio più affidabile per i modelli più piccoli.
Zero-shot CoT: basta aggiungere "Let's think step by step" (o un trigger simile) a qualsiasi prompt. Economico e sorprendentemente efficace su modelli capaci.
Self-consistency: campiona molte catene di pensiero indipendenti e sceglie la risposta finale più comune, scambiando potenza di calcolo con accuratezza.
Tree-of-Thought: lascia che il modello si dirami ed esplori più percorsi di ragionamento, quindi torni indietro o scarti quelli deboli — utile per puzzle e attività di pianificazione.
Tracce dei reasoning model: i modelli più recenti come quelli della serie o e DeepSeek-R1 sono addestrati esplicitamente per produrre nativamente lunghi ragionamenti chain-of-thought per impostazione predefinita.

Il chain-of-thought prompting ha trasformato il "mostra il tuo lavoro" da una regola scolastica a uno strumento potente e general-purpose per ottenere risposte più affidabili dai large language model.

Come funziona il Chain-of-Thought Prompting

Perché è importante

Varianti principali

Potrebbe interessarti anche

Cos'è il text-to-video?

Cosa sono le AI Guardrails?

Cos'è un Knowledge Graph?

Articoli correlati

Cosa sono le AI Guardrails?

Cos'è un LLM open-source?

Cos'è il Few-Shot Learning?