📖

Cos'è Rete neurale?

Una spiegazione chiara e adatta ai principianti di cosa sia una rete neurale, come funziona e perché è alla base dell'IA moderna.

Una rete neurale è un tipo di modello di apprendimento automatico composto da strati di semplici unità computazionali, chiamate neuroni o nodi, collegate tra loro con forze regolabili dette pesi. Ogni neurone riceve numeri in ingresso, li moltiplica per i pesi, aggiunge un bias e passa il risultato attraverso una funzione non lineare. Impilando molti di questi strati, una rete neurale può imparare a mappare input complessi, come pixel, parole o forme d'onda audio, in output come etichette di classe, frasi tradotte o immagini generate.

Come funziona una rete neurale

Durante l'addestramento, alla rete vengono forniti esempi (ad esempio, migliaia di foto etichettate come "gatto" o "cane") e produce una previsione. Una funzione di perdita misura quanto è sbagliata quella previsione, e un algoritmo chiamato backpropagation calcola quanto ciascun peso nella rete abbia contribuito all'errore. Un ottimizzatore, tipicamente una variante del gradient descent, sposta quindi leggermente ogni peso per ridurre l'errore. Ripetendo questo processo su molti esempi, i pesi della rete si assestano su valori che colgono utili regolarità statistiche nei dati.

La profondità di una rete è importante: i primi strati tendono a imparare caratteristiche semplici come bordi o tratti di lettere, mentre gli strati più profondi combinano tali caratteristiche in concetti più ricchi come forme, parole o oggetti. Questa gerarchia di rappresentazioni è ciò che rende le reti neurali profonde così efficaci nei compiti di tipo percettivo. Una panoramica molto citata dell'architettura e dell'algoritmo di apprendimento è disponibile nella rassegna sul deep learning di LeCun, Bengio e Hinton pubblicata su Nature nel 2015.

Perché è importante

Le reti neurali sono alla base della maggior parte delle capacità di IA che sono diventate mainstream negli anni 2020, tra cui la classificazione delle immagini, il riconoscimento vocale, la traduzione automatica, i sistemi di raccomandazione e i modelli linguistici di grandi dimensioni come i modelli che alimentano gli assistenti conversazionali. Eccellono in problemi in cui le regole scritte a mano sono fragili ma esistono grandi quantità di dati etichettati o non etichettati, perché la stessa architettura può essere riaddestrata per nuovi domini con relativamente poche modifiche al codice.

Tipi principali

  • Rete neurale feedforward (FNN): la forma più semplice; i segnali si muovono in una sola direzione, dall'input all'output. Un perceptron multistrato è l'esempio canonico.
  • Rete neurale convoluzionale (CNN): usa filtri a pesi condivisi, ideale per immagini e video.
  • Rete neurale ricorrente (RNN): presenta cicli che mantengono una memoria dei passi precedenti, adatta a sequenze come testo o dati sensoriali; in gran parte soppiantata dai transformer per il linguaggio.
  • Transformer: un'architettura moderna basata sull'attenzione anziché sulla ricorrenza. È la spina dorsale degli attuali modelli linguistici di grandi dimensioni e di molti sistemi di visione.
  • Rete generativa avversaria (GAN): abbina un generatore a un discriminatore che impara a distinguere i campioni reali da quelli falsi, usata per la sintesi di immagini.

Ogni variante riorganizza o specializza la ricetta di base di neuroni e pesi per adattarla a un particolare tipo di dati, ma il principio sottostante — apprendere i pesi tramite gradient descent su una perdita — resta lo stesso.

Domande frequenti

What is the difference between a neural network and deep learning?
A neural network is the underlying model: layers of weighted, interconnected neurons that transform inputs into outputs. Deep learning refers to training neural networks with many layers (typically dozens or more) so they can learn hierarchical representations. In practice, deep learning almost always means deep neural networks, but not every neural network is "deep."
Do neural networks really work like the human brain?
Only loosely. Real biological neurons fire electrochemical spikes, encode information with timing, and are embedded in complex circuitry that current artificial networks do not replicate. Neural networks borrow the high-level idea of many simple units learning from experience, but they are best understood as a mathematical function approximator optimized with gradient descent.
How much data does a neural network need to learn well?
It depends on the task, architecture, and whether you use a pre-trained model. Simple feedforward networks can converge on toy problems with hundreds of examples. State-of-the-art language and vision models are typically trained on billions of tokens or images, often using self-supervised pre-training followed by fine-tuning on smaller labeled datasets.
Can neural networks be wrong even when they are confident?
Yes. A model's predicted probability reflects patterns it has learned, not ground truth, so it can be confidently wrong on out-of-distribution inputs, adversarial examples, or rare edge cases. Calibration, evaluation on diverse test sets, and human-in-the-loop review are common ways to mitigate this.