Che cos'è una rete neurale?

Una spiegazione chiara e adatta ai principianti di cosa sia una rete neurale, come funziona e perché è alla base dell'IA moderna.

Una rete neurale è un tipo di modello di apprendimento automatico composto da strati di semplici unità computazionali, chiamate neuroni o nodi, collegate tra loro con forze regolabili dette pesi. Ogni neurone riceve numeri in ingresso, li moltiplica per i pesi, aggiunge un bias e passa il risultato attraverso una funzione non lineare. Impilando molti di questi strati, una rete neurale può imparare a mappare input complessi, come pixel, parole o forme d'onda audio, in output come etichette di classe, frasi tradotte o immagini generate.

Come funziona una rete neurale

Durante l'addestramento, alla rete vengono forniti esempi (ad esempio, migliaia di foto etichettate come "gatto" o "cane") e produce una previsione. Una funzione di perdita misura quanto è sbagliata quella previsione, e un algoritmo chiamato backpropagation calcola quanto ciascun peso nella rete abbia contribuito all'errore. Un ottimizzatore, tipicamente una variante del gradient descent, sposta quindi leggermente ogni peso per ridurre l'errore. Ripetendo questo processo su molti esempi, i pesi della rete si assestano su valori che colgono utili regolarità statistiche nei dati.

La profondità di una rete è importante: i primi strati tendono a imparare caratteristiche semplici come bordi o tratti di lettere, mentre gli strati più profondi combinano tali caratteristiche in concetti più ricchi come forme, parole o oggetti. Questa gerarchia di rappresentazioni è ciò che rende le reti neurali profonde così efficaci nei compiti di tipo percettivo. Una panoramica molto citata dell'architettura e dell'algoritmo di apprendimento è disponibile nella rassegna sul deep learning di LeCun, Bengio e Hinton pubblicata su Nature nel 2015.

Perché è importante

Le reti neurali sono alla base della maggior parte delle capacità di IA che sono diventate mainstream negli anni 2020, tra cui la classificazione delle immagini, il riconoscimento vocale, la traduzione automatica, i sistemi di raccomandazione e i modelli linguistici di grandi dimensioni come i modelli che alimentano gli assistenti conversazionali. Eccellono in problemi in cui le regole scritte a mano sono fragili ma esistono grandi quantità di dati etichettati o non etichettati, perché la stessa architettura può essere riaddestrata per nuovi domini con relativamente poche modifiche al codice.

Tipi principali

  • Rete neurale feedforward (FNN): la forma più semplice; i segnali si muovono in una sola direzione, dall'input all'output. Un perceptron multistrato è l'esempio canonico.
  • Rete neurale convoluzionale (CNN): usa filtri a pesi condivisi, ideale per immagini e video.
  • Rete neurale ricorrente (RNN): presenta cicli che mantengono una memoria dei passi precedenti, adatta a sequenze come testo o dati sensoriali; in gran parte soppiantata dai transformer per il linguaggio.
  • Transformer: un'architettura moderna basata sull'attenzione anziché sulla ricorrenza. È la spina dorsale degli attuali modelli linguistici di grandi dimensioni e di molti sistemi di visione.
  • Rete generativa avversaria (GAN): abbina un generatore a un discriminatore che impara a distinguere i campioni reali da quelli falsi, usata per la sintesi di immagini.

Ogni variante riorganizza o specializza la ricetta di base di neuroni e pesi per adattarla a un particolare tipo di dati, ma il principio sottostante — apprendere i pesi tramite gradient descent su una perdita — resta lo stesso.

You might also like

Articoli correlati