Il machine learning è un campo dell'informatica e una parte fondamentale dell'intelligenza artificiale, focalizzato sulla creazione di sistemi che apprendono dai dati. Invece di seguire istruzioni passo dopo passo scritte da un programmatore, un modello di machine learning identifica pattern statistici negli esempi e utilizza tali pattern per fare previsioni o prendere decisioni su dati nuovi e mai visti. Più dati pertinenti osserva, migliori tendono a essere le sue prestazioni.
Come funziona il Machine Learning
A un livello generale, il machine learning parte da un dataset di esempi — ogni esempio è solitamente composto da features (gli input) e, in molti casi, un'etichetta (l'output desiderato). Un modello, come un albero decisionale, una rete neurale o una regressione lineare, viene inizializzato con parametri casuali o predefiniti e poi addestrato confrontando ripetutamente le sue previsioni con le risposte note. Un processo di ottimizzazione, tipicamente la discesa del gradiente, regola i parametri per ridurre l'errore di previsione. L'addestramento continua finché le prestazioni del modello smettono di migliorare su un set di validazione separato.
Considera un semplice filtro antispam. Il set di addestramento contiene migliaia di email etichettate come "spam" o "non spam". Il modello impara che certe parole, schemi del mittente e strutture dei link sono correlati allo spam. Quando arriva una nuova email, il modello la valuta e la instrada di conseguenza — senza che nessuno scriva regole esplicite per ogni schema di spam.
Perché è importante
Il machine learning è il motore alla base della maggior parte delle moderne applicazioni di IA, dagli assistenti vocali e l'analisi di immagini mediche al credit scoring, alle previsioni della domanda e ai motori di raccomandazione. Eccelle in attività in cui scrivere regole codificate a mano sarebbe impraticabile perché i pattern sono troppo complessi, troppo sottili o troppo numerosi. La disciplina è anche alla base delle innovazioni nel deep learning, dove reti neurali multi-strato apprendono rappresentazioni gerarchiche che hanno fatto avanzare in modo significativo campi come la visione artificiale e l'elaborazione del linguaggio naturale. Approfondisci l'argomento nel manuale fondamentale di Mitchell e nella panoramica IBM sul machine learning.
Tipi principali
- Apprendimento supervisionato: il modello apprende da esempi etichettati, come la classificazione di immagini o la previsione dei prezzi delle case.
- Apprendimento non supervisionato: il modello trova struttura nei dati non etichettati, come la segmentazione dei clienti o il rilevamento di anomalie.
- Apprendimento per rinforzo: il modello apprende interagendo con un ambiente e ricevendo ricompense, usato nei giochi e nella robotica.
- Apprendimento semi-supervisionato e auto-supervisionato: approcci ibridi che utilizzano piccole quantità di dati etichettati insieme a grandi pool di dati non etichettati, comuni nei moderni modelli linguistici e di visione.
Il machine learning si comprende meglio come un insieme di tecniche per trasformare i dati in comportamento. La sua efficacia dipende dalla qualità e dalla quantità dei dati di addestramento, dalla scelta del modello e dall'allineamento tra l'obiettivo di apprendimento e il compito reale che è destinato a svolgere.