Le machine learning (ou apprentissage automatique) est un domaine de l'informatique, et un pilier de l'intelligence artificielle, qui consiste à construire des systèmes capables d'apprendre à partir de données. Au lieu de suivre des instructions étape par étape écrites par un programmeur, un modèle de machine learning identifie des motifs statistiques dans des exemples et utilise ces motifs pour faire des prédictions ou prendre des décisions sur de nouvelles données, jamais vues auparavant. Plus il dispose de données pertinentes, meilleurs sont généralement ses résultats.
Comment fonctionne le machine learning
Vue de haut, le machine learning commence par un jeu de données composé d'exemples — chaque exemple comportant généralement des caractéristiques (les entrées) et, dans de nombreux cas, une étiquette (la sortie souhaitée). Un modèle, tel qu'un arbre de décision, un réseau de neurones ou une régression linéaire, est initialisé avec des paramètres aléatoires ou par défaut, puis entraîné en comparant à plusieurs reprises ses prédictions aux réponses connues. Un processus d'optimisation, généralement la descente de gradient, ajuste les paramètres pour réduire l'erreur de prédiction. L'entraînement se poursuit jusqu'à ce que les performances du modèle cessent de s'améliorer sur un jeu de validation mis de côté.
Prenons l'exemple simple d'un filtre anti-spam. Le jeu d'entraînement contient des milliers d'e-mails étiquetés « spam » ou « non spam ». Le modèle apprend que certains mots, schémas d'expéditeur et structures de liens sont corrélés au spam. Lorsqu'un nouvel e-mail arrive, le modèle l'évalue et le route en conséquence — sans que personne n'ait à écrire de règles explicites pour chaque motif de spam.
Pourquoi c'est important
Le machine learning est le moteur de la plupart des applications modernes d'IA, des assistants vocaux et de l'analyse d'images médicales au scoring de crédit, en passant par la prévision de la demande et les moteurs de recommandation. Il excelle dans les tâches où il serait peu pratique d'écrire des règles codées à la main, car les motifs sont trop complexes, trop subtils ou trop nombreux. La discipline sous-tend également les avancées majeures du deep learning (apprentissage profond), où des réseaux de neurones multicouches apprennent des représentations hiérarchiques qui ont fait progresser de façon spectaculaire des domaines comme la vision par ordinateur et le traitement automatique du langage naturel. Pour approfondir le sujet, consultez le manuel fondateur de Mitchell ainsi que le tour d'horizon du machine learning proposé par IBM.
Principaux types
- Apprentissage supervisé : le modèle apprend à partir d'exemples étiquetés, comme la classification d'images ou la prédiction de prix immobiliers.
- Apprentissage non supervisé : le modèle identifie des structures dans des données non étiquetées, comme la segmentation client ou la détection d'anomalies.
- Apprentissage par renforcement : le modèle apprend en interagissant avec un environnement et en recevant des récompenses, utilisé dans les jeux et la robotique.
- Apprentissage semi-supervisé et auto-supervisé : des approches hybrides qui combinent de petites quantités de données étiquetées avec de grands volumes de données non étiquetées, fréquentes dans les modèles modernes de langage et de vision.
Le machine learning se comprend avant tout comme un ensemble de techniques permettant de transformer des données en comportements. Son efficacité dépend de la qualité et de la quantité des données d'entraînement, du choix du modèle, et de l'alignement entre l'objectif d'apprentissage et la tâche réelle qu'il est censé servir.