Le deep learning est une branche du machine learning qui entraîne des réseaux de neurones comportant de nombreuses couches pour découvrir automatiquement des motifs dans les données. Chaque couche successive transforme son entrée en une représentation légèrement plus abstraite, si bien qu'un réseau profond peut construire des caractéristiques riches et hiérarchiques directement à partir d'exemples bruts comme des pixels, des échantillons audio ou des jetons de texte. Cette capacité à apprendre des représentations de bout en bout est ce qui distingue le deep learning des anciennes approches de machine learning qui reposaient sur des caractéristiques conçues à la main.
Comment fonctionne le deep learning
Un réseau de neurones est composé de couches d'unités de calcul simples appelées neurones, reliées par des poids qui déterminent avec quelle force une unité en influence une autre. Pendant l'entraînement, le réseau traite un grand nombre d'exemples étiquetés, et un algorithme appelé rétropropagation mesure l'erreur à la sortie et la propage à travers les couches pour ajuster les poids. Répéter ce processus sur de nombreux exemples affine progressivement le réseau afin que ses prédictions correspondent aux cibles d'entraînement.
Par exemple, un réseau profond entraîné sur des photos de chats et de chiens apprend d'abord à détecter les contours et les gradients de couleur dans ses premières couches, puis les assemble en textures, puis en parties comme les oreilles et les yeux, et enfin en une classification fiable de l'animal entier. Comme la même procédure d'apprentissage fonctionne pour les images, l'audio et le texte, le deep learning est devenu un outil polyvalent pour la reconnaissance de motifs.
Pourquoi c'est important
Le deep learning est le fondement de la plupart des capacités d'IA avec lesquelles les utilisateurs interagissent aujourd'hui, des assistants vocaux et de la traduction automatique à l'imagerie médicale et aux systèmes de perception des véhicules autonomes. Il a établi à plusieurs reprises de nouveaux records de précision sur des tâches considérées comme extrêmement difficiles il y a dix ans, en particulier lorsqu'il est entraîné sur de grands jeux de données avec une puissance de calcul importante. Pour les entreprises et les développeurs, le deep learning offre un paradigme unique qui peut être adapté à de nombreux domaines sans avoir à repenser l'algorithme sous-jacent.
Principaux types de réseaux de neurones profonds
- Réseaux à propagation avant (MLP) : la forme la plus simple, où les données circulent dans une seule direction, de l'entrée vers la sortie ; utiles pour les données tabulaires et comme briques de base pour des modèles plus grands.
- Réseaux de neurones convolutifs (CNN) : spécialisés dans les données en grille comme les images et la vidéo, à l'aide de filtres partagés pour détecter des motifs locaux.
- Réseaux de neurones récurrents (RNN) et LSTM : conçus pour les données séquentielles comme la parole et les séries temporelles, avec des connexions qui bouclent dans le temps.
- Transformers : l'architecture dominante pour le langage et de nombreuses autres modalités, qui utilisent un mécanisme d'attention pour pondérer l'importance de chaque élément d'une séquence par rapport à chaque autre élément.
Les grands modèles de langage modernes comme les familles GPT et Claude sont des réseaux transformer profonds comportant de dizaines à des centaines de milliards de paramètres, entraînés sur de vastes corpus textuels et ajustés pour suivre des instructions. Les mêmes idées de base s'appliquent aussi bien aux petits modèles de recherche qu'aux systèmes de pointe, ce qui explique pourquoi le deep learning reste la technique centrale du développement de l'IA contemporaine.