Les sciences des données ont pour but de répondre à des questions à partir de données ayant un très grand nombre de variables, qu’il s’agisse d’images, de sons, de textes, de données génomiques, de liens dans des réseaux sociaux ou de mesures physiques. Cette multitude de variables ouvre un champ gigantesque des possibles, ce que l’on appel la malédiction de la dimensionnalité. Les algorithmes doivent faire face à cette malédiction, et extraire l’information pertinente en hiérarchisant les paramètres importants.
La performance des algorithmes d’analyse de données a fait un bond ces dernières années, non seulement grâce à l’augmentation des capacités de calcul et aux masses de données, mais aussi grâce à l’évolution rapide des algorithmes d’apprentissage, et par conséquent de l’intelligence artificielle.
L’analyse automatique des données numériques est devenue un enjeu industriel, sociétal et scientifique majeur. Les sciences des données développent des algorithmes capables d’apprendre, comme les réseaux de neurones, avec des données de grande dimension. Il est pour cela nécessaire de comprendre les principes de l’apprentissage, en faisant appel à de nombreuses branches des mathématiques dont les statistiques, l’analyse harmonique et la géométrie.
Stéphane Mallat a été professeur de mathématiques appliquées à l’université de New York, à l’École polytechnique et à l’École normale supérieure. Dans les années 2000, il a cofondé et dirigé une start-up de traitement d’images. Il est professeur au Collège de France depuis mai 2017, titulaire de la chaire « Sciences des données ».
Author(s): Stéphane Mallat
Series: Collège de France
Publisher: Fayard
Year: 2018
Language: French
Pages: 80
Page de titre......Page 2
Page de Copyright......Page 3
Table des matières......Page 4
Leçon inaugurale prononcée le jeudi 11 janvier 2018 par Stéphane Mallat, professeur......Page 5
Chapitre 1......Page 6
Modélisation, prédiction et intelligence artificielle......Page 7
Algorithmes d'apprentissage supervisé......Page 8
Généralisation et régularité......Page 11
Malédiction de la grande dimension......Page 12
Modèles parcimonieux multiéchelles......Page 13
Apprentissage supervisé et réseaux de neurones......Page 16
Régularités mathématiques en grande dimension......Page 22
Conclusion......Page 27
Références......Page 32
Les leçons inaugurales du Collège de France......Page 34
Les leçons inaugurales publiées dans la collection Collège de France / Fayard......Page 35