L’apprentissage profond est-il inévitablement synonyme de « boîtes noires »? On reproche souvent à ces méthodes leur absence de transparence résultant en des modèles inintelligibles. C’est un problème qui se pose tout particulièrement en physique, domaine dans lequel on cherche à modéliser les lois régissant notre Univers sous la forme d’équations compréhensibles et non pas de réseaux de neurones opaques constitués de millions de nombres.
Wassim Tenachi et Rodrigo Ibata, deux chercheurs en astrophysique à l’Observatoire Astronomique de Strasbourg, ainsi que Foivos Diakogiannis leur collaborateur du CSIRO (Organisation fédérale pour la recherche scientifique et industrielle en Australie) se sont attaqués à ce problème en créant un algorithme d’intelligence artificielle produisant des modèles physiques analytiques à partir de données scientifiques brutes. Leurs travaux sont parus le 11/12/2023 dans la revue américaine The Astrophysical Journal.
Manipuler des symboles mathématiques même élémentaires tels que l’addition ou la division peut s’avérer un défi complexe pour les réseaux de neurones. Toutefois, grâce aux progrès réalisés dans les techniques d’intelligence artificielle liées au traitement du langage et en s’appuyant sur les approches utilisées en calcul symbolique, il est désormais possible de créer des réseaux de neurones générant des équations.
Néanmoins, la quête de l’équation idéale modélisant parfaitement un jeu de données en ayant la liberté conjuguer pléthore de symboles mathématiques peut rapidement devenir un enfer combinatoire. Comme on vous l’a peut être répété mainte fois à l’école, en physique on ne peut pas “additionner des patates et des carottes”, par exemple on ne peut pas additionner une longueur et une vitesse car cela n’a pas de sens physiquement. Ces règles dites d’analyse dimensionnelle interdisent certaines combinaisons de symboles mathématiques lors de l’écriture d’une équation physique et permettent de grandement réduire l’espace combinatoire.
La méthode d’intelligence artificielle baptisée “PhySO” acronyme d’Optimisation Symbolique Physique conçue par ces chercheurs strasbourgeois et leur collaborateur australien élabore des milliers d’équations par seconde et apprend de façon autonome à formuler des équations de qualité croissante par essai erreur tout en capitalisant sur ces règles d’analyse dimensionnelle .
Cette étude à eu l’effet d’une bombe sur twitter devenant rapidement l’article scientifique le plus discuté de la semaine sur le réseau social et allant jusqu’à être partagé par le Professeur Yann Lecun, le scientifique français souvent considéré comme le père de l’intelligence artificielle moderne, et dirigeant du département d’intelligence artificielle chez Meta (ex Facebook).
Ce type d’approche pose de nombreuses questions concernant la place de l’humain dans le processus scientifique.
« L’objectif n’est pas de remplacer le physicien mais simplement de nous équiper d’un outil puissant permettant de sonder l’espace des équations répondant empiriquement à des contraintes expérimentales ou observationnelles. » souligne Wassim Tenachi, premier auteur de l’article.
Dans cette première étude, la collaboration franco-australienne s’est en effet intéressée à la formulation automatisée d’équations empiriques, s’alignant ainsi davantage sur les besoins observationnels et expérimentaux que sur les aspects plus théoriques de la physique.
Il convient de souligner l’absence de préjugés de ce type de méthode non supervisée quant à la configuration précise des équations recherchées. Ce type d’impartialité intrinsèque pourrait-il un jour conduire à une recherche scientifique plus agnostique ?
Contacts scientifiques :
- Wassim Tenachi (doctorant) wassim.tenachi@astro.unistra.fr
- Rodrigo Ibata (DR CNRS) rodrigo.ibata@astro.unistra.fr
Article: Wassim Tenachi, Rodrigo Ibata, Foivos Diakogiannis, Deep symbolic regression for physics guided by units constraints: toward the automated discovery of physical laws, ApJ (DOI: 10.3847/1538-4357/ad014c)