Nouveau[{ » attribute= » »>Columbia University AI program observed physical phenomena and uncovered relevant variables—a necessary precursor to any physics theory. But the variables it discovered were unexpected.
Energy, Mass, Velocity. These three variables make up Einstein’s iconic equation E=MC2. But how did Albert Einstein know about these concepts in the first place? Before understanding physics you need to identify relevant variables. Not even Einstein could discover relativity without the concepts of energy, mass, and velocity. But can variables like these be discovered automatically? Doing so would greatly accelerate scientific discovery.
This is the question that Columbia Engineering researchers posed to a new artificial intelligence program. The AI program was designed to observe physical phenomena through a video camera and then try to search for the minimal set of fundamental variables that fully describe the observed dynamics. The study was published in the journal Nature Computational Science on July 25.
L’image montre un système dynamique chaotique se balançant en mouvement. Notre travail vise à identifier et extraire les variables d’état minimales nécessaires pour décrire un tel système directement à partir de séquences vidéo de grande dimension. Crédit : Yinuo Qin / Columbia Engineering
Les scientifiques ont commencé à alimenter le système en séquences vidéo brutes de phénomènes physiques dont ils connaissaient déjà la solution. Par exemple, ils ont alimenté une bande vidéo d’un double pendule oscillant connu pour avoir exactement quatre « variables d’état » – l’angle et la vitesse angulaire de chacun des bras. Après plusieurs heures d’analyse, l’IA a sorti sa réponse : 4.7.
« Nous pensions que cette réponse était assez proche », a déclaré Hood Lipson, directeur du Creative Machines Laboratory du Département de génie mécanique, où le travail a été principalement effectué. « D’autant plus que toute l’IA pouvait accéder à des séquences vidéo brutes, sans aucune connaissance en physique ou en ingénierie. Mais nous voulions savoir quelles étaient réellement les variables, pas seulement combien. »
Ensuite, les chercheurs ont entrepris de visualiser les variables réelles que le programme avait identifiées. L’extraction des variables elles-mêmes était difficile car le programme ne pouvait pas les décrire d’une manière intuitive compréhensible par les humains. Après quelques recherches, il s’avère que deux des variables choisies par le programme correspondent vaguement aux angles des bras, mais les deux autres variables restent un mystère.
« Nous avons essayé de relier les autres variables à tout ce à quoi nous pouvions penser : vitesses angulaires et linéaires, énergie cinétique et potentielle, diverses combinaisons de quantités connues », a expliqué Boyuan Chen PhD ’22, maintenant professeur adjoint à l’Université Duke. « Mais il semble que rien ne corresponde tout à fait. » L’équipe était convaincue que l’IA avait trouvé un ensemble valide de quatre variables, car elle faisait de bonnes prédictions, « mais nous ne comprenions pas encore le langage mathématique qu’elle parlait », a-t-il expliqué.
Boyuan Chen explique comment un nouveau programme d’intelligence artificielle a observé des phénomènes physiques et révélé des variables connexes – un précurseur nécessaire à toute théorie physique. Crédit : Boyuan Chen / Columbia Engineering
Après avoir validé un certain nombre d’autres systèmes physiques avec des solutions connues, les scientifiques ont inséré des vidéos de systèmes dont ils ne connaissaient pas la réponse explicite. L’une de ces vidéos montrait un « danseur de l’air » se balançant devant un parc de voitures d’occasion local. Après plusieurs heures d’analyse, le programme a retourné 8 variables. De même, une vidéo de la lampe Lava 8 a produit huit variantes. Lorsqu’ils ont présenté une vidéo des flammes de l’épisode Holiday Fireplace, le programme a ramené 24 variables.
Une question particulièrement intéressante était de savoir si l’ensemble de variables était unique à chaque système ou si un ensemble différent était produit à chaque redémarrage du programme. « Je me suis toujours demandé si jamais nous rencontrions une race extraterrestre intelligente, découvriraient-ils les mêmes lois de la physique que nous, ou décriraient-ils l’univers différemment? » dit Lipson. « Peut-être que certains phénomènes semblent vaguement complexes parce que nous essayons de les comprendre en utilisant le mauvais ensemble de variables. »
Dans les expériences, le nombre de variables était le même à chaque redémarrage de l’IA, mais les variables spécifiques étaient différentes à chaque fois. Alors oui, il existe bel et bien des manières alternatives de décrire l’univers et il est fort probable que nos choix ne soient pas parfaits.
Selon les chercheurs, ce type d’IA pourrait aider les scientifiques à découvrir des phénomènes complexes dont la compréhension théorique ne correspond pas à la grande quantité de données – des domaines allant de la biologie à la cosmologie. « Bien que nous ayons utilisé des données vidéo dans ce travail, n’importe quel type de source de données de tableau peut être utilisé – des tableaux radar ou[{ » attribute= » »>DNA arrays, for example,” explained Kuang Huang PhD ’22, who coauthored the paper.
The work is part of Lipson and Fu Foundation Professor of Mathematics Qiang Du’s decades-long interest in creating algorithms that can distill data into scientific laws. Past software systems, such as Lipson and Michael Schmidt’s Eureqa software, could distill freeform physical laws from experimental data, but only if the variables were identified in advance. But what if the variables are yet unknown?
Hod Lipson explique comment le programme d’IA a pu découvrir de nouvelles variables physiques. Crédit : Hod Lipson/Columbia Engineering
Lipson, qui est également professeur d’innovation James et Sally Scapa, soutient que les scientifiques peuvent mal interpréter ou ne pas comprendre de nombreux phénomènes simplement parce qu’ils ne disposent pas d’un bon ensemble de variables pour décrire le phénomène. Lipson a noté: « Depuis des milliers d’années, les gens savent que les objets se déplacent rapidement ou lentement, mais ce n’est que lorsque le concept de vitesse et d’accélération a été formellement défini que Newton a découvert sa fameuse loi du mouvement F = MA. » Les variables décrivant la température et la pression doivent être identifiées avant que les lois de la thermodynamique puissent être formulées, et ainsi de suite dans tous les coins du monde scientifique. Les variables sont un précurseur de toute théorie. « Quelles autres lois manquons-nous simplement parce que nous n’avons pas les variables? » a demandé Doe, qui a co-dirigé le travail.
L’article a également été co-écrit par Sunand Raghupathi et Ishaan Chandratreya, qui ont aidé à collecter des données pour les essais. Depuis le 1er juillet 2022, Boyuan Chen est professeur adjoint à l’Université Duke. Le travail fait partie d’un joint[{ » attribute= » »>University of Washington, Columbia, and Harvard NSF AI institute for dynamical systems, aimed to accelerate scientific discovery using AI.
Reference: “Automated discovery of fundamental variables hidden in experimental data” by Boyuan Chen, Kuang Huang, Sunand Raghupathi, Ishaan Chandratreya, Qiang Du and Hod Lipson, 25 July 2022, Nature Computational Science.
DOI: 10.1038/s43588-022-00281-6