Des réseaux de neurones pour simuler le comportement des noyaux

Publié par Redbran le 05/11/2020 à 13:00
Source: CEA IRFU
Des théoriciens du CEA, de l'Irfu à la DRF (Espace de Structure Nucléaire Théorique) et du service de physique nucléaire à la DAM, ont développé une Intelligence Artificielle (IA) permettant la prédiction des propriétés du noyau atomique. Ils ont ainsi simulé les propriétés de plus de 1800 noyaux atomiques à partir d'un algorithme entraîné sur un sous-ensemble (En mathématiques, un ensemble A est un sous-ensemble ou une partie d’un ensemble B, ou encore B est sur-ensemble de A, si tout élément du sous-ensemble A...) de seulement 210 noyaux. De plus pour la toute première fois, ces 210 noyaux sont choisis automatiquement par l'Intelligence Artificielle (L'intelligence artificielle ou informatique cognitive est la « recherche de moyens susceptibles de doter les systèmes informatiques de capacités intellectuelles...) en utilisant une approche dite d'apprentissage (L’apprentissage est l'acquisition de savoir-faire, c'est-à-dire le processus d’acquisition de pratiques, de connaissances, compétences, d'attitudes ou de...) actif. Il s'agit d'une avancée majeure en comparaison des approches précédentes qui se limitaient à la prédiction d'une seule observable (Dans le formalisme de la mécanique quantique, une opération de mesure (c'est-à-dire obtenir la valeur ou un intervalle de valeurs d'un...) (grandeur physique (La physique (du grec φυσις, la nature) est étymologiquement la « science de la nature ». Dans un sens...) mesurable, comme par exemple la masse) et dont la portée prédictive était très faible.

Les résultats obtenus sont d'une précision comparable à celle des calculs issus de l'état de l'art des techniques utilisées en physique nucléaire (La physique nucléaire est la science qui étudie non seulement le noyau atomique en tant que tel (élaboration d'un modèle théorique) mais aussi la façon dont il interagit lorsqu'une...) théorique, et cela en un temps (Le temps est un concept développé par l'être humain pour appréhender le changement dans le monde.) de calcul significativement réduit (un gain allant d'un facteur 10 à un facteur 10³ en fonction du type de résultat voulu). Les résultats ont fait l'objet (De manière générale, le mot objet (du latin objectum, 1361) désigne une entité définie dans un espace à trois dimensions, qui a une fonction précise, et qui peut être désigné par une étiquette verbale. Il est défini par...) d'une publication dans la revue Physical Review Letters, l'article figure parmi les suggestions de l'éditeur [1].

La compréhension de la structure et de la limite d'existence des noyaux atomiques est une question essentielle et difficile à traiter. Elle est pourtant nécessaire pour déterminer l'origine des éléments lourds dans notre galaxie (Une galaxie est, en cosmologie, un assemblage d'étoiles, de gaz, de poussières et de matière noire et contenant parfois un trou noir supermassif en son centre.) ainsi que pour découvrir de nouveaux éléments super-lourds. Motivée par la progression rapide de l'apprentissage automatique (L'automatique fait partie des sciences de l'ingénieur. Cette discipline traite de la modélisation, de l'analyse, de la commande et, de la régulation des...) au cours des 10 dernières années, l'étude avait pour objectif d'examiner, pour la première fois, la capacité d'une intelligence artificielle (IA) à appréhender la physique des structures nucléaires à basse énergie (Dans le sens commun l'énergie désigne tout ce qui permet d'effectuer un travail, fabriquer de la chaleur, de la lumière, de produire un mouvement.) dans son ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble), « une multitude qui peut être comprise comme un tout »,...).


Figure 1. Illustration des calculs opérés par les réseaux de neurones, de la spectroscopie nucléaire - ici représentée par un schéma des niveaux d'énergie d'excitation (E*) du noyau - aux surfaces d'énergie potentielle qui représente l'énergie du noyau en fonction de paramètres de déformation ( β et γ).

Les fonctionnelles de densité d'énergie: une approche théorique qui a fait ses preuves

Parmi les différentes approches théoriques visant à fournir une description universelle des observables nucléaires, comme la masse (Le terme masse est utilisé pour désigner deux grandeurs attachées à un corps : l'une quantifie l'inertie du corps (la masse inerte) et l'autre la contribution du corps à la force...), le rayon ou le spectre en énergie d'excitation d'un noyau, seul le cadre des fonctionnelles de densité d'énergie (EDF), est actuellement capable de fournir une description complète et précise des propriétés du noyau atomique (Le noyau atomique désigne la région située au centre d'un atome constituée de protons et de neutrons (les nucléons). La taille du noyau (10-15 m) est...). Cette approche théorique décrit les interactions entre les nucléons, c'est-à-dire les protons et neutrons composant le noyau, comme fonction de la densité du système. En particulier, les approches les plus récentes, dites EDF Multi-références (MR-EDF), fournissent des prédictions d'observables précises et universelles au détriment d'une augmentation très conséquente des temps de calculs.

Aussi, le déploiement à grande échelle (La grande échelle, aussi appelée échelle aérienne ou auto échelle, est un véhicule utilisé par les sapeurs-pompiers, et qui emporte une échelle escamotable de grande...) des EDF nucléaires est associé à un coût numérique (Une information numérique (en anglais « digital ») est une information ayant été quantifiée et échantillonnée, par opposition à une information dite...) lourd, se traduisant par des temps de calculs particulièrement conséquents (à titre d'exemple, pour calculer l'ensemble des propriétés nucléaires sur l'ensemble de la carte il faut quelques millions d'heures (L'heure est une unité de mesure  :) CPU). Un tel coût est prohibitif dans plusieurs situations, par exemple dans le cas d'une étude systématique (En sciences de la vie et en histoire naturelle, la systématique est la science qui a pour objet de dénombrer et de classer les taxons dans un certain ordre, basé sur des principes...) de la variation des observables prédites sur l'ensemble de la carte nucléaire en fonction de différentes paramétrisations de l'interaction (Une interaction est un échange d'information, d'affects ou d'énergie entre deux agents au sein d'un système. C'est une action réciproque qui suppose l'entrée en contact de sujets.) EDF (étude particulièrement importante pour des applications astrophysiques, comme l'étude de la nucléosynthèse primordiale (En 1948, l'astronome anglais Fred Hoyle développe une théorie selon laquelle les éléments chimiques se forment dans les étoiles. Cette théorie, appelée nucléosynthèse...) nécessitant le calcul de larges volumes de données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un événement, etc.) nucléaires pour plusieurs centaines d'isotopes). Ainsi, l'ajustement d'une interaction au niveau MR-EDF n'a finalement été entrepris qu'une seule fois jusqu'à présent (travail réalisé par des équipes du CEA DAM).

Pour pallier à ce problème, des approches numériques alternatives (Alternatives (titre original : Destiny Three Times) est un roman de Fritz Leiber publié en 1945.) ont été proposées, en particulier certaines faisant appel à l'IA.

Les premiers pas de l'IA pour la structure nucléaire

Dès 2006, Athanassopoulos et ses collaborateurs ont proposé d'utiliser un réseau (Un réseau informatique est un ensemble d'équipements reliés entre eux pour échanger des informations. Par analogie avec un filet (un réseau est un « petit rets »,...) de neurones simple pour prédire des tables de masses nucléaires. Cette étude initiale n'avait pas pour objectif d'être prédictive sur une large plage (La géomorphologie définit une plage comme une « accumulation sur le bord de mer de matériaux d'une taille allant des sables fins aux blocs ». La plage ne se limite donc pas aux étendues de sable fin ; on...) de la carte des noyaux. Elle ne prédisait que 10 % d'entre eux, 90 % des mesures de masses expérimentales étant utilisées pour l'entrainement du réseau neuronal. Ces prédictions étaient toutefois relativement précises avec un écart moyen à l'expérience de 950 keV (c'est à dire un écart relatif à l'expérience d'environ 1 % pour l'Oxygène (L’oxygène est un élément chimique de la famille des chalcogènes, de symbole O et de numéro atomique 8.) 16 par exemple). De plus, modulo ( En arithmétique modulaire, on parle de nombres congrus modulo n Le terme modulo peut aussi être associé à d'autres formes de congruence En informatique, le modulo (informatique) est une fonction qui au couple (a,...) la phase (Le mot phase peut avoir plusieurs significations, il employé dans plusieurs domaines et principalement en physique :) d'entrainement numériquement lourde (effectuée en quelques heures sur carte graphique/GPU), la phase de prédiction des masses inconnues (l'inférence du réseau neuronal) est bien plus rapide qu'un calcul EDF classique.

Depuis, plusieurs études ont suivi les travaux pionniers d'Athanassopoulos, mais elles présentent toutes deux points communs qui limitent considérablement leur portée, i) L'utilisation d'une grande quantité (La quantité est un terme générique de la métrologie (compte, montant) ; un scalaire, vecteur, nombre d’objets ou d’une autre manière de dénommer la...) de données pour la phase d'entrainement des réseaux de neurones (de l'ordre de 80 % des données disponibles) ii) La focalisation sur une seule observable expérimentale ( En art, il s'agit d'approches de création basées sur une remise en question des dogmes dominants tant sur le plan formel, esthétique, que sur le plan culturel et politique. En science, il s'agit...) prédite (masse ou rayon du noyau principalement). En cela, ces approches d'IA se limitent à interpoler (ou à extrapoler) certaines mesures expérimentales et ne sont donc pas compétitives par rapport aux résultats des approches EDF.


Figure 2: Spectre d'excitation de l'178Os (composé de Z = 76 protons et N = 102 neutrons) obtenu à partir des calculs IA (AI) et EDF. Le spectre expérimental (Exp.), extrait de la base de données ENSDF est également représenté.

Une nouvelle approche

Les chercheurs du CEA ont donc proposé une nouvelle approche: un algorithme qui n'apprend pas une observable mais plusieurs grandeurs intermédiaires calculées par un code EDF classique. Par exemple les grandeurs quantifiant la façon dont les noyaux répondent à des déformations ou à des vibrations. L'idée est, qu'en fournissant une représentation suffisante des divers comportements physiques possibles du noyau, on permettra à ce réseau de neurones d'apprendre une représentation complète, dépassant donc la simple interpolation de résultats expérimentaux.

Contrairement aux approches antérieures, une des exigences de cette étude était de minimiser la fraction des noyaux utilisés pour l'entrainement, en se limitant à 10 % (soit 210 noyaux) des noyaux disponibles. De plus, la constitution de cet ensemble de noyaux utilisés pour l'entrainement pose une question d'intérêt physique majeur. Quels sont les noyaux les plus importants pour retranscrire la physique nucléaire de basse énergie dans son ensemble ? Pour répondre de manière complète à cette question, une approche dite d'apprentissage actif a été développée (En géométrie, la développée d'une courbe plane est le lieu de ses centres de courbure. On peut aussi la décrire comme l'enveloppe de la famille des droites normales à la courbe.).

L'objectif de cette méthode est de déterminer automatiquement quels noyaux de l'ensemble d'entrainement fournissent le plus d'informations au réseau de neurones afin de maximiser son pouvoir prédictif. Ici, un comité de réseaux de neurones (un ensemble de réseau de neurones dont les paramètres initiaux sont tirés aléatoirement, à l'instar d'une méthode de Monte-Carlo (On appelle méthode de Monte-Carlo toute méthode visant à calculer une valeur numérique, et utilisant des procédés aléatoires, c'est-à-dire des techniques...) généralisée) est utilisé afin de construire itérativement l'un des ensembles de 210 noyaux permettant d'obtenir la meilleure prédiction sur les 90 % des noyaux restants à prédire. Ensuite on utilise cet ensemble de noyaux pour entrainer le réseau de neurones à prédire les variables physiques issues d'une théorie (Le mot théorie vient du mot grec theorein, qui signifie « contempler, observer, examiner ». Dans le langage courant, une théorie est une...) EDF. Enfin les grandeurs prédites par les réseaux sont mises en commun pour prédire l'ensemble des observables d'intérêt pour l'étude de la structure nucléaire, par exemple les énergies des premiers états excités de n'importe quel noyau, comme illustré en Figure 2.

Résultats

Pour la toute première fois, un algorithme constitué d'un comité de réseaux de neurones s'est avéré en mesure d'estimer la structure à basse énergie de tous les noyaux. Des performances remarquables sont obtenues, à savoir par exemple une valeur de l'écart moyen à l'énergie des états fondamentaux EDF de seulement 716 keV (rms) (Soit moins de 0.5 % d'erreur pour l'Osmium (L’osmium est l'élément chimique du tableau périodique dont le symbole est Os et le numéro atomique 76. Il se présente sous la...) 178). Cela pour un apprentissage sur un ensemble d'entrainement des seuls 210 noyaux automatiquement sélectionnés comme les plus représentatifs de la physique de l'ensemble de la carte nucléaire. De plus, la répartition des noyaux automatiquement sélectionnés est globalement cohérente avec l'intuition physique avec, comme on peut le voir en Figure 4, une représentation importante des noyaux légers ainsi que des noyaux proches des drip-lines. Sur cette même figure est représentée la répartition de l'erreur par rapport à la référence EDF, illustrant la qualité des résultats.

Enfin, il est important de noter qu'une fois le réseau entrainé sur l'ensemble des noyaux d'entrainement, la prédiction de l'ensemble des observables sur toute la carte ne prend que quelques millisecondes contre plusieurs centaines d'heures CPU en cas de calcul EDF direct. Il est donc à présent possible de ne réaliser que ~200 calculs EDF avant de pouvoir généraliser les résultats d'une fonctionnelle (En mathématiques, le terme fonctionnelle se réfère à certaines fonctions. Initialement, le terme désignait les fonctions qui en prennent d'autres en...) sur toute la carte tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou l'univers.) en conservant une très bonne précision par rapport à l'expérience.


Figure 3: En panel (a) les points rouges représentent les noyaux composant l'ensemble d'entrainement obtenus par apprentissage actif. En panel (b) la répartition sur la carte de l'écart moyen sur l'énergie de l'état fondamental (En physique quantique, les états fondamentaux d'un système sont les états quantiques de plus basse énergie. Tout état d'énergie supérieure à celle des états fondamentaux est un état excité.) entre l'énergie prédite par l'IA et celle servant de référence EDF.

Un futur prometteur pour les approches IA appliquées à la structure nucléaire

Ces travaux ouvrent désormais la voie à de nombreuses améliorations et utilisations d'algorithmes d'IA au service de la description théorique des noyaux atomiques. Dans un premier temps, au vu du gain conséquent du temps de calcul, il devient désormais possible d'utiliser ces algorithmes pour construire rapidement de nouvelles EDF prenant en compte un grand nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) d'observables expérimentales (masses, rayons, mais également caractéristiques de l'état fondamental et des états excités). Cette approche est particulièrement importante pour les applications astrophysiques et est d'ores (ORES, l'Opérateur des Réseaux Gaz & Électricité est le l'opérateur des réseaux de distribution d'électricité et de gaz pour les 8...) et déjà en cours d'évaluation par une collaboration franco-belge. Au-delà de ces applications directes, il devient également envisageable d'utiliser des réseaux de neurones pour fournir des points de départs de bonne qualité pour des calculs de dynamique (Le mot dynamique est souvent employé désigner ou qualifier ce qui est relatif au mouvement. Il peut être employé comme :) nucléaire, pour l'étude de la fission notamment.

Enfin, le succès de cette approche est une première preuve de principe qu'un comité de réseau de neurones est capable de coder plusieurs aspects corrélés de la déformation nucléaire. Les réseaux de neurones impliqués possèdent probablement une représentation interne (En France, ce nom désigne un médecin, un pharmacien ou un chirurgien-dentiste, à la fois en activité et en formation à...) non triviale satisfaisante de la physique du système. L'étude de cette représentation peut révéler de nouveaux concepts physiques saisis lors de l'apprentissage.

À plus grande échelle, les informations que l'on peut extraire d'un algorithme d'IA, sur la représentation d'un problème physique complexe, est une question clé à la croisée (Croisée peut désigner :) de la physique et de la théorie de la représentation.

Référence:
[1] R-D. Lasseri, D. Regnier, J-P. Ebran, and A. Penon (Sur un voilier, le penon est un brin de laine ou un ruban de tissu léger, fixé sur les voiles ou dans le gréement (souvent hauban) qui permet de visualiser la direction du vent et l'écoulement des...), Phys. Rev. Lett. 124, 162502 (2020)

Contacts:
Raphaël Lasseri
David Regnier
Cet article vous a plu ? Vous souhaitez nous soutenir ? Partagez-le sur les réseaux sociaux avec vos amis et/ou commentez-le, ceci nous encouragera à publier davantage de sujets similaires !
Page générée en 0.258 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique