L'intelligence artificielle booste l'astronomie des hautes énergies

Publié par Redbran le 21/10/2020 à 13:00
Source: CNRS IN2P3

Le téléescope LST-1 attendant le coucher du soleil sur La Palma. Crédits: Otger Ballester (IFAE)
Pour traiter le volume colossal de données qui sera généré par le futur observatoire d'astronomie gamma CTA un projet du LAPP, nommé GammaLearn et mené par Thomas Vuillaume, développe un algorithme d'intelligence artificielle (L'intelligence artificielle ou informatique cognitive est la « recherche de moyens susceptibles de doter les systèmes informatiques de capacités intellectuelles...). Entrainé grâce à la puissance (Le mot puissance est employé dans plusieurs domaines avec une signification particulière :) du supercalculateur Jean Zay (Jean Zay est un homme politique français, né à Orléans (Loiret) le 6 août 1904 et mort assassiné par des miliciens à Molles (Allier) le 20...), l'algorithme de deep learning pourra traiter les données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un événement, etc.) en un temps (Le temps est un concept développé par l'être humain pour appréhender le changement dans le monde.) et avec une efficacité records. L'objectif, à long terme, sera d'interpréter les évènements en temps réel pour émettre des alertes et faire converger plus rapidement les télescopes vers les sources cosmiques de signaux intéressants.

Détecter rapidement des événements parmi les centaines de gigaoctets qui seront générés chaque seconde ( Seconde est le féminin de l'adjectif second, qui vient immédiatement après le premier ou qui s'ajoute à quelque chose de nature identique. La seconde est une unité de mesure du temps. La seconde d'arc est une mesure d'angle plan. La...) par le futur observatoire Cherenkov Telescope Array (CTA), c'est le défi qu'une équipe du Laboratoire d'Annecy de Physique des Particules (La physique des particules est la branche de la physique qui étudie les constituants élémentaires de la matière et les rayonnements, ainsi que leurs interactions. On l'appelle aussi parfois physique des hautes...) (LAPP) tente de relever en faisant appel à l'intelligence artificielle.

Plus précisément, Thomas Vuillaume (physicien au LAPP-IN2P3) et Mikaël Jacquemont (doctorant, LISTIC, USMB/LAPP-IN2P3), entendent exploiter la technologie (Le mot technologie possède deux acceptions de fait :) du Deep Learning pour analyser les évènements détectés par les caméras de CTA. Leur projet (Un projet est un engagement irréversible de résultat incertain, non reproductible a priori à l’identique, nécessitant le concours et l’intégration...) se nomme GammaLearn et pour le développer ils se sont appuyés sur l'expertise du Laboratoire d'informatique (L´informatique - contraction d´information et automatique - est le domaine d'activité scientifique, technique et industriel en rapport avec le traitement automatique de l'information par des...), systèmes, traitement de l'information et de la connaissance (LISTIC)1 et Orobix, une entreprise privée d'ingénierie (L'ingénierie désigne l'ensemble des fonctions allant de la conception et des études à la responsabilité de la construction et au contrôle des équipements d'une installation technique ou industrielle.) spécialisée dans les systèmes d'intelligence artificielle.


Figure 1: Le processus d'acquisition des évènements détectés par les télescopes. La phase (Le mot phase peut avoir plusieurs significations, il employé dans plusieurs domaines et principalement en physique :) d'analyse se fait à partir de vidéos (La vidéo regroupe l'ensemble des techniques, technologie, permettant l'enregistrement ainsi que la restitution d'images animées, accompagnées ou non de son, sur un support adapté à l'électronique et non de type photochimique. Le mot...) de type "snapshot" (capture de vidéo). Crédit: R. White (MPIK)/K. Bernlohr (MPIK)/DESY.

Les objectifs de GammaLearn

L'usage (L’usage est l'action de se servir de quelque chose.) de l'intelligence artificielle se justifie à plus d'un titre pour CTA. Elle va améliorer la vitesse (On distingue :) de tri et d'interprétation du flot de données brutes qui sera enregistré par les détecteurs. Mais surtout elle va simplifier le travail d'analyse. L'algorithme sera capable d'écarter, avec une précision inégalée, les événements indésirables du bruit de fond (Dans son sens courant, le mot de bruit se rapproche de la signification principale du mot son. C'est-à-dire vibration de l'air pouvant donner lieu à la création d'une sensation auditive.) à partir de leurs images obtenues par les télescopes.

A terme, GammaLearn permettra aussi d'abaisser le seuil de détection des télescopes à basse énergie (Dans le sens commun l'énergie désigne tout ce qui permet d'effectuer un travail, fabriquer de la chaleur, de la lumière, de produire un mouvement.) et distinguera avec une plus grande précision les photons (En physique des particules, le photon est la particule élémentaire médiatrice de l'interaction électromagnétique. Autrement dit, lorsque deux particules...) gamma des autres particules cosmiques pour en déduire leurs paramètres (énergie, direction et point (Graphie) d'impact). Il pourra ensuite restaurer les données en stéréoscopie, c'est-à-dire combiner les images planes des rayons captés pour restituer les évènements en trois dimensions (Dans le sens commun, la notion de dimension renvoie à la taille ; les dimensions d'une pièce sont sa longueur, sa largeur et sa profondeur/son épaisseur, ou...).

Cependant, il y a des contraintes techniques à prendre en considération. Par exemple, GammaLearn devra travailler à partir d'images "non conventionnelles" qui ne sont pas composées de pixels carrés mais hexagonaux. En effet, les logiciels d'apprentissage (L’apprentissage est l'acquisition de savoir-faire, c'est-à-dire le processus d’acquisition de pratiques, de connaissances, compétences, d'attitudes...) profond sont habituellement conçus pour travailler à partir de pixels carrés tandis que les images produites par plusieurs caméras de CTA ont un maillage hexagonal. Un pré-traitement est donc nécessaire durant lequel il n'est pas question de perdre la moindre information de pixel (Le pixel, souvent abrégé px, est une unité de surface permettant de mesurer une image numérique. Son nom provient de la locution anglaise picture element, qui signifie « élément d'image ». ...).


Figure 2: Certaines caméras de CTA produisent des images avec des pixels hexagonaux. Leur représentation dans une matrice carrée par GammaLearn permet d'utiliser les outils standards du deep learning. Pour cela, les pixels voisins (en bleu) du pixel noyau (en rouge) sont identifiés dans une grille carrée. Ce processus, une fois déterminé, est appliqué à tous les pixels des images traitées. Crédit: LAPP/LISTIC/Orobix.

Dans un premier temps, l'équipe du LAPP a déterminé la structure du réseau (Un réseau informatique est un ensemble d'équipements reliés entre eux pour échanger des informations. Par analogie avec un filet (un réseau est un « petit...) de neurones (l'algorithme). Ils ont ensuite utilisé PyTorch, une bibliothèque open source de logiciels d'apprentissage automatique (L'automatique fait partie des sciences de l'ingénieur. Cette discipline traite de la modélisation, de l'analyse, de la commande et, de la régulation des systèmes dynamiques. Elle a pour fondements théoriques les mathématiques, la théorie du...), pour effectuer les calculs et les abstractions nécessaires pour entraîner le réseau. Mais tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou l'univers.) ceci n'était que le début du travail, car construire un algorithme n'est qu'une petite partie de l'ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble), « une multitude qui peut être comprise comme un tout », comme l'énonçait...) d'un projet d'intelligence artificielle.

Le logiciel (En informatique, un logiciel est un ensemble d'informations relatives à des traitements effectués automatiquement par un appareil informatique. Y sont...) doit ensuite apprendre à analyser, traiter et trier les images tout seul. Comme le souligne Thomas Vuillaume: "Nous utilisons un type de réseau de neurones, dit de convolution, très gourmand en calculs. Le logiciel doit répéter plusieurs fois les procédures d'analyses pour parvenir à prendre les bonnes décisions lors du tri des évènements et de la reconstruction de leurs paramètres. C'est fastidieux mais nécessaire pour optimiser notre algorithme grâce à l'apprentissage profond".

Dans le cas de GammaLearn, la puissance nécessaire à cette optimisation dépassait les ressources disponibles au Centre de Calcul de l'IN2P3 (L'Institut national de physique nucléaire et de physique des particules (IN2P3) est un institut de recherche fondamentale du CNRS dont le domaine de recherche est comme son nom l'indique la physique...), c'est pourquoi l'équipe s'est également tournée vers le supercalculateur Jean Zay pour entraîner l'algorithme et préparer le terrain aux futures analyses d'évènements cosmiques.

La contribution du supercalculateur Jean Zay

Installé sur le plateau de Saclay et inauguré en janvier 2020, le supercalculateur Jean Zay est l'un des plus puissants d'Europe (L’Europe est une région terrestre qui peut être considérée comme un continent à part entière, mais aussi comme...). Il est spécialisé dans les calculs de haute performance (HPC) et possède une partition - c'est-à-dire un système permettant de gérer les informations de manière séparée - consacrée spécifiquement à l'intelligence artificielle (IA). Il est capable d'effectuer des simulations extrêmement complexes et peut calculer 16 millions de milliards (16 pétaflops) d'opérations par seconde. Sa partie dite "convergée", un mélange (Un mélange est une association de deux ou plusieurs substances solides, liquides ou gazeuses qui n'interagissent pas chimiquement. Le résultat de l'opération est une préparation aussi appelée...) de processeurs classiques (les CPU) et de processeurs graphiques (les GPU), peut non seulement optimiser les simulations mais aussi utiliser l'IA pour aider les chercheurs à interpréter les images.

L'utilisation de Jean Zay par GammaLearn devrait se poursuivre au-delà de l'apprentissage. Ensemble ils auront la puissance suffisante pour reconstruire directement les évènements astrophysiques sans passer (Le genre Passer a été créé par le zoologiste français Mathurin Jacques Brisson (1723-1806) en 1760.) par les étapes de prétraitement, ce qui signifie que les données brutes pourront être transmises directement à l'ordinateur (Un ordinateur est une machine dotée d'une unité de traitement lui permettant d'exécuter des programmes enregistrés. C'est un ensemble de circuits...). Jean Zay sera une ressource importante avec 8000 heures (L'heure est une unité de mesure  :) de calculs attribués au projet.


Figure 3: Le supercalculateur Jean Zay du CNRS Installé sur le plateau de Saclay et inauguré en janvier 2020. Crédit: Cyril Fresillon/IDRIS/CNRS.

Les perspectives à plus long terme

A plus long terme, les scientifiques ont pour ambition d'utiliser GammaLearn pour faire des analyses en temps réel et ainsi prévenir les autres télescopes de l'observatoire de se tourner vers un événement en cours. L'intelligence artificielle pourrait même, dans ce cas, servir de système d'alerte à l'attention des autres observatoires internationaux afin qu'ils puissent braquer rapidement leurs instruments vers les sources cosmiques intéressantes. GammaLearn est un bon candidat potentiel pour ce type d'analyse. Cependant "l'algorithme doit d'abord être longuement testé", précise Thomas Vuillaume, "et sa stabilité doit être éprouvée dans de nombreuses conditions d'observations afin que nous ayons suffisamment confiance en lui pour l'utiliser dans un système critique (Un système critique est un système dont une panne peut avoir des conséquences dramatiques, tels des morts ou des blessés graves, des dommages matériels...) comme l'analyse en temps réel, où il n'y a pas de seconde chance".

En attendant, l'équipe progresse dans la connaissance de l'instrument et l'ajustement de la chaine d'analyse de l'algorithme. La collaboration espère pouvoir faire les premiers tests sur les données réelles à l'aide de GammaLearn d'ici la fin de l'année (Une année est une unité de temps exprimant la durée entre deux occurrences d'un évènement lié à la révolution de la Terre autour du Soleil.).

Bibliographie:

Jacquemont M., Vuillaume T., Benoit A., Maurin G., Lambert P. et al.:
"Multi-Task Architecture (L’architecture peut se définir comme l’art de bâtir des édifices.) with Attention for Imaging Atmospheric Cherenkov Telescope Data Analysis", papier (Le papier (du latin papyrus) est une matière fabriquée à partir de fibres cellulosiques végétales et animales. Il se présente sous forme de feuilles minces et est...) soumis pour le 25th International Conference on Pattern Recognition, en janvier 2021, Milan (Milan (en italien Milano, du latin Mediolanum, en lombard Milàn) se situe dans le nord de l'Italie. Capitale de la région de Lombardie, au centre de la plaine du...), Italie.

Jacquemont M., Vuillaume T., Benoit A., Maurin G., Lambert P., Lamanna G., Brill A. et al. :
"GammaLearn: a Deep Learning framework (En programmation informatique, un framework est un kit de composants logiciels structurels, qui définissent les fondations ainsi que les grandes lignes de l'organisation de tout ou partie d'un logiciel (architecture). En...) for IACT data", 36thInternational Cosmic Ray Conference, juillet 2019, Madison, United States (Le United States est un paquebot construit en 1952 ; il est le plus grand jamais construit aux États-Unis, et toujours le plus rapide à ce jour.).

Vuillaume T., Mikael J., Antiga, L., Benoit A., Lambert P., Maurin, G., & Silvestri G. et al.:
"GammaLearn-first steps to apply Deep Learning to the Cherenkov Telescope Array data", CHEP 2018 In EPJ Web of Conferences (Vol. 214, p. 06020). EDP Sciences.

Pour en savoir plus sur CTA et le supercalculateur Jean Zay

Sur le Cherenkov Telescope Array (CTA):
- Le Prototype LST-1 de CTA détecte une émission à très haute énergie en direction du Pulsar (Un pulsar est le nom donné à une étoile à neutrons, tournant très rapidement sur elle-même (période typique de l'ordre de la seconde, voire beaucoup moins pour les pulsars milliseconde) et émettant un fort...) du Crabe (Crabe est un nom vernaculaire ambigu utilisé en français pour désigner de nombreuses espèces de crustacés décapodes, pour la plupart comestibles. Ce terme...) (actualité du 23 juin 2020).
- Cherenkov Telescope Array, un projet en cours de construction (actualité du 16 mai 2018).
- Site internet (Internet est le réseau informatique mondial qui rend accessibles au public des services variés comme le courrier électronique, la messagerie instantanée et le World...) officiel de l'observatoire CTA

Sur le supercalculateur Jean Zay:
- Jean Zay, l'un des supercalculateurs les plus puissants d'Europe (actualité du 22 janvier 2020)

Notes:
1. LISTIC: Unité de recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances scientifiques. Par extension métonymique, la recherche scientifique désigne...) de l'Université (Une université est un établissement d'enseignement supérieur dont l'objectif est la production du savoir (recherche), sa conservation et sa...) Savoie Mont Blanc (Le blanc est la couleur d'un corps chauffé à environ 5 000 °C (voir l'article Corps noir). C'est la sensation visuelle obtenue avec un spectre lumineux...) (USMB). Leurs travaux portent sur la modélisation et le développement d'algorithmes pour extraire et gérer des connaissances notamment dans les domaines de l'observation (L’observation est l’action de suivi attentif des phénomènes, sans volonté de les modifier, à l’aide de moyens d’enquête et...) de la Terre (La Terre est la troisième planète du Système solaire par ordre de distance croissante au Soleil, et la quatrième par taille et par masse croissantes. C'est la plus grande et la plus...) et du comportement humain.


Contacts:
- Thomas Vuillaume - Physicien (Un physicien est un scientifique qui étudie le champ de la physique, c'est-à-dire la science analysant les constituants fondamentaux de l'univers et les forces qui...) - thomas.vuillaume at lapp.in2p3.fr
- Berrie Giebels - DAS Astroparticules et cosmologie (La cosmologie est la branche de l'astrophysique qui étudie l'Univers en tant que système physique.) - berrie.giebels at in2p3.fr
- Jennifer Grapin - Chargée de communication (La communication concerne aussi bien l'homme (communication intra-psychique, interpersonnelle, groupale...) que l'animal (communication intra- ou inter- espèces) ou la machine (télécommunications, nouvelles technologies...),...) - jennifer.grapin at cnrs.fr
Cet article vous a plu ? Vous souhaitez nous soutenir ? Partagez-le sur les réseaux sociaux avec vos amis et/ou commentez-le, ceci nous encouragera à publier davantage de sujets similaires !
Page générée en 0.659 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique