Un nouveau système de stockage de données enlève une épine du pied des supercalculateurs exascale
Publié par Redbran le 25/02/2019 à 14:00
Source: © Union européenne, [2019] / CORDIS

SAGE Prototype in Juelich Supercomputing Center
Les supercalculateurs exascale traitent jusqu'à 1 000 téraoctets (To) de données par jour, bien qu'il faille des heures pour les transférer vers le processeur. Une innovation de l'UE se débarrasse de ce goulot d'étranglement.

Les supercalculateurs sont des machines dotées de nombreux processeurs (à l'heure (L'heure est une unité de mesure  :) actuelle, des milliers) qui fonctionnent en parallèle pour atteindre des fréquences de calcul surpassant largement les ordinateurs classiques. Ceux de la dernière génération sont connus sous le nom de supercalculateurs exascale.

Dépassant, par définition (Une définition est un discours qui dit ce qu'est une chose ou ce que signifie un nom. D'où la division entre les définitions réelles et les définitions nominales.), un milliard (Un milliard (1 000 000 000) est l'entier naturel qui suit neuf cent quatre-vingt-dix-neuf millions neuf cent quatre-vingt-dix-neuf mille neuf cent quatre-vingt-dix-neuf (999 999 999) et précède un...) de milliards de calculs par seconde ( Seconde est le féminin de l'adjectif second, qui vient immédiatement après le premier ou qui s'ajoute à quelque chose de nature identique. La seconde est une unité de...), les machines les plus récentes ont une vitesse (On distingue :) mille fois supérieure par rapport à la meilleure dont on disposait il y a dix ans. De tels équipements sont utilisés dans les domaines de recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances scientifiques. Par extension métonymique, la recherche scientifique...) les plus exigeants en matière (La matière est la substance qui compose tout corps ayant une réalité tangible. Ses trois états les plus communs sont l'état solide,...) de puissance (Le mot puissance est employé dans plusieurs domaines avec une signification particulière :) de calcul, comme par exemple: les études météorologiques/climatiques, la génomique (La génomique est une discipline de la biologie moderne. Elle étudie le fonctionnement d'un organisme, d'un organe, d'un cancer, etc. à l'échelle du génome, et...) et les simulations du cerveau (Le cerveau est le principal organe du système nerveux central des animaux. Le cerveau traite les informations en provenance des sens, contrôle de nombreuses fonctions du corps, dont la motricité volontaire, et...) humain.

Les technologies actuelles de gestion de données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un événement, etc.) sont déjà confrontées aux exigences des supercalculateurs. Un supercalculateur classique à haute performance peut par exemple exécuter une simulation sur plus de 8 000 processeurs, produisant 25 To de données par jour (Le jour ou la journée est l'intervalle qui sépare le lever du coucher du Soleil ; c'est la période entre deux nuits, pendant laquelle les rayons du Soleil éclairent le...). Le traitement des données brutes multiplie cette quantité (La quantité est un terme générique de la métrologie (compte, montant) ; un scalaire, vecteur, nombre d’objets ou d’une autre manière de dénommer la valeur d’une...) par deux ou trois. Certaines applications doivent déjà lire des centaines de téraoctets. Désormais, avec les supercalculateurs exascale, les applications produisant des pétaoctets (1 000 To) de données seront monnaie courante.

Les ordinateurs stockent généralement les données à un certain endroit et les transfèrent à un autre endroit pour les analyser ou les traiter. Actuellement, même avec les meilleurs réseaux disponibles, le transfert de téraoctets ou de pétaoctets de données peut prendre plusieurs heures. Cela constitue un goulot d'étranglement significatif. En outre, le mouvement des données nécessite des quantités énormes d'énergie (Dans le sens commun l'énergie désigne tout ce qui permet d'effectuer un travail, fabriquer de la chaleur, de la lumière, de produire un mouvement.), de l'ordre de plusieurs centaines de mégawatts.

Se débarrasser de ce goulot d'étranglement

Le projet (Un projet est un engagement irréversible de résultat incertain, non reproductible a priori à l’identique, nécessitant le concours et...) SAGE financé par l'UE a développé un nouveau système de stockage de données capable de satisfaire les exigences de l'informatique (L´informatique - contraction d´information et automatique - est le domaine d'activité scientifique, technique et industriel en rapport avec le traitement automatique de l'information par des...) exascale. Cette innovation minimise les besoins en termes de transport (Le transport est le fait de porter quelque chose, ou quelqu'un, d'un lieu à un autre, le plus souvent en utilisant des véhicules et des voies de communications (la route, le canal...) de données.

"Au lieu de déplacer les données, notre système transfère les calculs vers le système de stockage", explique le Dr Sai Narasimhamurthy, responsable du projet. Les données peuvent être traitées directement au niveau de l'emplacement de stockage, ou à proximité de ce dernier. Les applications des supercalculateurs peuvent être intégrées à des modules d'analyse, si nécessaire.

Le système de "stockage intelligent" de SAGE permet en outre d'optimiser le stockage de données. Les données peuvent être stockées sur plusieurs niveaux, dont notamment: des disques durs conventionnels, des disques statiques à semi-conducteurs et de la mémoire non volatile (Une mémoire non volatile est une mémoire qui conserve ses données en l'absence d'alimentation électrique. On distingue les mémoires mortes (ROM),...). Chacun d'entre eux possède ses propres caractéristiques en termes de performance. Le système SAGE déplace les données vers le niveau présentant les caractéristiques de fonctionnement appropriées au bon moment. Cela améliore les performances.

Combiner ces deux aspects signifie flexibilité et polyvalence. Les applications faisant intervenir divers formats de données complexes peuvent utiliser différents types d'outils de gestion de données. Il en résulte une interface de programmation (Une interface de programmation (Application Programming Interface ou API) permet de définir la manière dont un composant informatique peut communiquer avec...) d'applications puissante et extensible, également développée (En géométrie, la développée d'une courbe plane est le lieu de ses centres de courbure. On peut aussi la décrire comme l'enveloppe de la famille...) par l'équipe SAGE.

Le prototype de démonstration

Le Dr Narasimhamurthy ajoute: "Notre prototype était “très petit”, avec une capacité de traitement inférieure à un demi-pétaoctet de données. Par ailleurs, notre logiciel (En informatique, un logiciel est un ensemble d'informations relatives à des traitements effectués automatiquement par un appareil informatique. Y sont inclus les instructions de...) n'est pas encore optimisé." Il est par conséquent irréaliste de comparer les performances des prototypes à celles de grands groupes de production. L'objectif principal de l'équipe consistait plutôt à prouver que les méthodes et les techniques fonctionnaient. C'est effectivement le cas, et elles peuvent facilement être adaptées à une gamme supérieure de matériel de stockage. L'accueil que la communauté scientifique (Un scientifique est une personne qui se consacre à l'étude d'une science ou des sciences et qui se consacre à l'étude d'un domaine avec la rigueur et les méthodes scientifiques.) a réservé au projet a été très positif.

Après cette démonstration réussie, le projet continuera dans le cadre de Sage2. Le nouveau projet continuera à développer le prototype SAGE et explorera de nouvelles façons d'utiliser le stockage en mémoire (D'une manière générale, la mémoire est le stockage de l'information. C'est aussi le souvenir d'une information.) non volatile distribuée. Il se penchera également sur les applications des supercalculateurs exascale en matière d'intelligence artificielle (L'intelligence artificielle ou informatique cognitive est la « recherche de moyens susceptibles de doter les systèmes informatiques de capacités intellectuelles comparables à celles des...) et d'apprentissage (L’apprentissage est l'acquisition de savoir-faire, c'est-à-dire le processus d’acquisition de pratiques, de connaissances, compétences, d'attitudes ou de valeurs culturelles, par l'observation, l'imitation, l'essai, la...) profond.

Le système SAGE va supprimer ou réduire considérablement les goulots d'étranglement affectant les supercalculateurs exascale, et ainsi permettre aux machines de se rapprocher de leur vitesse de fonctionnement maximale. En outre, on s'attend à ce que la consommation d'énergie soit finalement à peu près 100 fois inférieure à celle des systèmes actuels.

Le marché mondial du stockage informatique haute performance devrait atteindre 6 milliards de dollars en 2021. Le marché de l'analyse des mégadonnées et du stockage en cloud sera encore plus important. Les projets SAGE cibleront les composantes européennes de ces deux marchés.

Pour plus d'information voir: Projet SAGE
Page générée en 0.211 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique