Repousser les limites du stockage de données grâce à l'apprentissage automatique
Publié par Adrien le 18/04/2019 à 08:00
Source: CNRS INSIS
Inscrire et relire des informations avec la plus grande densité de stockage possible est un enjeu permanent pour les données numériques. Dans ce travail, une nouvelle méthode permettant d'aller au-delà des meilleures technologies actuelles a été développée (En géométrie, la développée d'une courbe plane est le lieu de ses centres de courbure. On peut aussi la décrire comme l'enveloppe de la famille des droites normales à la courbe.) utilisant des nanostructures de silicium (Le silicium est un élément chimique de la famille des cristallogènes, de symbole Si et de numéro atomique 14.) et des réseaux de neurones artificiels.


Plusieurs bits d'information digitale sont encodés dans la géométrie (La géométrie est la partie des mathématiques qui étudie les figures de l'espace de dimension 3 (géométrie euclidienne) et, depuis le...) de nanostructures de silicium, donnant sous lumière (La lumière est l'ensemble des ondes électromagnétiques visibles par l'œil humain, c'est-à-dire comprises dans des longueurs d'onde de 380nm (violet) à 780nm (rouge). La lumière est intimement liée...) polarisée des spectres de diffusion (Dans le langage courant, le terme diffusion fait référence à une notion de « distribution », de « mise à disposition » (diffusion d'un produit, d'une...) optique (L'optique est la branche de la physique qui traite de la lumière, du rayonnement électromagnétique et de ses relations avec la vision.) uniques pour chaque séquence de bits encodée. Ces spectres, fortement bruités, peuvent néanmoins être décodés grâce à un réseau (Un réseau informatique est un ensemble d'équipements reliés entre eux pour échanger des informations. Par analogie avec un filet (un réseau est un « petit rets », c'est-à-dire un petit...) de neurones artificiels, qui a préalablement été entrainé par apprentissage (L’apprentissage est l'acquisition de savoir-faire, c'est-à-dire le processus d’acquisition de pratiques, de connaissances, compétences, d'attitudes ou...) sur des répétitions de nanostructures.
© CNRS (Le Centre national de la recherche scientifique, plus connu sous son sigle CNRS, est le plus grand organisme de recherche scientifique public français...)

Les données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un événement, etc.) digitales 0 et 1 (bits) des supports de stockage optique tels que les CD et DVD (Le DVD officiellement Digital Versatile Disc - même si d'autres dénominations sont employées - est un disque optique numérique exploité pour la sauvegarde...) sont encodées par la gravure de successions de creux et de plats sur la surface (Une surface désigne généralement la couche superficielle d'un objet. Le terme a plusieurs acceptions, parfois objet géométrique, parfois frontière physique, et est souvent abusivement confondu avec sa mesure,...) du disque (Le mot disque est employé, aussi bien en géométrie que dans la vie courante, pour désigner une forme ronde et régulière, à l'image d'un palet — discus en...). Ils sont décodés par le laser (Un laser est un appareil émettant de la lumière (rayonnement électromagnétique) amplifiée par émission stimulée. Le terme laser provient de l'acronyme anglo-américain « light...) de la tête de lecture, le signal ( Termes généraux Un signal est un message simplifié et généralement codé. Il existe sous forme d'objets ayant des formes particulières. Les signaux...) étant sensible au passage d'un creux à un plat ou réciproquement. Le faisceau laser sur la surface du disque a une taille qui est de l'ordre de la longueur (La longueur d’un objet est la distance entre ses deux extrémités les plus éloignées. Lorsque l’objet est filiforme ou en forme de lacet, sa longueur est celle de...) d'onde (Une onde est la propagation d'une perturbation produisant sur son passage une variation réversible des propriétés physiques locales. Elle transporte de l'énergie sans transporter de...) de la lumière, ce qui limite la taille minimale du "bit" et donc la capacité de stockage d'un CD ou DVD. La technologie (Le mot technologie possède deux acceptions de fait :) Blu-Ray a permis d'utiliser des longueurs d'onde bleues, plus courtes, et d'augmenter cette capacité. Aller au-delà reste un défi ouvert depuis 20 ans. Dans ce travail, des chercheurs du Centre d'élaboration de matériaux (Un matériau est une matière d'origine naturelle ou artificielle que l'homme façonne pour en faire des objets.) et d'études structurales (CEMES, CNRS) et du Laboratoire d'analyse et d'architecture (L’architecture peut se définir comme l’art de bâtir des édifices.) des systèmes (LAAS-CNRS) à Toulouse ont fabriqué des nanostructures permettant l'encodage de bits de données avec une densité (La densité ou densité relative d'un corps est le rapport de sa masse volumique à la masse volumique d'un corps pris comme référence. Le corps de référence est l'eau pure...) bien plus importante que celle de la technologie Blu-Ray et ils ont montré que le décodage pouvait se faire quasiment sans aucune erreur par lecture optique grâce à l'utilisation d'un outil (Un outil est un objet finalisé utilisé par un être vivant dans le but d'augmenter son efficacité naturelle dans l'action. Cette augmentation se traduit par la...) d'apprentissage automatique (L'automatique fait partie des sciences de l'ingénieur. Cette discipline traite de la modélisation, de l'analyse, de la commande et, de la régulation des systèmes dynamiques. Elle a pour fondements théoriques les mathématiques, la...), les réseaux de neurones artificiels.

Les nanostructures ont été réalisées dans la centrale Renatech du LAAS-CNRS par gravure du silicium après lithographie par faisceau d'électrons. Différentes séquences de creux et de plats ont été gravées au sein de plots nanométriques, encodant jusqu'à 9 bits d'information par nanostructure. Chaque structure diffuse la lumière de façon spécifique et possède ainsi une signature optique unique aux longueurs d'onde de la lumière visible (La lumière visible, appelée aussi spectre visible ou spectre optique est la partie du spectre électromagnétique qui est visible pour l'œil humain.). Néanmoins, une lecture fiable de cette signature par une analyse optique traditionnelle est très difficile en raison de la sensibilité du signal aux petites variations de fabrication et au bruit (Dans son sens courant, le mot de bruit se rapproche de la signification principale du mot son. C'est-à-dire vibration de l'air pouvant donner lieu à la création d'une sensation auditive.) de la détection. Pour pallier ce problème, les chercheurs ont utilisé une méthode d'analyse totalement différente (En mathématiques, la différente est définie en théorie algébrique des nombres pour mesurer l'éventuel défaut de...), qui mime de façon simplifiée le fonctionnement des neurones du cerveau (Le cerveau est le principal organe du système nerveux central des animaux. Le cerveau traite les informations en provenance des sens, contrôle de nombreuses fonctions du corps, dont la motricité volontaire, et...). Grâce à un apprentissage sur un grand nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) de fabrications des mêmes séquences, ils ont formé un réseau de neurones artificiels à identifier les nanostructures par la lumière diffusée (Figure). Ils ont démontré que, malgré le bruit important contenu dans le signal lumineux, le réseau était capable de reconnaître quasiment sans aucune erreur des séquences contenant jusqu'à 9 bits. Ils ont de plus montré que l'analyse était possible en utilisant, non pas toutes les longueurs d'onde, mais seulement trois couleurs de base (bleu, vert (Le vert est une couleur complémentaire correspondant à la lumière qui a une longueur d'onde comprise entre 490 et 570 nm. L'œil humain possède un...) et rouge). Leurs résultats montrent que la fiabilité (Un système est fiable lorsque la probabilité de remplir sa mission sur une durée donnée correspond à celle spécifiée dans le cahier des charges.) et la rapidité de cette méthode pourront être comparables à celles de la lecture Blu-ray.

S'appuyant sur des méthodes très largement répandues telles que les technologies à base de silicium, la détection de la lumière diffusée, et l'apprentissage automatique par des réseaux de neurones artificiels, ce travail démontre une nouvelle méthode d'encodage à base de nanostructures diélectriques et de décodage optique de l'information numérique (Une information numérique (en anglais « digital ») est une information ayant été quantifiée et échantillonnée, par opposition à une information dite...), autorisant une meilleure efficacité de stockage que les supports optiques actuels. Sous réserve de la faisabilité à grande échelle (La grande échelle, aussi appelée échelle aérienne ou auto échelle, est un véhicule utilisé par les sapeurs-pompiers, et qui emporte une échelle...) de l'encodage par nano-fabrication, elle pourrait être envisagée par exemple dans le cas d'archivage (L'archivage est l'action de mettre en archive, d'archiver. Employé surtout à l'origine pour les seuls documents électroniques, comme un synonyme de stockage ou de sauvegarde,...) de données.

Références
Pushing the limits of optical information storage using deep learning,
Peter R. Wiecha, A. Lecestre, N. Mallet et G. Larrieu,
Nature Nanotechnology (janvier 2019)
DOI: 10.1038/s41565-018-0346-1
Page générée en 0.172 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique