Un nouvel algorithme améliore la vision des robots
Publié par Michel le 09/12/2005 à 00:00
Source: Université de Stanford
Illustration: I, Robot - extrait
Sauf dans les films de SF comme "Matrix revolutions", où d'effrayants robots calamars manoeuvrent avec une incroyable aisance, la plupart des robots réels sont trop maladroits pour se déplacer autour d'obstacles à vitesse élevée.

Ceci est vrai en grande partie parce qu'ils ont du mal à déterminer, dans les images qu'ils observent, la distance exacte à laquelle se trouvent les obstacles. Des informaticiens de Stanford dévoilent un algorithme de vision pour machines qui donne aux robots la capacité d'évaluer les distances sur de simples images fixes.

"Beaucoup de gens pensent que l'évaluation de le profondeur à partir d'une image monoculaire simple est impossible", remarque le professeur d'informatique (L´informatique - contraction d´information et automatique - est le domaine d'activité scientifique, technique et industriel en rapport avec le traitement automatique de...) Andrew Ng, qui présente un rapport sur ses recherches à la conférence Neural Information Processing Systems de Vancouver. "En fait, dans les applications pratiques, l'évaluation monoculaire de la profondeur non seulement fonctionne bien, mais peut également s'avérer très utile".

A l'aide d'énormes treillis de capteurs (Un capteur est un dispositif qui transforme l'état d'une grandeur physique observée en une grandeur utilisable, exemple : une tension électrique, une hauteur de mercure, une intensité, la déviation d'une aiguille…. On fait souvent...) et d'un investissement considérable, certains robots parviennent à se diriger convenablement. Stanley, le véhicule (Un véhicule est un engin mobile, qui permet de déplacer des personnes ou des charges d'un point à un autre.) robot (Un robot est un dispositif mécatronique (alliant mécanique, électronique et informatique) accomplissant automatiquement soit des tâches qui sont...) de Stanford qui a participé au grand défi de la DARPA dans le désert (Le mot désert désigne aujourd’hui une zone stérile ou peu propice à la vie, en raison du sol impropre, ou de la faiblesse...) en octobre dernier (voir notre news (NeWS est un système de fenêtrage conçu par James Gosling (qui a contribué à Java) et introduit par Sun Microsystems à la fin des années 1980 n'a pas connu de succès mais...)), utilisait des lasers, des radars et des caméras pour scruter la route (Le mot « route » dérive du latin (via) rupta, littéralement « voie brisée », c'est-à-dire creusée dans la roche, pour ouvrir le chemin.) devant ses roues (La roue est un organe ou pièce mécanique de forme circulaire tournant autour d'un axe passant par son centre.). En utilisant les travaux du professeur Ng et de ses élèves, les robots trop petits pour embarquer de nombreux capteurs ou qui doivent être construits à bon marché pourraient se diriger au moyen d'une seule caméra (Le terme caméra est issu du latin : chambre, pour chambre photographique. Il désigne un appareil de prise de vues animées, pour le cinéma, la télévision ou la vidéo.) vidéo (La vidéo regroupe l'ensemble des techniques, technologie, permettant l'enregistrement ainsi que la restitution d'images animées, accompagnées ou non de son, sur un...). Et déjà, en utilisant une version simplifiée de cet algorithme, le professeur Ng est parvenu à ce qu'un véhicule radiocommandé se pilote d'une manière autonome pendant plusieurs minutes ( Forme première d'un document : Droit : une minute est l'original d'un acte. Cartographie géologique ; la minute de terrain est la carte originale, au crayon, levée sur le...) dans une zone fortement boisée avant de se crasher (En sécurité informatique, un crasher appartient à la famille des pirates informatiques. Il efface les données par jeu uniquement, sans pour autant en vouloir à la victime qui est le plus...).

Induire la profondeur

Pour donner aux robots la perception de la profondeur, Ng et ses élèves Ashutosh Saxena et Sung H. Chung ont conçu un logiciel (En informatique, un logiciel est un ensemble d'informations relatives à des traitements effectués automatiquement par un appareil informatique. Y...) capable d'apprendre à repérer certaines caractéristiques de profondeur dans des images fixes. Ces indices incluent les variations de texture (les surfaces qui semblent plus détaillées sont supposées être proches), les contours (des lignes qui semblent converger, comme les bords d'un chemin, indiquent une distance croissante) et le "brouillard (Le brouillard est le phénomène météorologique constitué d’un amas de fines gouttelettes ou de fins cristaux de glace,...)" (les objets qui apparaissent brumeux sont susceptibles d'être plus lointains).

Pour analyser ces caractères indicateurs de la manière la plus exhaustive, le logiciel découpe les images en sections et les analyse d'abord individuellement puis en relation avec les sections voisines. Ceci permet au logiciel de déduire les relations entre les objets de l'image. Le logiciel recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances scientifiques....) également des indices dans l'image à des niveaux variables de grossissement pour s'assurer qu'il ne rate (La rate (en grec ancien σπλήν (splēn), en latin lien, d'où les adjectifs splénique et liénal) est un organe fragile, profond,...) aucun détail ni aucune tendance dominante, autrement dit et au sens (SENS (Strategies for Engineered Negligible Senescence) est un projet scientifique qui a pour but l'extension radicale de l'espérance de vie humaine. Par une évolution progressive allant du ralentissement du vieillissement, suivi de son...) propre, pour que "les arbres ne lui cachent pas la forêt (Une forêt ou un massif forestier est une étendue boisée, relativement dense, constituée d'un ou plusieurs peuplements d'arbres et d'espèces associées. Un...)".

En utilisant l'algorithme de Stanford, les robots pourraient juger des distances dans des environnements intérieurs ou extérieurs avec une erreur moyenne (La moyenne est une mesure statistique caractérisant les éléments d'un ensemble de quantités : elle exprime la grandeur...) d'environ 35%. En d'autres termes, un arbre (Un arbre est une plante terrestre capable de se développer par elle-même en hauteur, en général au delà de sept mètres. Les arbres acquièrent une structure rigide...) réellement distant de 9 mètres serait perçu à une distance comprise entre 6 et 12 mètres. Un robot se déplaçant à 30 kilomètres (Le mètre (symbole m, du grec metron, mesure) est l'unité de base de longueur du Système international. Il est défini comme la distance parcourue par la...) par heure (L’heure est une unité de mesure du temps. Le mot désigne aussi la grandeur elle-même, l'instant (l'« heure qu'il est »), y compris en sciences...) et évaluant les distances grâce aux images d'une vidéo à 10 trames par seconde ( Seconde est le féminin de l'adjectif second, qui vient immédiatement après le premier ou qui s'ajoute à quelque chose de nature identique. La...) aurait suffisamment de temps (Le temps est un concept développé par l'être humain pour appréhender le changement dans le monde.) pour calculer son itinéraire, cela, même avec cette incertitude. Le Professeur Ng précise que comparé aux algorithmes de vision stéréo traditionnels - ceux qui emploient deux caméras et font usage (L’usage est l'action de se servir de quelque chose.) de la triangulation (En géométrie et trigonométrie, la triangulation est une technique permettant de déterminer la position d'un point en mesurant les angles entre ce point et d'autres points de référence dont la position est...) pour calculer la profondeur - le nouveau logiciel pouvait détecter avec certitude des obstacles cinq à dix fois plus éloignés.

"La difficulté de faire fonctionner la perception visuelle de la profondeur à grande distance a toujours été une barrière importante pour le déplacement ( En géométrie, un déplacement est une similitude qui conserve les distances et les angles orientés. En psychanalyse, le déplacement est mécanisme de défense...) à grande vitesse (On distingue :) des robots ", indique Ng. "J'aimerais construire un véhicule volant capable d'évoluer dans une forêt en esquivant habilement chaque arbre". Cela fait naturellement penser aux images d'un autre film: la scène de poursuite dans la forêt sur la planète (Une planète est un corps céleste orbitant autour du Soleil ou d'une autre étoile de l'Univers et possédant une masse suffisante...) des Ewoks dans le "Retour du Jedi (Les Jedi sont des personnages de fiction de la saga Star Wars. Ce sont des philosophes-guerriers œuvrant pour le maintien de la paix imaginés par George Lucas. Ils sont dotés de pouvoirs surnaturels, mais savoir si ces...)". Le Professeur Ng veut transposer cette idée du royaume de la fiction dans le monde (Le mot monde peut désigner :) réel.

Page générée en 0.413 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique