Recherche d'image par le contenu
Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

La recherche d'images par le contenu, en anglais : Content Based Image Retrieval (CBIR), est une technique visant à effectuer des recherches d'images à l'aide de requêtes portant sur les caractéristiques visuelles d'une image : texture, couleur (La couleur est la perception subjective qu'a l'œil d'une ou plusieurs fréquences d'ondes lumineuses, avec une (ou des) amplitude(s) donnée(s).), forme... Le cas typique d'utilisation de ces systèmes est lorsque l'on dispose d'une image pour laquelle on souhaiterait obtenir des images visuellement similaires. Il s'oppose à la recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances...) d'images par mots clés, qui est typiquement ce qui est proposé actuellement par les moteurs (Un moteur est un dispositif transformant une énergie non-mécanique (éolienne, chimique, électrique, thermique par exemple) en une énergie mécanique ou travail.[réf. nécessaire]) de recherche tels que Google (Google, Inc. est une société fondée le 7 septembre 1998 dans la Silicon Valley en Californie par Larry Page et Sergey Brin, auteurs du moteur de recherche Google. Depuis 2001, Eric Schmidt en est le...) ou Yahoo! (Yahoo!,Inc. est une société américaine de services sur Internet opérant notamment un portail Web. À l'origine, Yahoo! était uniquement un annuaire Web. En...), où les images sont retrouvées en utilisant le texte qui les entoure plutôt que le contenu de l'image elle-même.

Principes

Cette technologie (Le mot technologie possède deux acceptions de fait :) se distingue des moteurs de recherche traditionnels d'image. Ces derniers utilisent généralement deux techniques :

  • Une recherche contextuelle par mots clés (tels que Google (lien) ou Altavista (AltaVista (littéralement « vue d'en haut ») est un moteur de recherche du World Wide Web. Il fut mis en ligne à l'adresse web altavista.digital.com en décembre...) (lien) ) : l'image est retrouvée à partir des mots clés entourant cette image dans les pages web.
  • Une recherche par mots clés manuellement associés aux images indexées, par exemple dans les musées.

Les CBIR tentent, à l'inverse (En mathématiques, l'inverse d'un élément x d'un ensemble muni d'une loi de composition interne · notée multiplicativement, est un élément y tel...), de permettre une indexation et une recherche de l'image portant sur les caractéristiques de l'image :

  • la texture (filtre de Gabor, transformée en ondelette discrète, ...)
  • la couleur (histogramme de couleurs, histogrammes dans l'espace RGB, TSV, ...),
  • les formes (descripteurs de Fourier, ...),
  • une combinaison (Une combinaison peut être :) de plusieurs de ces caractéristiques.

Ces caractéristiques sont dites de bas-niveau, car elles sont très proches du signal ( Termes généraux Un signal est un message simplifié et généralement codé. Il existe sous forme d'objets ayant des formes particulières. Les signaux lumineux sont employés...), et ne véhiculent pas de sémantique particulière sur l'image. Une fois ces caractéristiques extraites, la suite consiste généralement à définir diverses distances entre ces caractéristiques, et de définir une mesure de similarité globales entre deux images. Armés de cette mesure de similarité et d'une image requête (Le mot requête, synonyme de demande, est employé dans les domaines suivants :), on peut alors calculer l'ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble), « une multitude qui peut être...) des mesures similarités entre cette image requête et l'ensemble des images de la base d'images.On peut alors ordonner les images de la base suivant leur score, et présenter le résultat à l'utilisateur, les images de plus grand score étant considérées comme les plus similaires.

Du fait des caractéristiques calculées, qui sont de bas-niveau, ces techniques obtiennent des résulats satisfaisant pour certains types de requêtes et certains types de base d'images. Par exemple rechercher des images de paysages enneigés, parmi une base d'image de paysages.

Toutefois ces systèmes rendent souvent des réponses extravagantes, et souvent éloignées de l'idée qu'avait l'utilisateur lorsqu'il a soumit sa requête.

Ce genre de système permet aussi de rechercher des images sans forcément avoir une image requête, par exemple rechercher des images plutôt bleues, ou alors dessiner une forme et demander de chercher toutes les images qui possèdent un objet (De manière générale, le mot objet (du latin objectum, 1361) désigne une entité définie dans un espace à trois dimensions, qui a une fonction précise, et...) de forme similaire.

Il existe plusieurs prototypes implémentant ce genre de techniques. Le domaine fait toutefois encore partie de la recherche et n'est pas encore mature.

Problèmes de performances

L'analyse d'images selon les différentes caractéristiques est très coûteuse en terme de performances. C'est pour cette raison que les systèmes CBIR extraient les caractéristiques d'une image, les stockent et les indexent à l'intérieur d'une base de données (En informatique, une base de données (Abr. : « BD » ou « BDD ») est un lot d'informations stockées dans un dispositif informatique. Les technologies existantes permettent...). La recherche sur des caractéristiques extraites étant beaucoup plus rapide.

Applications

Cette technologie est actuellement intéressante pour la recherche de données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un événement, etc.) sur l'imagerie médicale (L'imagerie médicale regroupe les moyens d'acquisition et de restitution d'images à partir de différents phénomènes physiques (Résonance magnétique, réflexion d'ondes ultrasons,...), ou cartographiques.

Page générée en 0.169 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique