Segmentation en plans - Définition et Explications

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Historique

Un exemple de transition progressive : un fondu au noir.

Les premiers travaux sur la segmentation en plans remontent au début des années 1990. C'est la plus ancienne des tâches d'indexation vidéo (La vidéo regroupe l'ensemble des techniques, technologie, permettant l'enregistrement ainsi que la...) et la plus explorée. À ceci deux raisons principales :

  • C'est une tâche relativement simple à réaliser, à interpréter, et à évaluer.
  • L'identification des plans fournit un résultat considéré comme étant la première étape pour pouvoir résoudre les problèmes d'indexation vidéo (La vidéo regroupe l'ensemble des techniques, technologie, permettant l'enregistrement ainsi que la...) de plus haut niveau. La performance des algorithmes de segmentation (De manière générale, le mot segmentation désigne l'action de segmenter, le fait de se segmenter...) en plans est donc cruciale pour le domaine en général.

De très nombreux algorithmes ont été publiés dans les années 1990 et 2000. Une difficulté importante est la comparaison des résultats des différents algorithmes proposés, testés sur des corpus différents en termes de taille et de contenu. La création de TRECVID en 2003 a été une étape importante, car elle a introduit des mesures de performances standard et, surtout, des contenus communs, qui permettent une comparaison non biaisée des performances. La taille du corpus est assez importante (400 heures (L'heure est une unité de mesure  :) en 2007), mais le contenu reste assez homogène (journaux télévisés et documentaires majoritairement).

Une initiative similaire a été lancée en France en 2005 sous le nom d'ARGOS, avec des contenus fournis par l'INA et le CERIMES.

Un autre problème lié à la performance des algorithmes apparaît dès les premières recherches. Si les résultats de détection pour les transitions brusques sont rapidement assez bons, ce n'est pas le cas pour les transitions progressives. On voit alors apparaître à la fin des années 1990 et au début des années 2000 de nombreux articles se concentrant sur les difficultés de détection des transitions progressives.

En 2002, Alan Hanjalic, de l'Université (Une université est un établissement d'enseignement supérieur dont l'objectif est la...) de technologie (Le mot technologie possède deux acceptions de fait :) de Delft, publie un article au titre provocateur : « Shot Boundary Detection: Unraveled and Resolved ? » (traduction: Segmentation en plans : un problème résolu ?), où il affirme que le problème principal des méthodes proposées est leur grande sensibilité aux valeurs de seuils, la conséquence étant que des réglages manuels doivent être effectués selon les types de vidéos à traiter. Il préconise alors l'emploi de techniques robustes de statistiques (La statistique est à la fois une science formelle, une méthode et une technique. Elle...), basées sur la théorie (Le mot théorie vient du mot grec theorein, qui signifie « contempler, observer,...) de la décision.

Bien que de nombreux points soient encore à résoudre (évaluation sur de grands corpus hétérogènes, performances faibles de la détection des transitions progressives, dépendance aux réglages manuels...), Hanjalic officialise par le titre de son article, le fait que la segmentation en plans est considérée par la communauté scientifique (Un scientifique est une personne qui se consacre à l'étude d'une science ou des sciences et qui...) comme un problème « résolu ».

Applications

La segmentation en plans est généralement considérée comme étant de trop bas niveau pour être utilisée telle quelle dans une application de navigation (La navigation est la science et l'ensemble des techniques qui permettent de :) et recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue...) d'information vidéo. Une avance rapide plan par plan peut cependant avantageusement remplacer une avance rapide traditionnelle, basée sur un simple saut d'un nombre (La notion de nombre en linguistique est traitée à l’article « Nombre...) fixe d'images.

La principale application de la segmentation en plans est de fournir une base de travail aux algorithmes d'indexation vidéo de plus haut niveau. Par exemple pour la détermination des scènes, réaliser des résumés vidéo, ou encore l'analyse de vidéos de sport.

Certains logiciels de montage vidéo (Le montage vidéo consiste à sélectionner des images enregistrées sur un support...), par exemple Windows (Windows est une gamme de systèmes d'exploitation produite par Microsoft, principalement destinées...) Movie Maker et VirtualDub, utilisent la segmentation en plans pour générer un pré-découpage pour l'utilisateur, qui permet de faire du montage non linéaire simplement. Pour les cinéphiles intéressés par l'analyse de films, ces techniques peuvent éventuellement avoir un intérêt pour déterminer automatiquement le nombre de plans dans un film et leur localisation.

La segmentation en plans est aussi utilisée dans les techniques de restauration d'image ,pour la correction des défauts inhérents aux changements de plan, tels que les échos d'étalonnage et les déformations d'image.

Page générée en 0.630 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique