MPEG-1/2 Audio Layer 3 - Définition et Explications

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Introduction

Le MPEG-1/2 Audio Layer 3, plus connu sous son abréviation de MP3, est la spécification sonore du standard MPEG-1/MPEG-2, du Moving Picture Experts Group (MPEG). C'est un algorithme de compression audio (voir aussi codec) capable de réduire drastiquement la quantité (La quantité est un terme générique de la métrologie (compte, montant) ; un scalaire,...) de données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent...) nécessaire pour restituer de l'audio, mais qui, pour l'auditeur, ressemble à une reproduction du son original non compressé, c'est-à-dire avec perte de qualité sonore significative mais acceptable pour l'oreille (L'oreille est l'organe qui sert à capter le son et est donc le siège du sens de...) humaine.

L'extension de nom de fichier ( Un fichier est un endroit où sont rangées des fiches. Cela peut-être un meuble, une pièce,...) est .mp3 et le type MIME (Un Internet media type, à l'origine appelé Type MIME ou juste MIME ou encore...) est audio/mpeg, audio/MPA, audio/mpa-robust. Ce type de fichier est appelé « fichier MP3 ».

Un fichier MP3 n'est soumis à aucune mesure technique de protection (cf. gestion numérique des droits).

Un lecteur de MP3 portable

Histoire

Le codage (De façon générale un codage permet de passer d'une représentation des...) MPEG-1/2 Layer 2 est né avec le projet (Un projet est un engagement irréversible de résultat incertain, non reproductible a...) Digital Audio Broadcasting (La diffusion Audio Numérique (Digital Audio Broadcasting ou DAB) est un système de radiodiffusion...) (radio numérique DAB) qui fut lancé par le Deutsche Luft und Raumfahrt. Ce projet a été financé par l'Union européenne, et faisait partie du programme de recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue...) EUREKA, plus connu sous le nom de EU-147.

Le projet EU-147 exista de 1987 à 1994. En 1991, deux formats étaient disponibles :

  • MUSICAM (Masking pattern adapted Universal Subband Coding And Multiplexing), basé sur un pur codage psycho-acoustique et un banc de filtres adaptés aux sons de type percussifs ;
  • ASPEC (Adaptive Spectral Perceptual Entropy Coding), qui introduisait la technologie (Le mot technologie possède deux acceptions de fait :) de codage entropique (Le codage entropique (ou codage statistique à longueur variable) est une méthode de...).

Le format Musicam conçu par le CCETT, Philips et l'IRT fut choisi par l'ISO MPEG Audio dirigé par Hans-Georg Mussman en raison de sa structuration modulaire en plusieurs couches de codage [Layers], sa simplicité de mise en œuvre côté décodeur et sa grande tolérance aux erreurs de transmission.

À la demande de Hans-Georg Mussman, un groupe de travail regroupant Leon (LEON est un processeur 32 bit RISC open source, compatible SPARC V8 (1987) développé par...) Van de Kerkhof (Philips), Yves-Francois Dehery (TDF-CCETT), Karlheinz Brandenburg (Fraunhofer-Gesellschaft) reprit des idées de Musicam et d'ASPEC, ajouta de nouveaux outils technologiques et créa le format MP3 (Layer III ou couche III), conçu pour être de même qualité à 128 kbit/s que le MP2 à 192 kbit/s.

La norme (Une norme, du latin norma (« équerre, règle ») désigne un...) ISO MPEG Audio avec ses trois couches de codage Layer I, Layer II (Musicam), Layer III (.MP3) fut achevée officiellement en 1992 et constitua la première partie du MPEG-1 (Le MPEG-1 est une norme de compression vidéo et audio définie par le standard...), le premier travail du groupe MPEG, groupe à l'origine de la norme internationale ISO/CEI 11172-3, publiée en 1993. Le travail sur l'audio MPEG se termina en 1994 et constitua la seconde ( Seconde est le féminin de l'adjectif second, qui vient immédiatement après le premier ou qui...) partie (MPEG-2) de la norme internationale ISO/CEI 13818-3, publiée pour la première fois en 1995.

Les équipes de normalisation procédèrent à de nombreux tests subjectifs en double aveugle sur de nombreux matériaux (Un matériau est une matière d'origine naturelle ou artificielle que l'homme façonne pour en...) sonores pour déterminer le niveau de compression approprié pour les diverses couches de l'algorithme. On a notamment utilisé Tom's Diner, la chanson de Suzanne Vega (Vega est un lanceur de l'Agence spatiale européenne (ESA) réalisé en collaboration...) comme séquence de test pour l'algorithme de compression du MP3. Cette chanson a été choisie à cause de sa finesse et de sa simplicité, qui facilite la détection des imperfections du codec (Un codec est un procédé capable de compresser et/ou de décompresser un signal...).

Taux de compression

L'efficacité de la compression des codeurs avec perte est habituellement définie par le débit binaire (Le débit binaire mesure une vitesse de transfert de données numériques, mesurée en bits par...), puisque le taux de compression dépend de la taille de l'échantillon (De manière générale, un échantillon est une petite quantité d'une matière, d'information, ou...) et de la fréquence (En physique, la fréquence désigne en général la mesure du nombre de fois qu'un...) d'échantillonnage (L'échantillonnage est la sélection d'une partie dans un tout. Il s'agit d'une notion importante...) du signal ( Termes généraux Un signal est un message simplifié et généralement codé. Il existe...) d'origine. Toutefois, les paramètres du disque compact (Un disque compact (dans le langage courant, CD pour l'anglais Compact Disc), est un disque optique...) sont souvent utilisés comme référence (44,1 kHz, 2×16 bits). Et aussi parfois, ceux du DAT SP (48 kHz, 2×16 bits). Le taux de compression pour cette référence est plus élevé, ce qui montre la complexité (La complexité est une notion utilisée en philosophie, épistémologie (par...) de la définition (Une définition est un discours qui dit ce qu'est une chose ou ce que signifie un nom. D'où la...) du terme « taux de compression » pour les codeurs avec perte.

Fraunhofer-Gesellschaft (Le Fraunhofer-Gesellschaft est un organisme de recherche allemand. Son nom vient du physicien...) publie sur son site Web (Un site Web est un ensemble de pages Web hyperliées entre elles et mises en ligne à une...) officiel les taux de compression et les débits de données pour le MPEG-1 Layer I, II et III :

  • Layer I : 384 kbit/s, compression de 3,23
  • Layer II : 160 à 256 kbit/s, compression de 7,75 à 4,84
  • Layer III : 112 à 128 kbit/s, compression 11,1 à 9,7

Ces valeurs ne disent pas grand-chose sur la qualité du résultat obtenu, puisque la qualité ne dépend pas seulement du format de codage du fichier, mais également de la qualité de l'algorithme psycho-acoustique utilisé par le codeur. Typiquement, les codeurs layer I utilisent un algorithme très simple, d'où un résultat nécessitant un débit (Un débit permet de mesurer le flux d'une quantité relative à une unité de temps au travers...) supérieur pour un codage transparent.

En considérant de bons codeurs, on obtient :

  • Layer I codé à 384 kbit/s, même avec ses algorithmes psycho-acoustiques simples, est meilleur que Layer 2 de 192 à 256 kbit/s
  • Layer II codé à 160 à 192 kbit/s est équivalent au Compact Disc
  • Layer III codé de 112 à 128  kbit/s est équivalent au Layer II de 192 à 256 kbit/s.

Les débits présentés ne sont donc pas équivalents en termes de qualité, et les qualités ne sont pas forcément optimales. De plus, la qualité du codeur est un facteur très important. Ainsi, avec les premiers codeurs, il était généralement admis que 128 kbit/s avec le Layer III n'avait pas un son excellent, mais tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou...) juste raisonnable. La génération de codeurs actuels permet d'obtenir un son tout à fait correct à 128 kbit/s avec le Layer III.

Si l'on est soucieux de la qualité et pas seulement du débit, on utilisera plutôt les valeurs suivantes :

  • Layer I : excellent à 384 kbit/s
  • Layer II : excellent de 256 à 384 kbit/s, très bon de 224 à 256 kbit/s, bon de 160 à 224 kbit/s
  • Layer III : excellent de 224 à 320 kbit/s, très bon de 192 à 224 kbit/s, bon de 128 à 192 kbit/s

La stéréophonie a un débit exactement deux fois supérieure à la monophonie si la qualité est identique pour ces deux modes d'écoute (Sur un voilier, une écoute est un cordage servant à régler l'angle de la voile par rapport à...). Le mode stéréo joint diffère de la stéréo simple car il ne code pas séparément les deux canaux gauche et droit si les informations sonores sont identiques, permettant un gain de qualité par rapport à la stéréo classique avec une même valeur de compression. Le procédé de la stéréophonie est un codage dit différentiel (Un différentiel est un système mécanique qui a pour fonction de distribuer une vitesse de...) de même type que celui utilisé pour la radiodiffusion en FM stéréo.

Taux de compression et qualité du codage mp3Pro

Page générée en 0.045 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique