Distance de Hamming - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs est disponible ici.

La distance de Hamming, définie par Richard Hamming, est utilisée en informatique, en traitement du signal et dans les télécommunications. Elle joue un rôle important en théorie algébrique des codes correcteurs. Elle permet de quantifier la différence entre deux séquences de symboles.

La distance de Hamming est une distance au sens mathématique du terme. À deux suites de symboles de même longueur, elle associe l'entier désignant le cardinal de l'ensemble des symboles de la première suite qui différent de la deuxième.

Le poids de Hamming correspond au nombre d'éléments différents de zéro dans une chaine d'éléments d'un corps fini.

Intérêt du concept

Histoire et domaine d'applications

La distance de Hamming doit son nom à Richard Hamming (1915 1998). Elle est décrite dans un article^[1] fondateur pour la théorie des codes. Elle est utilisée en télécommunication pour compter le nombre de bits altérés dans la transmission d'un message d'une longueur donnée. Le poids de Hamming correspond au nombre de bits différents de zéro, il est utilisé dans plusieurs disciplines comme la théorie de l'information, la théorie des codes et la cryptographie. Néanmoins, pour comparer des séquences de longueurs variables, ou des chaines de caractères pouvant subir non seulement des substitutions, mais aussi des insertions ou des effacements, des métriques plus sophistiquées comme la distance de Levenshtein sont plus adaptées.

Motivation

Illustration d'un code non correcteur et d'un code correcteur

Les codes correcteurs ont leur source dans un problème de la transmission de données. Parfois, une transmission de données se fait en utilisant une voie de communication non entièrement fiable. L'objectif d'un code correcteur est l'apport d'une redondance de l'information de telle manière à ce que l'erreur puisse être détectée voir corrigée.

Un message est un élément d'un ensemble E constitué de suites finies de lettres choisies dans un alphabet A. L'apport de la redondance est le résultat d'une application injective φ de E dans un ensemble F constitué aussi de suite finies de lettres d'un alphabet A'. Les suites de l'ensemble F sont choisies a priori plus longues que celle de E. L'ensemble φ(E) est appelé code et un élément de cet ensemble φ(m) mot du code. L'intérêt de transmettre φ(m) à la place de m est illustré par la figure à droite :

Le cas d'un code sans redondance est illustré à gauche sur la figure. F est alors égal à E et φ est l'identité. Si un message en vert subit, lors de sa transmission, une altération, un nouveau message en rouge est transmis. Aucune information ne laisse supposer qu'une erreur a été commise.

Pour pallier cet état, l'objectif est d'entourer les mots du code, correspondant, sur la figure de droite aux points verts, par des messages connus pour contenir des erreurs. Ces redondances sont illustrées par les intersections du quadrillage orange. Si une unique erreur se produit, alors le message transmis correspond à un point rouge. Si la redondance a été habilement construite, il n'existe qu'un point vert proche du point rouge reçu, l'erreur est corrigible.

La distance de Hamming correspond sur la figure au plus petit nombre de segments du quadrillage à traverser pour joindre deux points.

Définition et exemples

Définitions

Soit A un alphabet et F l'ensemble des suites de longueur n à valeur dans A. La distance de Hamming entre deux éléments a et b de F est le cardinal de l'ensemble des images de a qui diffèrent de celle de b.

Formellement, si d(.,.) désigne la distance de Hamming :

$\forall a,b \in F \quad a = (a_i)_{i\in [0, n-1]} \; et \; b = (b_i)_{i\in [0, n-1]} \quad d(a,b) = \#\{ i : a_i\neq b_i \}$

La notation #E désigne le cardinal de l'ensemble E.

Un cas important dans la pratique est celui des symboles binaires. Autrement dit A= {0,1}, On peut alors écrire, si ⊕ désigne le ou exclusif.

$d(a,b) = \sum_{i=0}^{n-1} (a_i \oplus b_i)$

Dans le cas, fréquent, où l'alphabet est un corps fini, F possède une structure d'espace vectoriel de dimension n. La distance dérive alors d'une pseudo-norme :

Soit K est un corps fini et F l'ensemble des suites de longueur n à valeur dans K. Le poids de Hamming p(a) d'un élément a de F est le cardinal de l'ensemble des images de a non nulles.

L'alphabet est souvent F₂ le corps à deux éléments {0,1}. Le poids de Hamming est une pseudo-norme car :

$\forall a \in F \; \forall \lambda \in \mathbb K \quad p(\lambda .a) = p(a)$

Néanmoins, si l'alphabet est un corps fini, alors la distance dérive du poids de Hamming, en effet:

$\forall a,b \in F \quad d(a,b) = p(b-a)$

Exemples

Considérons les suites binaires suivantes :

$a = \begin{pmatrix} 0 & 0 & 0 & 1 & 1 & 1 & 1 \\ \end{pmatrix} \; et \; b = \begin{pmatrix} 1 & 1 & 0 & 1 & 0 & 1 & 1 \\ \end{pmatrix} \quad alors \quad d = 1 + 1 + 0 + 0 + 1 + 0 + 0 = 3$

La distance entre a et b est égale à 3 car 3 bits diffèrent.

La distance de Hamming entre 1011101 et 1001001 est 2.
La distance de Hamming entre 2143896 et 2233796 est 3.
La distance de Hamming entre "ramer" et "cases" est 3.

Cas binaire

cube binaire de dimension trois

hyper-cube binaire de dimension quatre

Un cas important est celui ou l'alphabet est le corps à deux éléments {0,1}. Une lettre est alors appelée bit. Il est largement utilisé en informatique et en télécommunication.

Il est possible d'illustrer graphiquement le code et les distances entre les différents mot.

Le cas ou un mot comporte trois lettres est illustré sur la figure de gauche. La distance entre 010 et 111 est égale à deux car il est nécessaire de parcourir deux segments pour joindre les deux points. La distance pour joindre les points 100 et 011 est égale à trois.

La figure de droite illustre un hyper-cube binaire de dimension quatre. La distance entre 0110 et 1110 est égale à un, alors que la distance entre 0100 et 1001 est égal à trois.

Le poids de Hamming d'un élément a correspond à la distance entre le mot zéro n'ayant que des coordonnées nulles et a.

Propriété

Distance

La distance de Hamming est une distance au sens mathématique du terme :

$\forall a,b\in F : d(a,b)=d(b,a)$	(symétrie)
$\forall a,b\in F : d(a,b)=0\Leftrightarrow a=b$	(séparation)
$\forall a,b,c\in F : d(a,c)\leq d(a,b)+d(b,c)$	(inégalité triangulaire)

La troisième propriété se démontre par une récurrence sur n.

Capacité de correction et distance minimale

La distance minimale δ est le minimum de distance entre deux mots du codes. Elle permet de déterminer le nombre maximal d'erreurs t corrigeables de manière certaine. La valeur de t est en effet celle du plus grand entier strictement inférieur à δ/2.

Si M désigne le nombre de mot du code, q le nombre de lettres de l'alphabet A de F et V_t le cardinal d'une boule fermée de rayon t, alors la majoration suivante est vérifiée:

$M \leq \frac{q^n}{V_t}\quad avec \quad V_t=\sum_{i=0}^{t} {n \choose i} (q-1)^i$

Cette majoration porte le nom de Borne de Hamming.

Dans le cas d'un code linéaire, et si k désigne la longueur des mots du codes, il existe une autre majoration, dite du borne du singleton :

$n-k \le \delta - 1 \;$

Applications

Somme de contrôle

Données sur 7 bits	avec bit de parité
0000000	00000000
1010001	11010001
1101001	01101001
1111111	11111111

La somme de contrôle est un exemple simple d'utilisation de la distance de Hamming. La distance minimale entre deux mots du code est égale à deux. En conséquence, si une unique erreur se produit elle est détectée. En revanche, elle n'est pas corrigeable sans retransmission. En effet, il existe a priori plusieurs mots de code à distance de un du message erroné.

L'exemple le plus simple est celui du bit de parité. Il correspond à une somme de contrôle dans le cas où le corps est binaire, c'est-à-dire qu'il contient deux éléments zéro et un.

Supposons que l'objectif soit la transmission de sept bits. Un bit de parité est défini comme étant égal à zéro si la somme des autres bits est paire et à un dans le cas contraire. Les huit bits transmis sont d'abord le bit de parité puis les sept bits du message. Il correspond au bit de parité pair, c'est-à-dire la deuxième colonne du tableau de droite. Les messages envoyés sur huit bits ont toujours la parité zéro, ainsi si une erreur se produit, un zéro devient un un, ou l'inverse; le recepteur sait qu'une altération a eu lieu. En effet la somme des bits devient impaire ce qui n'est pas possible sans erreur de transmission.

Code de Hamming

Le code de Hamming est un exemple un peu plus complexe que le précédent. La distance minimale entre deux mots du code est égale à trois. Si une unique altération se produit, alors le message reçu est à une distance de un d'un unique point du code. Il est ainsi possible de corriger automatiquement une erreur, si l'on sait que l'erreur est unique.

Code linéaire

Les codes linéaires forment une famille contenant les deux exemples précédents. L'alphabet est un corps fini, les ensembles E et F sont des espaces vectoriels et l'application φ est linéaire. La distance de Hamming dérive de la pseudo-norme : le poids de Hamming. Ce contexte est très généralement celui qu'utilise l'industrie.

Code cyclique

Cette famille de codes correspond à un cas particulier de code linéaire. Les structures E et F sont enrichies d'une structure d'anneau leur conférant le statut d'algèbre. Cette structure, se fondant sur la théorie polynômes sur les extensions de corps finis permet de construire des distances minimales aussi élevées qu'on le souhaite.

De nombreux codes sont construits sur cette théorie. Le code de Hamming apparait comme un cas particulier de ceux là. On peut citer aussi les codes BCH ou les codes de Reed-Solomon utilisés par exemple pour les disques compacts.

Notes et références

Articles de Théorie des codes en rapport avec les codes correcteurs

Notes

↑ Richard Hamming error-detecting and error-correcting codes Bell System Technical Journal 29(2):147-160, 1950

Batteries: capacité triplée avec ces nouvelles anodes en silicium !

Il y a 3 heures

La moelle épinière possède sa propre mémoire

Il y a 3 heures

Cette équation prédit une "magnetic RAM" un million de fois plus rapide

Il y a 5 heures

Des humains ont vécu dans cet immense tube de lave il y a 7000 ans

Il y a 5 heures

L'anxiété et la dépression peuvent diminuer grâce à cette stimulation transcrânienne

Il y a 22 heures

Le bon ratio oméga-6/oméga-3 dans l'assiette pour lutter contre l'obésité

Il y a 22 heures

Des particules plus rapides que la lumière ? Premier test réussi pour les tachyons

Il y a 1 jour

Cette nouvelle approche permet de cibler les cellules cancéreuses pour les combattre

Il y a 1 jour

Intel dévoile le plus grand ordinateur neuromorphique au monde, imitant le cerveau humain

Il y a 1 jour

Cette créature expliquerait notre réaction instinctive de combat ou de fuite

Il y a 1 jour

Les traumatismes de l'enfance altèrent les fonctions musculaires en vieillissant

Il y a 1 jour

Pourquoi nous gratouillons-nous si souvent pour rien ?

Il y a 1 jour

Découverte d'un serpent géant, le plus grand de tous les temps ?

Il y a 2 jours

Découverte d'un nouveau principe de mouvement dans les cristaux liquides

Il y a 2 jours

Une concentration extrême de matière noire révélée par cet anneau d'Einstein

Il y a 2 jours

Comment les émissions des véhicules à essence se transforment en particules respirables

Il y a 2 jours

L'atmosphère de Vénus fuit dans l'espace

Il y a 2 jours

Quand la lutte contre la pollution de l'air contribue au réchauffement climatique: le paradoxe environnemental

Il y a 2 jours

Un trou noir dormant géant découvert dans notre voisinage cosmique

Il y a 3 jours

Grippe aviaire: le risque de propagation aux humains "extrêmement préoccupant" d'après l'OMS

Il y a 3 jours

Le secret des crânes coniques et des dents limées des Vikings

Il y a 3 jours

Les terres rares, loin d'être rares, affectent les plantes

Il y a 3 jours

La marine américaine développe sa première arme à micro-ondes contre les drones

Il y a 4 jours

Premier atlas de l'ovaire humain: un pas vers l'ovaire artificiel

Il y a 4 jours

La vision suffit pour produire les mouvements collectifs (vidéo)

Il y a 4 jours

Comment la Voie lactée a-t-elle influencé l'Egypte antique ?

Il y a 4 jours

Coopérer ou rivaliser: comment décide notre cerveau ?

Il y a 4 jours

S'inspirer des os de géants pour la construction

Il y a 5 jours

Rigidité artérielle: un nouvel indicateur pour prévenir les maladies cardiovasculaires

Il y a 5 jours

Pourquoi les femmes seules consomment-elles plus de sucreries ?

Il y a 5 jours

Que faut-il savoir sur les PFAS, ces "polluants éternels" ?

Il y a 5 jours

Découverte: ces substances courantes accélèrent le vieillissement

Il y a 5 jours

Des scientifiques identifient le meilleur moment de la journée pour faire du sport

Il y a 5 jours

Cette rupture technologique pourrait décupler la capacité des disques durs

Il y a 6 jours

Cycle menstruel: une étude scientifique établit un lien avec la Lune

Il y a 6 jours

Quand un trio d'étoiles devient un couple: une histoire cataclysmique retracée

Il y a 6 jours

Ce petit ver possède des yeux immenses: pourquoi ?

Il y a 6 jours

D'où vient cette structure fractale observée dans une bactérie ?

Il y a 6 jours

Découverte majeure dans les allergies respiratoires

Il y a 6 jours

Voici ce qui a produit la lumière la plus lumineuse jamais détectée dans l'Univers

Il y a 7 jours

Propagation inquiétante de la "mouche noire" suceuse de sang en Allemagne

Il y a 7 jours

Le hasard confère le prix Turing et 1 million de dollars au mathématicien Avi Wigderson

Il y a 7 jours

AI Act: comment encadrer l'intelligence artificielle en Europe ?

Il y a 7 jours

Quelle est cette forme étrange photographiée près de la Lune ?

Il y a 7 jours

Si vous avez déjà eu une entorse de la cheville, attention à ceci

Il y a 7 jours

Démonstration d'une nouvelle technologie de lévitation, stable et sans supraconductivité

Il y a 8 jours

Ces indices d'une rupture imminente de la faille de San Andreas

Il y a 8 jours

Cet effet inattendu de la musculation sur la mémoire

Il y a 8 jours

Les géantes Uranus et Neptune ne seraient pas faites comme nous l'imaginions

Il y a 8 jours

Parker Solar Probe se prépare à battre le record de vitesse de l'humanité

Il y a 8 jours

Populaires

Batteries: capacité triplée avec ces nouvelles anodes en silicium !

Découverte d'un serpent géant, le plus grand de tous les temps ?

La moelle épinière possède sa propre mémoire

Des particules plus rapides que la lumière ? Premier test réussi pour les tachyons

Cette équation prédit une "magnetic RAM" un million de fois plus rapide

Des humains ont vécu dans cet immense tube de lave il y a 7000 ans

Toutes les ventes flash et Codes Promos Amazon

Cdiscount: les meilleures réductions actuelles

Page générée en 0.011 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique
Version anglaise | Version allemande | Version espagnole | Version portugaise