Code de Reed-Solomon - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

- Introduction - Vue d'ensemble - Description intuitive - Histoire - Applications - Propriétés - Faiblesse - Exemple - Utilisation dans un modem avec codeur convolutif

Introduction

Le code de Reed-Solomon est un code correcteur basé sur les corps de Galois dont le principe est de construire un polynôme formel à partir des symboles à transmettre et de le suréchantillonner. Le résultat est alors envoyé, au lieu des symboles originaux. La redondance de ce suréchantillonnage permet au récepteur du message encodé de reconstruire le polynôme même s'il y a eu des erreurs pendant la transmission.

Vue d'ensemble

Les codes Reed-Solomon sont des codes par bloc. En effet ils prennent en entrée un bloc de données de taille fixée, qui est transformé en un bloc de sortie de taille fixée. Ces codes travaillent sur un corps de Galois qui possède le plus souvent $2 m$ éléments. Le plus souvent on prend m = 8 ou m = 16. Grâce à un ajout de redondance, ces codes permettent de corriger deux types d'erreurs:

les erreurs induisant une modification des données, ou certains bits passent de la valeur 0 à la valeur 1 et vice versa comme sur le canal binaire symétrique,
les erreurs provoquant des pertes d'informations aussi appelées effacements, lorsque des paquets d'informations sont perdus ou effacés comme sur le canal binaire à effacement.

On note un codage de Reed-Solomon $R S (n, k)$ ou $R S (n, k, t)$ .

Description intuitive

Imaginons un bloc de 3 nombres que l'on souhaite transmettre : 02 09 12

Ajoutons deux nombres de redondance d'information.
Le premier est la somme des 3 nombres : 02 + 09 + 12 = 23
Le second est la somme pondérée des 3 nombres, chacun est multiplié par son rang : 02×1 + 09×2 + 12×3 = 56
À la sortie du codeur, le bloc à transmettre est : 02 09 12 23 56

Suite à une perturbation, le récepteur reçoit : 02 13 12 23 56

À partir des données reçues, le décodeur calcule :
Sa somme simple : 02 + 13 + 12 = 27
Sa somme pondérée : 02×1 + 13×2 + 12×3 = 64

La différence entre la somme simple calculée (27) et celle reçue (23) indique la valeur de l'erreur : 4 (27-23 = 4)
La différence entre la somme pondérée calculée (64) et celle reçue (56), elle-même divisée par la valeur de l'erreur indique la position où l'erreur se trouve : 2 ((64-56) / 4 = 2).
Il faut donc retirer 4 au nombre du rang 2.

Le bloc original est donc 02 (13-4=09) 12 23 56

Lors d'une transmission sans perturbation, les différences des sommes simples et des sommes pondérées sont nulles.

Histoire

Ce code est dû à Irving S. Reed et Gustave Solomon.

Applications

Stockage de données

Pour le CD, on utilise 2 codages de Reed-Solomon, on code une première fois avec un code C1 = RS (28, 24) puis on entrelace (ceci permet de répartir l'information afin de mieux résister aux trains d'erreurs consécutives que peut provoquer une rayure qui détruit beaucoup d'octets localement) ensuite on code à nouveau les données entrelacées avec un code C2 = RS (32, 28). L'idée est que le premier code permet d'éliminer le bruit ambiant mais s'il ne peut corriger (par exemple, s'il y a une salve d'erreurs) il efface le bloc (car on peut corriger deux fois plus d'effacements que de caractères faux) et ensuite le code est désentrelacé ainsi la perte d'information est diluée sur une grande plage de données ce qui permet au code de corriger ces effacements.

Pour le DVD le principe est le même que pour les CD, on a un code PI= RS (182, 172) et un code PO = RS (208, 192)

Transmission par satellite

Pour le DVB, le codage est RS (204, 188, t=8)

Transmission de données

En ADSL/ADSL2/ADSL2plus, le codage est souvent RS (240,224,t=8) ou encore RS (255,239,t=8).

Propriétés

La longueur maximale d’un code de Reed–Solomon est définie comme :

$n = k + 2 t$

$n = 2 m - 1$

Avec :

$m$ : nombre de bits par symbole ;
$k$ : nombre de symboles d’information, appelé charge utile ;
$n$ : nombre de symboles transmis (charge utile et correction d'erreur) ;
$2 t$ : nombre de symboles de contrôle.

Si la localisation des erreurs n'est pas connue à l'avance — ce qui est le cas en pratique — le codage Reed-Solomon sait corriger $(n - k) / 2$ erreurs.

En général, un symbole sera un octet et donc m=8 (un octet fait huit bits). Souvent, on a $t = 8$ , $n = 255$ (un octet) et $k = 239$ .

$n$ étant souvent trop important en pratique, une partie des informations peut être remplacée par des zéros avant encodage et ne sera pas transmise, mais devra être ajoutée avant décodage. On parle dans ce cas de code Reed-Solomon raccourci (« shortened Reed-Solomon codes »).

Faiblesse

- Introduction - Vue d'ensemble - Description intuitive - Histoire - Applications - Propriétés - Faiblesse - Exemple - Utilisation dans un modem avec codeur convolutif