Théorie de l'information - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

- Introduction - L'information selon Shannon, un concept de la physique mathématique - Développement de la théorie mathématique de l'information - Le statut physique de la théorie de l’information - Contenu d'information et contexte - Exemples d'information - Mesure de la quantité d'information

Mesure de la quantité d'information

Quantité d'information : cas élémentaire

Considérons $N$ boîtes numérotées de 1 à $N$ . Un individu A a caché au hasard un objet dans une de ces boîtes. Un individu B doit trouver le numéro de la boîte où est caché l'objet. Pour cela, il a le droit de poser des questions à l'individu A auxquelles celui-ci doit répondre sans mentir par OUI ou NON. Mais chaque question posée représente un coût à payer par l'individu B (par exemple un euro). Un individu C sait dans quelle boîte est caché l'objet. Il a la possibilité de vendre cette information à l'individu B. B n'acceptera ce marché que si le prix de C est inférieur ou égal au coût moyen que B devrait dépenser pour trouver la boîte en posant des questions à A. L'information détenue par C a donc un certain prix. Ce prix représente la quantité d'information représentée par la connaissance de la bonne boîte : c'est le nombre moyen de questions à poser pour identifier cette boîte. Nous la noterons I.

EXEMPLE :

Si $N = 1$ , $I = 0$ . Il n'y a qu'une seule boîte. Aucune question n'est nécessaire.

Si $N = 2$ , $I = 1$ . On demande si la bonne boîte est la boîte n°1. La réponse OUI ou NON détermine alors sans ambiguïté quelle est la boîte cherchée.

Si $N = 4$ , $I = 2$ . On demande si la boîte porte le n°1 ou 2. La réponse permet alors d'éliminer deux des boîtes et il suffit d'une dernière question pour trouver quelle est la bonne boîte parmi les deux restantes.

Si $N = 2 k$ , $I = k$ . On écrit les numéros des boîtes en base 2. Les numéros ont au plus $k$ chiffres binaires, et pour chacun des rangs de ces chiffres, on demande si la boîte cherchée possède le chiffre 0 ou le chiffre 1. En $k$ questions, on a déterminé tous les chiffres binaires de la bonne boîte. Cela revient également à poser $k$ questions, chaque question ayant pour but de diviser successivement le nombre de boîtes considérées par 2 (méthode de dichotomie).

On est donc amené à poser $I = l o g 2 (N)$ , mais cette configuration ne se produit que dans le cas de $N$ événements équiprobables.

Quantité d'information relative à un évènement

Supposons maintenant que les boîtes soient colorées, et qu'il y ait $n$ boîtes rouges. Supposons également que C sache que la boîte où est caché l'objet est rouge. Quel est le prix de cette information? Sans cette information, le prix à payer est $l o g (N)$ . Muni de cette information, le prix à payer n'est plus que $l o g (n)$ . Le prix de l'information « la boîte cherchée est rouge » est donc $l o g (N) - l o g (n) = l o g (N / n)$ .

On définit ainsi la quantité d'information comme une fonction croissante de $\frac{N}{n}$ avec :

$N$ le nombre d'évènements possibles
$n$ le nombre d'éléments du sous-ensemble délimité par l'information

Afin de mesurer cette quantité d'information, on pose : $I = log_{2} \left (\frac{N}{n} \right)$

$I$ est exprimé en bit (ou logon, unité introduite par Shannon^{[citation nécessaire]}, de laquelle, dans les faits, bit est devenu un synonyme), ou bien en nat si on utilise le logarithme naturel à la place du logarithme de base 2.

Cette définition se justifie, car l'on veut les propriétés suivantes :

l'information est comprise entre 0 et ∞ ;
un évènement avec peu de probabilité représente beaucoup d'information (exemple : « Il neige en janvier » contient beaucoup moins d'information que « Il neige en août » pour peu que l'on soit dans l'hémisphère nord) ;
l'information doit être additive.

Remarque : lorsqu'on dispose de plusieurs informations, la quantité d'information globale n'est pas la somme des quantités d'information. Ceci est dû à la présence du logarithme. Voir aussi : information mutuelle, information commune à deux messages, qui, dans l'idée, explique cette « sous-additivité » de l'information.

Entropie, formule de Shannon

Supposons maintenant que les boîtes soient de diverses couleurs : n₁ boîtes de couleur C₁, n₂ boîtes de couleur C₂, ..., n_k boîtes de couleurs C_k, avec n₁ + n₂ + ... + n_k = N. La personne C sait de quelle couleur est la boîte recherchée. Quel est le prix de cette information ?

L'information « la boîte est de couleur C₁ » vaut log N/n₁, et cette éventualité a une probabilité n₁/N. L'information « la boîte est de couleur C2 » vaut log N/n₂, et cette éventualité a une probabilité n₂/N...

Le prix moyen de l'information est donc n₁/N log N/n₁ + n₂/N log N/n₂ + ... + n_k/N log N/n_k. Plus généralement, si on considère k évènements disjoints de probabilités respectives p₁, p₂, ..., p_k avec p₁ + p₂ + ... + p_k = 1, alors la quantité d'information correspondant à cette distribution de probabilité est p₁ log 1/p₁ + ... + p_k log 1/p_k. Cette quantité s'appelle entropie de la distribution de probabilité.

L'entropie permet donc de mesurer la quantité d'information moyenne d'un ensemble d'évènements (en particulier de messages) et de mesurer son incertitude. On la note $H$ :

avec $p_i = \frac{n_i}{N}$ la probabilité associée à l'apparition de l'évènement $i$ .

Codage de l'information

On considère une suite de symboles. Chaque symbole peut prendre deux valeurs s₁ et s₂ avec des probabilités respectivement p₁ = 0,8 et p₂ = 0,2. La quantité d'information contenue dans un symbole est :
$p_1 \times \log_2\frac{1}{p_1} + p_2 \times \log_2\frac{1}{p_2} \approx 0,7219$
Si chaque symbole est indépendant du suivant, alors un message de N symboles contient en moyenne une quantité d'information égale à 0,72N. Si le symbole s₁ est codé 0 et le symbole s₂ est codé 1, alors le message a une longueur de N, ce qui est une perte par rapport à la quantité d'information qu'il porte. Les théorèmes de Shannon énoncent qu'il est impossible de trouver un code dont la longueur moyenne soit inférieure à 0,72N, mais qu'il est possible de coder le message de façon à ce que le message codé ait en moyenne une longueur aussi proche que l'on veut de 0,72N lorsque N augmente.

Par exemple, on regroupe les symboles trois par trois et on les code comme suit :

symboles à coder	probabilité du triplet	codage du triplet	longueur du code
s₁s₁s₁	0.8³ = 0.512	0	1
s₁s₁s₂	0.8² × 0.2 = 0.128	100	3
s₁s₂s₁	0.8² × 0.2 = 0.128	101	3
s₂s₁s₁	0.8² × 0.2 = 0.128	110	3
s₁s₂s₂	0.2² × 0.8 = 0.032	11100	5
s₂s₁s₂	0.2² × 0.8 = 0.032	11101	5
s₂s₂s₁	0.2² × 0.8 = 0.032	11110	5
s₂s₂s₂	0.2³ = 0.008	11111	5

Le message s₁s₁s₁s₁s₁s₂s₂s₂s₁ sera codé 010011110.

La longueur moyenne du code d'un message de N symboles est : ${N \over 3}(0.512 + 3 \times 0.128 \times 3 + 3 \times 0.032 \times 5 + 0.008 \times 5) = 0,728N$

Voir l'article détaillé : théorie des codes.

Exemples d'information

✨ Pourquoi les étoiles paraissent plus brillantes l'été ?

🌱 Comment les plantes résistent-elles à une lumière trop intense ?

⚫ Une IA révèle que le trou noir supermassif de notre galaxie pointe vers la Terre

🏔️ Découverte d'un monde perdu sous l'Antarctique

🌍 Découverte: cette règle universelle régit toute vie sur terre

⏳ L'Univers pourrait disparaître plus tôt que prévu: ce que révèle cette étude

🌍 Les dernières mesures révèlent un niveau de CO₂ jamais vu depuis 4 millions d'années

🛡️ Le paradoxe des gangs de rue

💰 Quelle quantité d'or existe-t-il vraiment sur Terre ?

🦟 Pourquoi les moustiques sont plus nombreux et piquent davantage en été ?

⚫ Ces trous noirs interagissent avec la lumière fossile du Big Bang

🦕 Et si les dinosaures détenaient le secret pour vaincre le cancer ?

😎 Comment font les lunettes de soleil pour filtrer les UV ?

🚶‍♂️‍➡️ La marche des babouins éclaire l'évolution de la bipédie humaine

🔭 James Webb capture cette image directe d'une étrange planète à 60 années-lumière

🦋 Pourquoi et comment les chenilles deviennent-elles des papillons ?

🔭 Voici la plus grande carte de l'Univers. Ses révélations sont surprenantes !

😴 Penser que l'on est éveillé alors que l'on dort, normal ?

🌊 Ce cratère raconte l'histoire de l'eau sur Mars

🐝 Comment les fleurs attirent-elles les insectes pollinisateurs ?

💥 La collision entre notre Voie lactée et la galaxie d'Andromède remise en question

🎶 Pourquoi les oiseaux chantent-ils autant et si fort au printemps ?

💡 Générer de la lumière à partir du vide, c'est possible

Découverte d'un deuxième système d'apprentissage dans le cerveau

☀️ Comment se produit un coup de chaleur et comment s'en protéger ?

⚽ Comment fonctionne la physique d'un tir puissant au foot ?

🧠 Un algorithme révèle comment notre cerveau se motive

🔭 Une si grande planète orbite une si petite étoile, comment est-ce possible ?

🐋 Les baleines développent de nouvelles méthodes pour communiquer avec nous

🥚 Le noyau de Mars sent l'œuf pourri

🧠 On sait enfin pourquoi le sémaglutide fait maigrir

🌱 La vie pourrait renaître sur Europe après la mort de la Terre

🌿 Confirmation scientifique: ce remède ancestral fait naturellement maigrir, et pas qu'un peu !

💥 Des astronomes identifient les plus puissantes explosions depuis le Big Bang

🦕 Ce crâne de stégosaure, le plus complet jamais découvert, réécrit l'histoire

🛏️ Les punaises de lit, ces compagnons indésirables depuis la préhistoire

🕸️ Connaissez-vous la toile cosmique, l'architecte de l'Univers ?

🌋 L'éruption de l'Etna vue depuis l'espace

🐋 Il y a 20 000 ans, l'Homme fabriquait des outils avec des os de baleines

🟠 Quel est le rôle de ce labyrinthe sur Mars ?

🎯 Cette stratégie innovante contre le cancer du sein offre une survie de 100%

💥 Le pulsar à trou noir: un objet qui intrigue les astrophysiciens

🐒 Première: ces singes kidnappent les bébés d'une autre espèce

🌍 Découverte d'une super-Terre à l'habitabilité intermittente

🧠 Ces cellules pourraient jouer un rôle bien plus important que les neurones dans la mémoire

🛰️ Une carte photographique de la Terre toutes les 35 minutes

Pourquoi l'oxygène est-il si indispensable à autant d'êtres vivants ?

🐱 Pourquoi certains chats miaulent et ronronnent plus que d'autres ?

Découverte: un antidouleur sans effets secondaires

🤔 Ces expériences remettent en question un concept fondamental de la thermodynamique

Page générée en 0.084 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise