Code de Lehmer - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Définition

Le code de Lehmer, attribué à Derrick Lehmer, mais connu depuis 1888 au moins, associe à une permutation  σ  des éléments de \scriptstyle\ [\![1,n]\!]\ l'application  ƒ=L(σ)  définie sur \scriptstyle\ [\![1,n]\!]\ par

f(i)=\text{Card}\left\{j\ |\ 1\le j\le i\text{ et }\sigma(j)\le\sigma(i)\right\}=L(\sigma,i).

Les applications ƒ, encodant des permutations de \scriptstyle\ \mathfrak{S}_n,\ peuvent être identifiées aux suites \scriptstyle\ \left(f(i)\right)_{1\le i\le n}.\ Comme

1\le f(i)\le i,

le code de Lehmer établit une correspondance L entre l'ensemble \scriptstyle\ \mathfrak{S}_n\ et le produit cartésien

[\![1,1]\!]\times[\![1,2]\!]\times[\![1,3]\!]\times\dots\times[\![1,n]\!].

Applications en combinatoire et en probabilités

Indépendance des rangs relatifs

Ces applications découlent d'une propriété immédiate du code de Lehmer L(σ) vu comme suite de nombres entiers.

Propriété — Sous la loi uniforme sur \scriptstyle\ \mathfrak{S}_n,\ L est une suite de variables indépendantes et uniformes ; L(i) suit la loi uniforme sur \scriptstyle\ [\![1,i]\!]\ .

En d'autres termes, si on tire une permutation ω au hasard dans \scriptstyle\ \mathfrak{S}_n,\ avec équiprobabilité (chaque permutation a une probabilité 1/n! d'être choisie), alors son code de Lehmer ƒ=L(ω)=(L(1,ω), L(2,ω), L(3,ω), ... , L(n,ω)) est une une suite de variables aléatoires indépendantes et uniformes. L'indépendance des composantes de L résulte d'un principe général concernant les variables aléatoires uniformes sur un produit cartésien.

Nombre de records

Définition — Dans une suite u=(uk)1≤k≤n, il y a record vers le bas (resp. vers le haut) au rang k si uk est strictement plus petit (resp. strictement plus grand) que chaque terme ui tel que i.

Soit B(k) (resp. H(k)) l'évènement "il y a record vers le bas (resp. vers le haut) au rang k" , i.e. B(k) est l'ensemble des permutations de \scriptstyle\ \mathfrak{S}_n\ qui présentent un record vers le bas au rang k. On a clairement

\{\omega\in B(k)\}\Leftrightarrow\{L(k,\omega)=1\}\quad\text{et}\quad\{\omega\in H(k)\}\Leftrightarrow\{L(k,\omega)=k\}.

Ainsi le nombre Nb(ω) (esp. Nh(ω)) de records vers le bas (resp. vers le haut) de la permutation ω s'écrit comme une somme de variables de Bernoulli indépendantes de paramètres respectifs 1/k :

N_b(\omega)=\sum_{1\le k\le n}\ 1\!\!1_{B(k)}\quad\text{et}\quad N_b(\omega)=\sum_{1\le k\le n}\ 1\!\!1_{H(k)}.

En effet, comme L(k) suit la loi uniforme sur \scriptstyle\ [\![1,k]\!],\

\mathbb{P}(B(k))=\mathbb{P}(L(k)=1)=\mathbb{P}(H(k))=\mathbb{P}(L(k)=k)=\tfrac1k.

La fonction génératrice de la variable de Bernoulli 1\!\!1_{B(k)} est

G_k(s)=\frac{k-1+s}k,

donc la fonction génératrice de Nb est

G(s)=\prod_{k=1}^nG_k(s)\ =\ \frac{(s)_{\uparrow n}}{n!},

ce qui permet de retrouver la forme produit de la série génératrice des nombres de Stirling de première espèce (non signés).

Nombre de cycles

La correspondance fondamentale de Foata entraine que la loi de probabilité de Nb est aussi la loi du nombre de cycles de la décomposition d'une permutation tirée au hasard.

Problème des secrétaires

Il s'agit d'un problème d'arrêt optimal, classique en théorie de la décision, statistiques et probabilités appliquées, où une permutation aléatoire est dévoilée progressivement à travers les premiers termes de son code de Lehmer, et où il faut s'arrêter exactement à la valeur k telle que σ(k)=n, alors que la seule information disponible (les k premières valeurs du code de Lehmer) ne permet pas de calculer σ(k). En termes moins mathématiques, une série de n candidats sont présentés, l'un après l'autre, à un recruteur, qui doit recruter le meilleur, mais doit prendre sa décision ("je passe" ou "je recrute") au moment où le candidat lui est présenté, sans attendre d'avoir vu le candidat suivant (a fortiori, sans avoir vu tous les candidats). Le recruteur connait donc le rang du candidat présenté en k-ème position parmi les k candidats qu'il a déjà vu, donc, au moment de prendre sa k-ème décision ("je passe" ou "je recrute"), le recruteur connait les k premiers termes du code de Lehmer, alors qu'il aurait besoin de connaître la permutation : le recruteur aurait besoin de connaître tous les termes du code de Lehmer pour prendre une décision bien informée. Pour déterminer la stratégie optimale (optimisant la probabilité de gagner), les propriétés statistiques du code de Lehmer sont cruciales. Johannes Kepler aurait exposé clairement le problème des secrétaires à un ami au moment où il a entrepris de choisir sa seconde femme parmi 11 épouses potentielles (choix qu'il voulait faire très méticuleusement, son premier mariage, malheureux, ayant été arrangé sans qu'il ait été consulté).

Page générée en 0.134 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique
Version anglaise | Version allemande | Version espagnole | Version portugaise