Loi de Dirichlet - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Introduction

En probabilité et statistiques, la loi de Dirichlet, souvent notée Dir(α), est une famille de lois de probabilité continues pour des variables aléatoires multinomiales. Cette loi (ou encore distribution) est paramétrée par le vecteur α de nombres réels positifs et tire son nom de Johann Peter Gustav Lejeune Dirichlet. Elle est vue comme la généralisation multinomiale de la loi bêta.

Densité de probabilité

La loi de Dirichlet d'ordre K ≥ 2 de paramètres α1, ..., αK > 0 possède pour densité de probabilité :

f(x_1,\dots, x_{K}; \alpha_1,\dots, \alpha_K) = \frac{1}{\mathrm{B}(\alpha)} \prod_{i=1}^K x_i^{\alpha_i - 1}

pour tous les x1, ..., xK > 0 vérifiant x1 + ... + xK-1 < 1, où xK est une abréviation pour 1 – x1 – ... – xK–1. La densité est nulle en dehors de ce simplexe ouvert de dimension (K − 1).

La constante de normalisation est la fonction bêta multinomiale, qui s'exprime à l'aide de la fonction gamma :

\mathrm{B}(\alpha) = \frac{\prod_{i=1}^K \Gamma(\alpha_i)}{\Gamma\bigl(\sum_{i=1}^K \alpha_i\bigr)},\qquad\alpha=(\alpha_1,\dots,\alpha_K).

Distributions associées

  • Si, pour
indépendamment
alors
et
Bien que les Xi ne sont pas indépendants, ils peuvent néanmoins générer un échantillon de K variables aléatoires, distribuées selon une distribution Gamma. Malheureusement, puisque la somme V est perdue lors de la génération de X = (X1, ..., XK), il n'est pas possible de retrouver les variables Gamma initiales.

Propriétés

Soit , signifiant que les K – 1 premières composantes possèdent la distribution précédente et que

Posons . Alors

et

En fait, les densités marginales sont des lois bêta :

Qui plus est,

\mathrm{Cov}[X_iX_j] = -\frac{\alpha_i \alpha_j}{\alpha_0^2 (\alpha_0+1)}.

Le mode de la distribution est le vecteur (x1, ..., xK) avec

 x_i = \frac{\alpha_i - 1}{\alpha_0 - K}, \quad \alpha_i > 1.

Agrégation

Si ,alors . Cette propriété d'agrégation permet d'obtenir la distribution marginale de Xi mentionnée plus haut.

Interprétations intuitives des paramètres

Découpage d'une ficelle

Une illustration de la distribution de Dirichlet apparaît lorsque l'on désire découper des ficelles (toutes de longueur initiale 1.0) en K pièces de différentes longueurs, où chaque pièce a, en moyenne, une longueur désignée mais cette longueur est autorisée à varier. Les valeurs α/α0 spécifient les longueurs moyennes des découpes résultant de la distribution. La variance (disparité autour de la moyenne) varie inversement avec α0.

Example of Dirichlet(1/2,1/3,1/6) distribution

Urne

Considérons une urne contenant K différentes couleurs. Initialement, l'urne contient α1 boules de couleur 1, α2 boules de couleur 2, etc.. Procédons alors à N tirages dans l'urne, et la balle tirée est replacée dans l'urne, en ajoutant dans l'urne une boule supplémentaire de même couleur. Lorsque N devient très grand, les proportions des boules de différente couleur sont distribuées selon .

Notons que chaque tirage modifie la probabilité d'obtenir une couleur donnée. Cette modification s'atténue d'ailleurs avec le nombre de tirages, puisque l'effet marginal d'ajout une boule supplémentaire diminue lorsque l'urne contient de plus en plus de boules.

Page générée en 0.127 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales - Signaler un contenu
Version anglaise | Version allemande | Version espagnole | Version portugaise