Densité de probabilité - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Densité de probabilité d'un vecteur aléatoire

Définition — On appelle densité de probabilité d'une variable aléatoire \scriptstyle\ X\ à valeur dans \scriptstyle\ \mathbb{R}^d une fonction \scriptstyle\ f\ telle que pour toute partie borélienne \scriptstyle\ A\subset \mathbb{R}^d,

\mathbb{P}(X\in A)= \int_{\mathbb{R}^d}\ 1_A(u)\,f(u)\,du= \int_{A}\ f(u)\,du.

Cette définition est en particulier valable pour \scriptstyle\ d=1, et est donc équivalente à la première définition, dans le cas particulier \scriptstyle\ d=1.

Il existe une définition (équivalente) en termes d'espérance mathématique :

Théorème —  Soit une variable aléatoire \scriptstyle\ X\ à valeur dans \scriptstyle\ \mathbb{R}^d , de densité \scriptstyle\ f, et soit \scriptstyle\ \varphi\ une fonction borélienne de \scriptstyle\ \mathbb{R}^d\ dans \scriptstyle\ \mathbb{R}. Alors, dès qu'un des deux termes de l'égalite suivante

\mathbb{E}\left[\varphi(X)\right]=\int_{\mathbb{R}^d}\ \varphi(u)\,f(u)\,du

a un sens, alors l'autre aussi, et l'égalité a lieu. Réciproquement, si l'égalité ci-dessus a lieu pour tout \scriptstyle\ \varphi\ borélien borné, alors \scriptstyle\ f\ est une densité de \scriptstyle\ X.

Il existe des variables aléatoires, réelles ou bien à valeurs dans \scriptstyle\ \mathbb{R}^d , qui ne possèdent pas de densité de probabilité, par exemple les variables aléatoires discrètes. Les variables aléatoires qui possèdent une densité de probabilité sont appelées parfois variables à densité, parfois variables continues.

Si une fonction \scriptstyle\ f\ est la densité de probabilité d'une variable aléatoire à valeur dans \scriptstyle\ \mathbb{R}^d , cette fonction vérifie les propriétés suivantes

  • \scriptstyle\ f\ est intégrable sur \scriptstyle\ \mathbb{R}^d  ;
  • \int_{\mathbb{R}^d}f(t)\,dt = 1  ;
  • \scriptstyle\ f\ est presque sûrement positive ou nulle sur \scriptstyle\ \mathbb{R}^d .

Réciproquement, si une fonction \scriptstyle\ f\ vérifie les 3 propriétés ci-dessus, on peut construire une variable aléatoire \scriptstyle\ X\ à valeur dans \scriptstyle\ \mathbb{R}^d ayant \scriptstyle\ f\ pour densité de probabilité.

Espérance, variance et moments d'une variable aléatoire réelle à densité

Soit \scriptstyle\ X\ une variable aléatoire réelle ayant une densité de probabilité \scriptstyle\ f\ . D'après le théorème de transfert, \scriptstyle\ X\ possède un moment d'ordre \scriptstyle\ k\ si et seulement si

\int_{-\infty}^{\infty}\ |t|^k\,f(t)\,dt <+\infty ;

on a dans ce cas

\mathbb{E}\left[X^k\right] = \int_{-\infty}^{\infty}\ t^k\,f(t)\,dt.

En particulier, lorsque le moment d'ordre 2 existe :

\mathbb{E}\left[X\right] = \int_{-\infty}^{\infty}\ t\,f(t)\,dt,
\mathbb{E}\left[X^2\right] = \int_{-\infty}^{\infty}\ t^2\,f(t)\,dt,

et, d'après le théorème de König-Huyghens,

V\left(X\right) = \int_{-\infty}^{\infty}\ t^2\,f(t)^2\,dt-\left(\int_{-\infty}^{\infty}\ t\,f(t)\,dt\right)^2.

Existence

En vertu du théorème de Radon-Nikodym, le vecteur aléatoire \scriptstyle\ Z\ possède une densité si et seulement si, pour chaque borélien \scriptstyle\ A\ de \scriptstyle\ \mathbb{R}^d\ dont la mesure de Lebesgue est nulle, on a

\mathbb{P}\left(Z\in A\right)=0.

Ce critère est rarement employé dans la pratique pour démontrer que \scriptstyle\ Z\ possède une densité, mais il est en revanche utile pour démontrer que certaines probabilités sont nulles. Par exemple, si le vecteur aléatoire \scriptstyle\ Z=(X,Y)\ possède une densité, alors

  • \mathbb{P}\left(X=Y\right)=0 ,
  • \mathbb{P}\left(X^2+Y^2=1\right)=0 ,
  • \mathbb{P}\left(Y=\varphi(X)\right)=0 ,
  • \mathbb{P}\left(\psi(X,Y)=0\right)=0 ,

pour des fonctions \scriptstyle\ \varphi\ et \scriptstyle\ \psi\ suffisamment régulières, parce que la mesure de Lebesgue (c'est-à-dire la surface) de la 1re bissectrice (resp. du cercle unité, du graphe de la fonction \scriptstyle\ \varphi, ou de la courbe d'équation \scriptstyle\ \psi=0 ) sont nulles.

Le critère de Radon-Nikodym peut aussi être utilisé pour démontrer qu'un vecteur aléatoire ne possède pas de densité : par exemple, si

Z=\left(\cos \Theta, \sin \Theta\right),

\scriptstyle\ \Theta\ désigne une variable aléatoire à valeur dans \scriptstyle\ [0,2\pi]\ (par exemple, si \scriptstyle\ Z\ est tiré au hasard uniformément sur le cercle unité, c'est-à-dire si \scriptstyle\ \Theta\ suit la loi uniforme sur \scriptstyle\ [0,2\pi]\ ), alors \scriptstyle\ Z\ ne possède pas de densité car

\mathbb{P}\left(X^2+Y^2=1\right)=1.

Cas des variables aléatoires réelles à densité

En spécialisant à d=1, on note que, parmi les boréliens \scriptstyle\ A\ de \scriptstyle\ \mathbb{R}\ dont la mesure de Lebesgue est nulle, figurent en particulier les parties finies de \scriptstyle\ \mathbb{R}.\ Donc une variable aléatoire réelle X à densité vérifie, en particulier :

\mathbb{P}\left(X=x\right)=0,

pour tout nombre réel x, et, par conséquent,

\mathbb{P}\left(a\le X\le b\right)=\mathbb{P}\left(a\le X<b\right)=\mathbb{P}\left(a<X\le b\right)=\mathbb{P}\left(a<X<b\right).

Il suit que les variables aléatoires réelles à densité ont nécessairement une fonction de répartition continue sur \scriptstyle\ \mathbb{R}.\ La continuité de la fonction de répartition n'est pas, toutefois, une propriété caractéristique des variables aléatoires réelles à densité, comme le montre l'exemple de l'escalier de Cantor.

Non-unicité de la densité de probabilité

Si \scriptstyle\ f\ et \scriptstyle\ g\ sont deux densités de probabilités de la même variable aléatoire \scriptstyle\ X, alors \scriptstyle\ f\ et \scriptstyle\ g\ sont égales presque partout. Réciproquement, si g est presque partout égale à une densité de probabilité de \scriptstyle\ X, alors g est une densité de probabilité de \scriptstyle\ X. Ainsi une variable aléatoire à densité possède-t-elle toujours une infinité de densités de probabilité : par exemple, en perturbant l'une des densités de \scriptstyle\ X\ de manière arbitraire en un nombre fini de points, on obtient encore une densité de \scriptstyle\ X.

Densité jointe de plusieurs variables aléatoires réelles

La fonction \scriptstyle\ g\ définie de \scriptstyle\ \mathbb{R}^d\ dans \scriptstyle\ \mathbb{R}\ est une densité jointe de la suite de variables aléatoires réelles \scriptstyle\ \left(Z_1,Z_2,\dots,Z_d\right)\ si \scriptstyle\ g\ est une densité de probabilité du vecteur aléatoire \scriptstyle\ Z\ à valeurs dans \scriptstyle\ \mathbb{R}^d, défini par

Z=\left(Z_1,Z_2,\dots,Z_d\right).

On peut alors calculer la probabilité d'événements concernant les variables aléatoires réelles \scriptstyle\ \left(Z_1,Z_2,\dots,Z_d\right)\ de la manière suivante :

Exemple  :

Si \scriptstyle\ d=2, \scriptstyle\ \mathbb{P}(Z_2\le Z_1)\ s'écrit \scriptstyle\ \mathbb{P}(Z\in A), \scriptstyle\ A\ désigne le demi-plan sous la première bissectrice \scriptstyle\ A=\{(x,y)\in\mathbb{R}^2\,|\,y\le x\}. On a alors, par définition de la densité,

\begin{align} \mathbb{P}(Z_2\le Z_1) &= \int_A\,g(z_1,z_2)dz_1\,dz_2, \\ &= \int_{\mathbb{R}^2}\,1_A(z_1,z_2)g(z_1,z_2)dz_1\,dz_2, \\ &= \int_{\mathbb{R}^2}\,1_{z_2\le z_1}g(z_1,z_2)dz_1\,dz_2. \end{align}

Si par exemple \scriptstyle\ Z_1\ et \scriptstyle\ Z_2\ sont indépendants et ont même densité de probabilité \scriptstyle\ f, alors une densité de \scriptstyle\ Z\ est \scriptstyle\ g=f\otimes f\ , c'est-à-dire une densité de \scriptstyle\ Z\ est \scriptstyle\ g\ défini par \scriptstyle\ g(z_1,z_2)=f(z_1)f(z_2)\ . En ce cas,

\begin{align} \mathbb{P}(Z_2\le Z_1) &= \int_{\mathbb{R}^2}\,1_{z_2\le z_1}f(z_1)f(z_2)dz_1\,dz_2, \\ &= \int_{\mathbb{R}}\,\left(\int_{-\infty}^{z_1}f(z_2)\,dz_2\right)f(z_1)dz_1, \\ &= \int_{\mathbb{R}}F(z_1)f(z_1)dz_1 \\ &= \frac12\left[F^2\right]_{-\infty}^{+\infty}=\frac12. \end{align}

Si par contre \scriptstyle\ Z_2=Z_1\ p.s., le vecteur \scriptstyle\ (Z_1,Z_2)\ a les mêmes lois marginales ( \scriptstyle\ Z_1\ et \scriptstyle\ Z_2\ ont \scriptstyle\ f\ pour densité de probabilité), mais n'a pas la même loi jointe, puisqu'alors \scriptstyle\ \mathbb{P}(Z_2\le Z_1)=1. Ainsi la donnée des densités marginales de \scriptstyle\ Z_1\ et \scriptstyle\ Z_2, seules, ne permet pas de calculer la probabilité d'événements faisant intervenir à la fois \scriptstyle\ Z_1\ et \scriptstyle\ Z_2, comme par exemple l'évènement \scriptstyle\ \{Z_2\le Z_1\}. Pour effectuer le calcul, on utilise ordinairement la loi jointe de \scriptstyle\ Z_1\ et \scriptstyle\ Z_2, définie dans le cas ci-dessus par leur densité jointe.

Densité marginale

Soit \scriptstyle\ Z\ un vecteur aléatoire à valeurs dans \scriptstyle\ \mathbb{R}^2\ de densité \scriptstyle\ f_Z\ et pour \scriptstyle\ \omega\in\Omega, soit \scriptstyle\ X(\omega)\ et \scriptstyle\ Y(\omega)\ les deux coordonnées de \scriptstyle\ Z(\omega)\ . On notera

\ Z=(X,Y).

Alors

Propriété — Les variables aléatoires réelles \scriptstyle\ X\ et \scriptstyle\ Y\ possèdent toutes deux des densités, notons les \scriptstyle\ f_X\ et \scriptstyle\ f_Y\ , et ces densités sont données par

\begin{align}f_X(x)&= \int_{\mathbb{R}}\ f_Z(x,y)\,dy,\\f_Y(y)&= \int_{\mathbb{R}}\ f_Z(x,y)\,dx.\end{align}

Les densités de probabilités \scriptstyle\ f_X\ et \scriptstyle\ f_Y\ sont appelées les densités marginales de \scriptstyle\ f_Z.

Plus généralement, si \scriptstyle\ f\ définie de \scriptstyle\ \mathbb{R}^d\ dans \scriptstyle\ \mathbb{R}\ est une densité jointe de :

Z=\left(Z_1,Z_2,\dots,Z_d\right),

on peut calculer une densité \scriptstyle\ g\ de (par exemple) \scriptstyle\ Y=\left(Z_2,Z_5,Z_6\right)\ de la manière suivante (si \scriptstyle\ d=8, par exemple) :

 g(x_2,x_5,x_6) = \int_{\mathbb{R}^5}\ f(x_1,x_2,\dots,x_8)\,dx_1dx_3dx_4dx_7dx_8,

c'est-à-dire en intégrant par rapport à toutes les coordonnées qui ne figurent pas dans le triplet \scriptstyle\ Y. La fonction \scriptstyle\ g\ est elle aussi appelée « densité marginale » ou « marginale » de \scriptstyle\ f. Une formulation générale serait lourde. La démonstration générale est calquée sur la démonstration de la propriété ci-dessus.

Densité de la médiane de 9 variables i.i.d. (ter)  :

La densité jointe des 9 statistiques d'ordre, notées ici \scriptstyle\ (Z_i)_{1\le i\le 9}, de l'échantillon \scriptstyle\ (X_i)_{1\le i\le 9}, est donnée par :

g(z)= 9!\ \prod_{i=1}^9 f(z_i)\ 1_{z_1<z_2<z_3<\dots<z_9}.

Par définition des statistiques d'ordre, la médiane \scriptstyle\ M\ est aussi la 5-ème statistique d'ordre, \scriptstyle\ Z_5. On a donc :

f_M(z_5)=\int_{\mathbb{R}^8}g(z)dz_1dz_2dz_3dz_4dz_6dz_7dz_8dz_9.

Ainsi, de proche en proche,

 \begin{align} \int_{\mathbb{R}}g(z)dz_1 &= 9!\ F(z_2)\ \prod_{i=2}^9 f(z_i)\ 1_{z_2<z_3<\dots<z_9}, \\ \int_{\mathbb{R}^2}g(z)dz_1\,dz_2 &= \frac{9!}{2!}\ F(z_3)^2\ \prod_{i=3}^9 f(z_i)\ 1_{z_3<\dots<z_9}, \\ \int_{\mathbb{R}^4}g(z)dz_1\,dz_2\,dz_3\,dz_4 &= \frac{9!}{4!}\ F(z_5)^4\ \prod_{i=5}^9 f(z_i)\ 1_{z_5<\dots<z_9}, \\ \int_{\mathbb{R}^4}g(z)dz_1\,dz_2\,dz_3\,dz_4\,dz_9 &= \frac{9!}{4!1!}\ F(z_5)^4\ \left(1-F(z_8)\right)\ \prod_{i=5}^8 f(z_i)\ 1_{z_5<\dots<z_8}, \\ f_M(z_5) &= \frac{9!}{4!4!}F(z_5)^4\left(1-F(z_5)\right)^4f(z_5). \end{align}

Indépendance des variables aléatoires à densité

Soit une suite \scriptstyle\ X=(X_1, X_2, \dots,X_n) de variables aléatoires réelles définies sur le même espace de probabilité \scriptstyle\ (\Omega, \mathcal{A}, \mathbb{P}).\

Théorème — 

  • Si \scriptstyle\ X\ possède une densité de probabilité \scriptstyle\ f:\R^n\rightarrow [0,+\infty[\ qui s'écrit sous forme « produit » :
\forall x=(x_1,\dots,x_n)\in\R^n,\qquad f(x)\ =\  \prod_{i=1}^ng_i(x_i),
où les fonctions \scriptstyle\ g_i\ sont boréliennes et positives ou nulles, alors \scriptstyle\ X\ est une suite de variables indépendantes. De plus, la fonction \scriptstyle\ f_i\ définie par
f_i(x)\ =\  \frac{g_i(x)}{\int_{\R}g_i(u)du}
est une densité de la composante \scriptstyle\ X_i.\
  • Réciproquement, si \scriptstyle\ X\ est une suite de variables aléatoires réelles indépendantes de densités de probabilité respectives \scriptstyle\ f_i,\ alors \scriptstyle\ X\ possède une densité de probabilité, et la fonction \scriptstyle\ f\ définie par
\forall (x_1,\dots,x_n)\in\R^n,\qquad f(x_1,\dots,x_n)\ =\  \prod_{i=1}^nf_i(x_i),
est une densité de probabilité de \scriptstyle\ X.\
Page générée en 0.216 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise