Loi normale - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Champ d'application

Une planche de Galton nous montre que la loi binomiale tend vers la loi normale

Le Théorème de Moivre-Laplace affirme la convergence d'une loi binomiale vers une loi de Gauss quand le nombre d'épreuves augmente. On peut alors utiliser la loi normale comme approximation d'une loi binomiale de paramètres (n ; p) pour n grand et p, 1 - p de même ordre de grandeur ; on approche alors cette loi binomiale par la loi normale ayant même espérance np et même variance np(1 − p).

On a dessiné ci-dessous :

  • la loi binomiale de paramètres (12;1 / 3) (diagramme en bâtons rouge) et la loi normale correspondante d'espérance 4 et de variance 8 / 3 (courbe verte)
Bernoulli12.png
  • la loi binomiale de paramètres (60;1 / 3) (diagramme en bâtons rouge) , et la loi normale correspondante d'espérance 20 et de variance 40 / 3 (courbe verte)
Bernoulli60.png

Le mathématicien Carl Friedrich Gauss a introduit cette loi pour le calcul d'erreurs.

En statistiques, de nombreux phénomènes suivent des distributions gaussiennes : données biométriques des individus (Adolphe Quetelet).

La loi normale générale

Soient \ T une variable aléatoire suivant la loi normale centrée réduite, et deux réels \mu,\, \sigma , où \ \sigma > 0.

On définit la variable aléatoire X = \sigma\, T + \mu , dont on note \ F la fonction de répartition.

On a \mathrm{E}(X) = \sigma\, \mathrm{E}(T) + \mu = \mu et \mathrm{V}(X) = \sigma^2\, \mathrm{V}(T) = \sigma^2 puisque \ \mathrm{E}(T)  = 0 et \ \mathrm{V}(T) = 1 .

Cherchons la loi de \ X  : pour tout x \in \R ,

F(x) = P(X \leq x) = P(\sigma\, T + \mu \leq x) = P\left(T \leq \frac{x - \mu}{\sigma}\right) = \Phi\left(\frac{x - \mu}{\sigma}\right) ,
puisque la fonction de répartition de \ T est \ \Phi .

Ainsi, \ F est continûment (et même indéfiniment) dérivable : \ X suit une loi à densité, et la dérivée \ f de \ F est une densité de probabilité de cette variable aléatoire ; pour tout x \in \R ,

f(x) = F'(x) = \frac{1}{\sigma}\, \Phi' \left(\frac{x - \mu}{\sigma}\right) = \frac{1}{\sigma}\, \varphi \left(\frac{x - \mu}{\sigma}\right) = \frac{1}{\sigma \sqrt{2\,\pi}}\, \mathrm{e}^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} .

Ceci légitime la définition suivante :

Définition

On appelle loi normale (ou gaussienne, ou de Laplace-Gauss) de paramètres \ \mu,\, \sigma^2 (où \ \sigma > 0) la loi de probabilité définie par la densité \ f : \R \to \R^+ , telle que pour tout x \in \R  :

f(x) = \frac{1}{\sigma}\, \varphi \left(\frac{x - \mu}{\sigma}\right) = \frac{1}{\sigma \sqrt{2\,\pi}}\, \mathrm{e}^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} .

Une variable gaussienne est une variable aléatoire réelle qui suit une loi normale de paramètres \ \mu,\, \sigma^2 (où \ \sigma est soit positive, soit nulle). Le cas où \ \sigma est nul est appelé cas dégénéré et correspond aux variables aléatoires constantes. Cette convention étrange est commode, voire indispensable (par exemple pour définir les vecteurs gaussiens).

Notation: cette loi est notée \mathcal{N}(\mu,\, \sigma^2)
La loi normale centrée réduite est notée \mathcal{N}(0,\, 1) .

On peut énoncer plusieurs propriétés, compte tenu de ce qui précède (le dernier point se démontrant de manière analogue).

Propriétés

Soit une variable aléatoire \ X qui suit la loi normale \mathcal{N}(\mu,\, \sigma^2) . Alors :

  • son espérance et sa variance existent et \ \mathrm{E}(X) = \mu , \ \mathrm{V}(X) = \sigma^2 > 0
  • sa fonction de répartition \ F est telle que pour tout x \in \R ,
F(x) = \Phi\left(\frac{x - \mu}{\sigma}\right)
  • la variable aléatoire X^\star = \frac{X - \mathrm{E}(X)}{\sqrt{\mathrm{V}(X)}} , c'est-à-dire X^\star = \frac{X - \mu}{\sigma} , suit la loi normale centrée réduite
  • si \ \alpha,\, \beta sont deux réels ( \ \alpha \neq 0 ), alors la variable aléatoire \ \alpha\, X + \beta suit la loi normale \mathcal{N}(\alpha\, \mu + \beta,\, \alpha^2\, \sigma^2)

Soit une variable aléatoire \ X qui suit la loi normale \mathcal{N}(\mu,\, \sigma^2) . Alors la variable aléatoire exp(X) (de loi dite log-normale) possède les propriétés suivantes:

  • son espérance existe et vaut \ \mathrm{E}[\exp(X)] = \exp\left( \mathrm{E}(X) + \frac{\mathrm{V}(X)}{2}\right) = \exp\left(\mu + \frac{\sigma^2}{2}\right)
  • sa variance existe et vaut \ \mathrm{V}[\exp(X)] = \exp( 2  \mathrm{E}(X) + \mathrm{V}(X))  \left[\exp( \mathrm{V}(X)) - 1\right] = \exp( 2  \mu + \sigma^2)  (\exp(\sigma^2) - 1)

Soit une variable aléatoire \ X suivant une loi normale \mathcal{N}(\mu_X,\, \sigma_X^2) et \ Y suivant une loi normale \mathcal{N}(\mu_Y,\, \sigma_Y^2) . Alors, la divergence de Kullback-Leibler entre ces deux distributions est de la forme :

  • D_{KL}(X\|Y) = \frac{1}{2} \left( \log \left( \frac{\sigma_Y^2}{\sigma_X^2} \right) + \frac{\sigma_X^2}{\sigma_Y^2} + \frac{(\mu_Y - \mu_X)^2}{\sigma_Y^2} - 1 \right)

Largeur à mi-hauteur

Lorsque l'on travaille sur une représentation graphique, on estime fréquemment la largeur de la gaussienne par sa largeur à mi-hauteur H (en anglais full width at half maximum, FWHM), qui est la largeur de la courbe à une altitude qui vaut la moitié de l'altitude du sommet. La largeur à mi-hauteur est proportionnelle à l'écart type :

H = 2 \sqrt{2\ \ln(2)}\ \sigma \simeq  2,3548 \sigma

Le facteur 2 sert à prendre en compte l'extension de la gaussienne dans les valeurs négatives.

Calcul de P(a ≤ X ≤ b)

Les résultats précédents permettent de ramener tout calcul de probabilité relatif à la loi normale \mathcal{N}(\mu,\, \sigma^2) à un calcul de probabilité relatif à la loi normale centrée réduite. On a vu qu'on dispose de tables donnant des approximations de valeurs de la fonction \ \Phi , tables qu'on utilise encore fréquemment, même si certaines calculatrices ou certains tableurs peuvent maintenant les remplacer.

Si la variable aléatoire \ X suit la loi normale \mathcal{N}(\mu,\, \sigma^2) , et si \ a,\, b sont deux réels tels que \ a \leq b , on a :

\ P(a \leq X \leq b) = F(b) - F(a) = \Phi\left(\frac{b - \mu}{\sigma}\right) - \Phi\left(\frac{a - \mu}{\sigma}\right)

Cas d'un intervalle centré à la moyenne, plages de normalité

  • Si t est un réel positif,
\ P(\mu - t\, \sigma \leq X \leq \mu + t\, \sigma) = \Phi(t) - \Phi(-t) = \Phi(t) - (1 - \Phi(t)) = 2\, \Phi(t) - 1
  • lorsque \ P(\mu - t\, \sigma \leq X \leq \mu + t\, \sigma) = \alpha , où \  \alpha \in\, ]0,\, 1[ ,
ce qui équivaut à \ 2\, \Phi(t) - 1 = \alpha , ou \ \Phi(t) = \frac{\alpha + 1}{2} ,
l'intervalle \ [\mu - t\, \sigma,\, \mu + t\, \sigma] = [\mathrm{E}(X) - t\, \sigma,\, \mathrm{E}(X) + t\, \sigma] est appelé plage de normalité au niveau de confiance α
(si par exemple, α = 0,95, on dit : "plage de normalité au niveau de confiance 95%" : en statistique, c'est un intervalle dans lequel se trouve 95% de la population lorsque la distribution est gaussienne).

Exemples numériques

Grâce à la table précédente, on obtient :

  • \ P(\mu - \sigma \leq X \leq \mu + \sigma) \simeq 0,6826  ;
l'intervalle [\mathrm{E}(X) - \sigma,\, \mathrm{E}(X) + \sigma] est la plage de normalité au niveau de confiance 68 %
  • \ P(\mu - 0,5H \leq X \leq \mu + 0,5H) \simeq 0,76..  ;
l'intervalle [\mathrm{E}(X) - 0,5H,\, \mathrm{E}(X) + 0,5H] (H étant la largeur à mi-hauteur) est la plage de normalité au niveau de confiance 76 %
  • \ P(\mu - 2\, \sigma \leq X \leq \mu + 2\, \sigma) \simeq 0,9544  ;
l'intervalle [\mathrm{E}(X) - 2\, \sigma,\, \mathrm{E}(X) + 2\, \sigma] est la plage de normalité au niveau de confiance 95 %
  • \ P(\mu - 3\, \sigma \leq X \leq \mu + 3\, \sigma) \simeq 0,9974  ;
l'intervalle [\mathrm{E}(X) - 3\, \sigma,\, \mathrm{E}(X) + 3\, \sigma] est la plage de normalité au niveau de confiance 99 %
Page générée en 0.163 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise