Une planche de Galton nous montre que la loi binomiale tend vers la loi normale
Le Théorème de Moivre-Laplace affirme la convergence d'une loi binomiale vers une loi de Gauss quand le nombre d'épreuves augmente. On peut alors utiliser la loi normale comme approximation d'une loi binomiale de paramètres (n ; p) pour n grand et p, 1 - p de même ordre de grandeur ; on approche alors cette loi binomiale par la loi normale ayant même espérance np et même variancenp(1 − p).
On a dessiné ci-dessous :
la loi binomiale de paramètres (12;1 / 3) (diagramme en bâtons rouge) et la loi normale correspondante d'espérance 4 et de variance 8 / 3 (courbe verte)
la loi binomiale de paramètres (60;1 / 3) (diagramme en bâtons rouge) , et la loi normale correspondante d'espérance 20 et de variance 40 / 3 (courbe verte)
En statistiques, de nombreux phénomènes suivent des distributions gaussiennes : données biométriques des individus (Adolphe Quetelet).
La loi normale générale
Soient
une variable aléatoire suivant la loi normale centrée réduite, et deux réels
, où .
On définit la variable aléatoire
, dont on note
la fonction de répartition.
On a
et
puisque
et
.
Cherchons la loi de
: pour tout
,
,
puisque la fonction de répartition de
est
.
Ainsi,
est continûment (et même indéfiniment) dérivable :
suit une loi à densité, et la dérivée
de
est une densité de probabilité de cette variable aléatoire ; pour tout
,
On appelle loi normale (ou gaussienne, ou de Laplace-Gauss) de paramètres
(où ) la loi de probabilité définie par la densité
, telle que pour tout
:
.
Une variable gaussienne est une variable aléatoire réelle qui suit une loi normale de paramètres
(où
est soit positive, soit nulle). Le cas où
est nul est appelé cas dégénéré et correspond aux variables aléatoires constantes. Cette convention étrange est commode, voire indispensable (par exemple pour définir les vecteurs gaussiens).
Notation: cette loi est notée
La loi normale centrée réduite est notée
.
On peut énoncer plusieurs propriétés, compte tenu de ce qui précède (le dernier point se démontrant de manière analogue).
Propriétés
Soit une variable aléatoire
qui suit la loi normale
. Alors :
son espérance et sa variance existent et
,
sa fonction de répartition
est telle que pour tout
,
la variable aléatoire
, c'est-à-dire
, suit la loi normale centrée réduite
si
sont deux réels (
), alors la variable aléatoire
suit la loi normale
Soit une variable aléatoire
qui suit la loi normale
. Alors la variable aléatoire exp(X) (de loi dite log-normale) possède les propriétés suivantes:
son espérance existe et vaut
sa variance existe et vaut
Soit une variable aléatoire
suivant une loi normale
et
suivant une loi normale
. Alors, la divergence de Kullback-Leibler entre ces deux distributions est de la forme :
Lorsque l'on travaille sur une représentation graphique, on estime fréquemment la largeur de la gaussienne par sa largeur à mi-hauteur H (en anglais full width at half maximum, FWHM), qui est la largeur de la courbe à une altitude qui vaut la moitié de l'altitude du sommet. La largeur à mi-hauteur est proportionnelle à l'écart type :
Le facteur 2 sert à prendre en compte l'extension de la gaussienne dans les valeurs négatives.
Calcul de P(a ≤ X ≤ b)
Les résultats précédents permettent de ramener tout calcul de probabilité relatif à la loi normale
à un calcul de probabilité relatif à la loi normale centrée réduite. On a vu qu'on dispose de tables donnant des approximations de valeurs de la fonction
, tables qu'on utilise encore fréquemment, même si certaines calculatrices ou certains tableurs peuvent maintenant les remplacer.
Si la variable aléatoire
suit la loi normale
, et si
sont deux réels tels que
, on a :
Cas d'un intervalle centré à la moyenne, plages de normalité
Si t est un réel positif,
lorsque
, où
,
ce qui équivaut à
, ou
,
l'intervalle
est appelé plage de normalité au niveau de confiance α
(si par exemple, α = 0,95, on dit : "plage de normalité au niveau de confiance 95%" : en statistique, c'est un intervalle dans lequel se trouve 95% de la population lorsque la distribution est gaussienne).
Exemples numériques
Grâce à la table précédente, on obtient :
;
l'intervalle
est la plage de normalité au niveau de confiance 68 %
;
l'intervalle
(H étant la largeur à mi-hauteur) est la plage de normalité au niveau de confiance 76 %
;
l'intervalle
est la plage de normalité au niveau de confiance 95 %
;
l'intervalle
est la plage de normalité au niveau de confiance 99 %