Définition — On dit que Xn converge vers X en probabilité si,
La convergence en probabilité est parfois notée
La convergence en probabilité est utilisée dans la loi faible des grands nombres.
La convergence en probabilité implique la convergence en loi. On peut donc énoncer le théorème suivant:
Théorème — Xn converge vers X en probabilité
Pour effectuer la démonstration, le lemme suivant est utile
Soient X, Y des variables aléatoires réelles, c un réel et ε > 0. Alors
Lemme —
car
Pour tout ε > 0, en raison de ce lemme, on a:
On a donc
Soit a un point de continuité de FX. On fixe un réel . Par continuité de FX en a, il existe un réel
tel que
De la convergence de (Xn)n en probabilité vers X, on peut en déduire l'existence d'un entier N tel que : .
D'où :
Il existe des conditions suffisantes de convergence en probabilité vers une constante, portant sur l'espérance et la variance des termes de la suite :
Théorème —
On veut montrer que
On se sert de l'inégalité de Markov pour les variables aléatoires réelles admettant un moment d'ordre 2 :
Théorème —
D'où :
Il en découle que :
si
Ce théorème est très utile pour démontrer la loi faible des grands nombres de manière simple: il suffit de voir que si
Donc
La réciproque n'est pas vraie :
Soit une suite
On voit qu'elle converge en probabilité : .
Cependant,
Ainsi les conditions énoncées plus haut de convergence en probabilité vers une constante ne sont pas nécessaires.
Un théorème très pratique, désigné en anglais généralement sous le nom de Mapping theorem (en), établit qu'une fonction g continue appliquée à une variable qui converge vers X convergera vers g(X) pour tous les modes de convergence:
Théorème — Mapping theorem Soit
En statistiques, un estimateur convergent de la variance σ2 est donné par:
On sait alors par le continuous mapping theorem que l'estimateur
Soit r > 0. On dit que Xn converge vers X en moyenne d'ordre r ou en norme Lr si E|Xn|r < ∞ pour tout n et
La convergence en moyenne d'ordre r nous dit que l'espérance de la puissance r-ième de la différence entre Xn et X converge vers zéro.
Pour r =2, on parle de convergence en moyenne quadratique
Théorème — Xn converge vers X en norme Lr
On se sert de l'inégalité de Markov pour les variables aléatoires réelles admettant un moment d'ordre r :
Théorème —
On a donc : , d'où découle le résultat annoncé.
Théorème — Pour r > s ≥ 1, la convergence en norme Lr implique la convergence en norme Ls.
On a également le résultat suivant:
Théorème — Xn converge vers une constante c en moyenne quadratique
On a vu plus haut que :