En Statistiques, une fonction de répartition empirique est une fonction de répartition qui attribue la probabilité 1/n à chacun des n nombres dans un échantillon.
Soit
un échantillon de variables iid à valeurs dans
avec pour fonction de répartition F(x).
La fonction de distribution empirique Fn(x) basée sur l'échantillon
est une fonction en escalier définie par
où I(A) est la fonction indicatrice de l'événement A.
Pour un x fixé, la variable
est une variable aléatoire de Bernoulli, de paramètre p = F(x). Par conséquent, la variable nFn(x) est distribuée selon une loi binomiale, avec pour moyennenF(x) et pour variancenF(x)(1 − F(x)).
Propriétés asymptotiques
Par la loi forte des grands nombres,
presque sûrement pour un x fixé.
En d'autres termes, Fn(x) est un estimateur non-biaisé de la fonction de répartition F(x).
, en tant que processus indexé par x, converge faiblement dans
vers un pont brownien B(F(x)).
Bibliographie
(en) Galen R. Shorack et Jon A. Wellner, Empirical Processes With Applications to Statistics, Society for Industrial & Applied Mathematics, 4 septembre 2009, 998 p.
van der Vaart, A.W. and Wellner, J.A. (1996) "Weak Convergence and Empirical Processes", Springer. ISBN 0-387-94640-3.