Test de Kolmogorov-Smirnov
Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

En statistiques, le test de Kolmogorov-Smirnov est un test d'hypothèse utilisé pour déterminer si un échantillon suit bien une loi donnée connue par sa fonction de répartition continue, ou bien si deux échantillons suivent la même loi.

Ce test repose sur les propriété des fonctions de répartition empirique : si (x_1,\dots,x_n) est un échantillon (De manière générale, un échantillon est une petite quantité d'une matière, d'information, ou d'une solution. Le mot est utilisé dans différents...) de n variables aléatoires indépendantes à valeurs réelles, alors la fonction de répartition (En probabilité, la fonction de répartition d'une variable aléatoire X est la fonction qui à tout réel x associe) empirique de cet échantillon est définie par F_n(x)={1 \over n}\sum_{i=1}^n \delta_{x_i\leq x} avec \delta_{x_i\leq x} = \left\{\begin{matrix}1 & \mathrm{si}\ x_i\leq x, \\ 0 & \mathrm{sinon}.\end{matrix}\right.

La fonction de répartition empirique est un processus qui prend ses valeurs dans l'espace des fonctions croissantes comprises entre 0 et 1. Grâce à ses propriétés, on a la convergence (Le terme de convergence est utilisé dans de nombreux domaines :) suivante :

\mathbb{P}\left[ \sup_{x} |F_n(x)-F(x)|>\frac{c}{\sqrt{n}} \right]\xrightarrow[n\to\infty]{} \alpha(c)= 2\sum_{r=1}^{+\infty} (-1)^{r-1}\exp(-2r^2c^2)

pour toute constante c > 0. Le terme α(c) vaut 0.05 pour c = 1.36. Remarquons que la limite à droite ne dépend pas de F. Cela découle du fait que \sqrt{n}(F_n(x)-F(x)) converge en loi vers un pont (Un pont est une construction qui permet de franchir une dépression ou un obstacle (cours d'eau, voie de communication, vallée, etc.) en passant par-dessus cette séparation. Le franchissement supporte le passage...) brownien changé de temps (Le temps est un concept développé par l'être humain pour appréhender le changement dans le monde.) par l'inverse (En mathématiques, l'inverse d'un élément x d'un ensemble muni d'une loi de composition interne · notée multiplicativement, est un élément y tel que x·y...) F − 1 de F. La série α(c) se déduit des propriétés de ce dernier processus.

Il est ainsi facile de proposer un test d'hypothèse pour décider si un échantillon provient bien d'une loi donnée (Dans les technologies de l'information, une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction, d'un événement, etc.), ou si deux échantillons ont la même loi, lorsque leurs fonction de répartitions sont continues.

On peut aussi considérer maxx(Fn(x) − F(x)) et maxx(F(x) − Fn(x)).

Le test de Kolmogorv-Smirnov est par exemple utilisé pour tester la qualité d'un générateur de nombres aléatoires (Un générateur de nombres aléatoires est un dispositif capable de produire une séquence de nombres dont on ne peut pas « facilement »...)[1].

Page générée en 0.133 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique