En statistiques, la covariance est un nombre permettant d'évaluer le sens de variation de deux variables et, ainsi, de qualifier l'indépendance de ces variables.
Si deux variables sont indépendantes, leur covariance est nulle, mais la réciproque n'est pas toujours vraie.
En théorie des probabilités et en statistique, on nomme covariance de deux variables aléatoires réelles X et Y la valeur :
Définition —
Notation — On note parfois
Intuitivement, la covariance est une mesure de la variation simultanée de deux variables aléatoires. C'est-à-dire que la covariance devient plus positive pour chaque couple de valeurs qui diffèrent de leur moyenne dans le même sens, et plus négative pour chaque couple de valeurs qui diffèrent de leur moyenne dans le sens opposé.
L'unité de mesure de la covariance cov(X,Y) est le produit de l'unité des variables aléatoires X et Y et sa valeur est comprise dans . En revanche, la corrélation, qui dépend de la covariance, est une mesure de dépendance linéaire sans unité et prend ses valeurs dans [ − 1;1].
Dans le cas de variables discrètes, on a:
Dans un forum Internet, quelqu'un affirme que l'activité du forum est plus intense les jours de pleine lune. On peut ne pas disposer du calendrier des pleines lunes, mais si cette affirmation est exacte et si l'on nomme N(t) le nombre de contributions au jour t, la covariance entre N(t) et N(t+28) cumulée sur toutes les valeurs de t sera probablement supérieure aux covariances entre N(t) et N(t+x) pour les valeurs de x différentes de 28.
Par analogie avec le théorème de König-Huyghens pour la variance, on a:
Propriété —
La seconde propriété est utile pour les cas de variables X et Y indépendantes
Propriété — X et Y indépendantes
Propriété — X et Y indépendantes ,
Propriété —
Propriété —
Propriété — si c est une constante
Propriété — si c est une constante
Bilinéarité de la covariance:
Propriété —
Propriété —