Recherchez sur tout Techno-Science.net
       
Techno-Science.net : Suivez l'actualité des sciences et des technologies, découvrez, commentez
Catégories
Techniques
Sciences
Encore plus...
Techno-Science.net
Partenaires
Organismes
 CEA
 ESA
Sites Web
Photo Mystérieuse

Que représente
cette image ?
 A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | +
Covariance

Pour le principe physique, voir Principe de covariance générale.

En statistiques, la covariance est une méthode mathématique permettant d'évaluer le sens de variation de deux variables et, par là, de qualifier l'indépendance de ces variables.

Définition (Une définition est un discours qui dit ce qu'est une chose ou ce que signifie un nom. D'où la division entre les définitions réelles et les définitions nominales.)

En théorie des probabilités (La Théorie des probabilités est l'étude mathématique des phénomènes caractérisés par le hasard et l'incertitude. Les objets centraux de la théorie des probabilités sont les variables aléatoires, les processus stochastiques, et les évènements:...) et en statistique (La statistique est à la fois une science formelle, une méthode et une technique. Elle comprend la collecte, l'analyse, l'interprétation de données ainsi que la présentation de ces ressources...), on nomme covariance (Pour le principe physique, voir Principe de covariance générale.) de deux variables aléatoires à valeurs réelles X et Y la valeur :

\sigma_{xy}=\operatorname{cov}(x, y) = \frac{1}{n}\sum_{i=1}^n (x_i-\bar{x})(y_i-\bar{y})

avec \sigma_x^2 = \frac{1}{n}\sum_{i=1}^n (x_i-\bar{x})^2 et \sigma_y^2 = \frac{1}{n}\sum_{i=1}^n (y_i-\bar{y})^2

Intuitivement, la covariance est une mesure de la variation simultanée de deux variables aléatoires. C'est-à-dire que la covariance devient plus positive pour chaque couple de valeurs qui diffèrent de leur moyenne (La moyenne est une mesure statistique caractérisant les éléments d'un ensemble de quantités : elle exprime la grandeur qu'auraient chacun des membres de l'ensemble s'ils...) dans le même sens (SENS (Strategies for Engineered Negligible Senescence) est un projet scientifique qui a pour but l'extension radicale de l'espérance de vie humaine. Par une évolution progressive allant du ralentissement du vieillissement,...), et plus négative pour chaque couple de valeurs qui diffèrent de leur moyenne dans le sens opposé ( En mathématique, l'opposé d’un nombre est le nombre tel que, lorsqu’il est à ajouté à n donne zéro. En botanique, les organes d'une plante sont dits opposés lorsqu'ils sont insérés au même...).

L'unité de mesure (En physique et en métrologie, les unités sont des étalons pour la mesure de grandeurs physiques qui ont besoin de définitions précises pour être utiles.) de la covariance cov(X,Y) est le produit de l'unité des variables aléatoires X et Y. En revanche, la corrélation, qui dépend de la covariance, est une mesure de dépendance linéaire sans unité.

La définition ci-dessus est équivalente à la formule suivante, plus souvent utilisée pour les calculs :

\operatorname{cov}(X, Y) = E(X Y) - E(X)E(Y)

où E désigne l'espérance mathématique (L'espérance mathématique est une valeur numérique permettant de mesurer le degré d'équité d'un jeu de hasard. Elle est égale à la somme des gains (et des...). Si X et Y sont des variables indépendantes, alors leur covariance est nulle. En effet, on a alors :

E(X \cdot Y)=E(X) \cdot E(Y)=E(X)E(Y),

La réciproque, cependant, n'est pas vraie. Il est en effet possible que X et Y ne soient pas indépendantes, et que leur covariance soit nulle. Des variables aléatoires dont la covariance est nulle sont dites non corrélées.

Si X et Y sont des variables aléatoires à valeurs réelles, et c une constante (" constante ", dans ce contexte (Le contexte d'un évènement inclut les circonstances et conditions qui l'entourent; le contexte d'un mot, d'une phrase ou d'un texte inclut les mots qui l'entourent. Le concept de contexte issu...), signifiant non-aléatoire), alors les formules suivantes sont des conséquences directes de la définition de la covariance :

\operatorname{cov}(X, X) = \operatorname{var}(X)
\operatorname{cov}(X, Y) = \operatorname{cov}(Y, X)
\operatorname{cov}(cX, Y) = c\, \operatorname{cov}(X, Y)
\operatorname{cov}\left(\sum_i{X_i}, \sum_j{Y_j}\right) = \sum_i{\sum_j{\operatorname{cov}\left(X_i, Y_j\right)}}

Exemple

Dans un forum Internet (Un forum de discussion sur Internet, comme un forum Usenet ou un forum Web, est un forum de discussion utilisant les ressources d'Internet.), quelqu'un affirme que les activités sont plus intenses les jours de pleine lune (La pleine Lune est la phase lunaire durant laquelle la Lune apparaît la plus brillante depuis la Terre, de par le fait que nous voyons, lors de cette phase, presque toute la surface lunaire éclairée par le Soleil. La pleine lune...). On peut ne pas disposer du calendrier (Un calendrier est un système de repérage des dates en fonction du temps. Ces systèmes ont été inventés par les hommes pour mesurer, diviser et organiser le temps sur de longues durées. Initialement conçus pour être en accord...) des pleines lunes, mais si cette affirmation est exacte et si l'on nomme N(t) le nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) de contributions au jour (Le jour ou la journée est l'intervalle qui sépare le lever du coucher du Soleil ; c'est la période entre deux nuits, pendant laquelle les rayons du Soleil éclairent le...) t, la covariance entre N(t) et N(t+28) cumulée sur toutes les valeurs de t sera supérieure en principe aux covariances entre N(t) et N(t+x) pour les valeurs de x différentes de 28.

Résultats

On constate en effet un pic léger de covariance pour la valeur 28. La théorie (Le mot théorie vient du mot grec theorein, qui signifie « contempler, observer, examiner ». Dans le langage courant, une théorie est une idée ou une connaissance spéculative, souvent basée sur...) de l'influence de la pleine lune (La Lune est l'unique satellite naturel de la Terre et le cinquième plus grand satellite du système solaire avec un diamètre de 3 474 km. La distance moyenne séparant la Terre de la...) est-elle vérifiée ?

Examen plus détaillé

La courbe (En géométrie, le mot courbe, ou ligne courbe désigne certains sous-ensembles du plan, de l'espace usuels. Par exemple, les droites, les segments, les lignes polygonales et les cercles sont des courbes.) de covariance montre en effet un léger pic pour la valeur 28, mais d'autres pics d'importance croissante pour 21, 14 et 7. Il est donc plus plausible d'émettre l'hypothèse d'une pointe d'activité (Le terme d'activité peut désigner une profession.) hebdomadaire (week-end, par exemple) pour ce forum, en tant que variable (En mathématiques et en logique, une variable est représentée par un symbole. Elle est utilisée pour marquer un rôle dans une formule, un prédicat ou un algorithme. En statistiques, une variable peut...) explicative (ce cas a été observé en 1995 sur le forum Compuserve du journal Le Monde).

Détails techniques

La covariance vAB de deux variables aléatoires A et B observées conjointement N fois est définie par:

v_{AB} = \frac{\sum a_i \cdot b_i}{N} - \frac{\sum a_i}{N} \cdot \frac{\sum b_i}{N}

La matrice de covariance V d'une variable aléatoire (Une variable aléatoire est une fonction définie sur l'ensemble des résultats possibles d'une expérience aléatoire, telle qu'il soit possible de déterminer la probabilité pour qu'elle prenne...) vectorielle X observée N fois est définie par:

V = \frac{\sum x_i \cdot x_i^T}{N} - \frac{\sum x_i}{N} \cdot \left(\frac{\sum x_i}{N}\right)^T

On remarquera que si A est la variable aléatoire correspondant à la a-ième coordonnée de X et si B est la variable aléatoire correspondant à la b-ième coordonnée de X alors on a vAB = Vab.

L'inverse (En mathématiques, l'inverse d'un élément x d'un ensemble muni d'une loi de composition interne · notée multiplicativement, est un élément y tel que x·y = y·x...) de la matrice de covariance est parfois désignée par le terme de " matrice de précision ".

Bilinéarité

Soient X et Y deux variables aléatoires définies sur le même espace probabilisé (Un espace probabilisé est un triplet formé d'un ensemble Ω, d'une tribu ou σ-algèbre sur Ω et d'une mesure P sur cette...). La formule var(X+Y) = var(X) + var(Y) + 2cov(X,Y) est l'analogue de (x + y)2 = x2 + y2 + 2xy. En fait, la plupart des propriétés de la covariance sont analogues à celles du produit de deux réels ou du produit scalaire (En géométrie vectorielle, le produit scalaire est une opération algébrique s'ajoutant aux lois définissant la structure d'espace vectoriel. À deux vecteurs elle associe leur produit,...) de deux vecteurs.

Usage (L’usage est l'action de se servir de quelque chose.)

La connaissance des covariances est le plus souvent indispensable dans les fonctions d'estimation, de filtrage et de lissage. Elles permettent, entre autres en photographie, d'arriver à corriger de façon spectaculaire les flous de mise au point (Graphie) ainsi que les flous de bougé, ce qui est extrêmement important pour les clichés astronomiques. On les utilise également en automatique (L'automatique fait partie des sciences de l'ingénieur. Cette discipline traite de la modélisation, de l'analyse, de la commande et, de la régulation des systèmes dynamiques. Elle a pour fondements...). En sociolinguistique, la covariance désigne la correspondance (La correspondance est un échange de courrier généralement prolongé sur une longue période. Le terme désigne des échanges de courrier personnels plutôt qu'administratifs.) entre l’appartenance à une certaine classe sociale et un certain parler inhérent à cette condition sociale.

Source: Wikipédia publiée sous licence CC-BY-SA 3.0.

Vous pouvez soumettre une modification à cette définition sur cette page. La liste des auteurs de cet article est disponible ici.