Écart type - Définition et Explications

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Introduction

Représentation graphique d'une loi normale. Chaque bande colorée a la largeur d'un écart type.

En mathématiques, plus précisément en statistiques et probabilités, l'écart type mesure la dispersion (La dispersion, en mécanique ondulatoire, est le phénomène affectant une onde dans un...) d'une série de valeurs autour (Autour est le nom que la nomenclature aviaire en langue française (mise à jour) donne...) de leur moyenne (La moyenne est une mesure statistique caractérisant les éléments d'un ensemble de...).

Dans le domaine des probabilités, l'écart type est une quantité (La quantité est un terme générique de la métrologie (compte, montant) ; un scalaire,...) réelle positive, éventuellement infinie, utilisée pour caractériser la répartition d'une variable aléatoire réelle (Une variable aléatoire réelle est une variable aléatoire à valeurs dans , ou...) autour de sa moyenne. En particulier, la moyenne et l'écart type caractérisent entièrement les lois gaussiennes à un paramètre (Un paramètre est au sens large un élément d'information à prendre en compte...) réel, de sorte qu'ils sont utilisés pour les paramétrer. Plus généralement, l'écart type, à travers son carré (Un carré est un polygone régulier à quatre côtés. Cela signifie que ses...), appelé variance ( En statistique et en probabilité, variance En thermodynamique, variance ), permet de caractériser des lois gaussiennes en dimension (Dans le sens commun, la notion de dimension renvoie à la taille ; les dimensions d'une pièce...) supérieure. Ces considérations ne sont pas sans importance, notamment dans l'application du théorème (Un théorème est une proposition qui peut être mathématiquement démontrée, c'est-à-dire une...) de la limite centrale.

En statistiques, plus particulièrement en théorie (Le mot théorie vient du mot grec theorein, qui signifie « contempler, observer,...) des sondages, ainsi qu'en métrologie (La métrologie est la science de la mesure au sens le plus large.), l'écart type tente d'évaluer, à partir d'un échantillon (De manière générale, un échantillon est une petite quantité d'une matière, d'information, ou...) soumis au hasard (Dans le langage ordinaire, le mot hasard est utilisé pour exprimer un manque efficient, sinon...), la dispersion de la population tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou...) entière. On distingue alors l'écart type empirique (biaisé) et l'écart type empirique corrigé dont la formule diffère de celle utilisée en probabilité (La probabilité (du latin probabilitas) est une évaluation du caractère probable d'un...).

Les écarts types connaissent de nombreuses applications, tant dans les sondages, qu'en physique (La physique (du grec φυσις, la nature) est étymologiquement la...) (où ils sont souvent nommés RMS (Root Mean Square) par abus de langage), ou en biologie (La biologie, appelée couramment la « bio », est la science du vivant....). Ils permettent en pratique de rendre compte des résultats numériques d'une expérience répétée. En finance l'écart type est une mesure de la volatilité (En finance, la volatilité est une mesure de l'instabilité du cours d'un actif financier. Elle...) d'un actif.

Généralités

En statistiques comme en probabilités on définit, outre des valeurs centrales, des valeurs de dispersion.

Dans le domaine des probabilités, la dispersion d'une variable aléatoire (Une variable aléatoire est une fonction définie sur l'ensemble des résultats possibles d'une...) réelle X autour de sa moyenne est caractérisée par la variance dont le calcul repose sur la notion d'espérance mathématique (L'espérance mathématique est une valeur numérique permettant de mesurer le degré d'équité...).

Pratiquement, c'est l'écart-type, racine carrée (La racine carrée d’un nombre réel positif x est le nombre positif dont le...) de la variance, qui est utilisé car il possède les mêmes dimensions physiques que la variable (En mathématiques et en logique, une variable est représentée par un symbole. Elle...). Cette notion apparaît aussi dans l'analyse des signaux, souvent en relation avec la notion de processus aléatoire, généralement sous le nom de moyenne quadratique.

En statistique descriptive (La statistique descriptive est la branche des statistiques qui regroupe les nombreuses techniques...) qui porte sur une population finie parfaitement connue, les valeurs de dispersion, comme les valeurs centrales, peuvent être choisies arbitrairement (écart-type, écart moyen, étendue, ...).

La statistique (La statistique est à la fois une science formelle, une méthode et une technique. Elle...) mathématique (Les mathématiques constituent un domaine de connaissances abstraites construites à l'aide...) porte au contraire sur une population infinie qui ne peut être connue qu'imparfaitement à travers un ensemble fini (En mathématiques, un ensemble E est dit fini si et seulement s'il existe un entier n et une...) de données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent...) [x_1..x_n]\,. Pour interpréter ces données imprécises, il faut faire appel à la notion de probabilité. Les données sont alors considérées comme une réalisation d'un échantillon constitué par les variables aléatoires [X_1..X_n]\,. Par des calculs arithmétiques analogues à ceux qui sont effectués en statistique (Une statistique est, au premier abord, un nombre calculé à propos d'un échantillon....) descriptive, il est possible de déduire de la réalisation de l'échantillon des estimations de la moyenne empirique et de la variance empirique qui sont elles-mêmes des variables aléatoires. La moyenne empirique fournit une estimation sans biais de la moyenne de la loi de probabilité (En théorie des probabilités et en statistique, une loi de probabilité décrit...) car son espérance est égale à cette dernière. Au contraire, la variance empirique fournit une estimation biaisée de la variance ; pour obtenir une estimation sans biais, il faut la multiplier par \frac n {n-1}.

En probabilités

Dans la formulation (La formulation est une activité industrielle consistant à fabriquer des produits...) moderne des probabilités, suite aux travaux de Henri Lebesgue, une variable aléatoire X est une application à valeurs réelles ou vectorielles, dépendant d'un paramètre x suivant une loi de probabilité P. Si la compréhension du formalisme fait appel à la théorie de la mesure, son utilisation reste simple. L'application X ne joue (La joue est la partie du visage qui recouvre la cavité buccale, fermée par les...) pas un rôle fondamental ; seule sa loi, l'image de P par X, notée PX, importe. Il s'agit d'une mesure sur R ou sur Rn. Deux quantités lui sont associées :

  • Sa moyenne, notée E[X], aussi appelée espérance :
  • Son écart type, généralement noté σX, défini comme la racine carrée de l'espérance de (X-E[X])2 :
\sigma_X^2=E[(X-E[X])^2]=E[X^2]-E[X]^2.

Ici, l'élévation au carré pour le membre de droite désigne implicitement la norme (Une norme, du latin norma (« équerre, règle ») désigne un...) euclidienne au carré dans le cas où X est à valeurs vectorielles.

Cette identité se spécialise dans un grand nombre (La notion de nombre en linguistique est traitée à l’article « Nombre...) de cas particuliers. Entre autres :

Probabilité discrète

Si la variable X prend un nombre fini de valeurs réelles x1, ..., xn, avec des probabilités respectives p1, ..., pn (sous la condition \sum_{i=1}^n p_i=1), l'écart type est donné par :

\sigma = \sqrt{\sum_{i=1}^n p_i.(x_i-\overline{x})^2} = \sqrt{\left( \sum_{i=1}^n p_i.x_i^2 \right) - \overline{x}^2 }, où : \overline{x}=\sum_{i=1}^n p_i.x_i.

En particulier, si la loi de X est uniforme sur un ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection...) fini de valeurs, on a :

\sigma_X=\sqrt{ \frac{1}{n}\sum_{i=1}^n (x_i-\overline{x})^2} = \sqrt{ \frac{1}{n}\left( \sum_{i=1}^n x_i^2 \right) - \overline{x}^2 }, où : \overline{x}=\frac{1}{n}\sum_{i=1}^n x_i.

Ces formules se généralisent immédiatement en dimension (Dans le sens commun, la notion de dimension renvoie à la taille ; les dimensions d'une...) supérieure en remplaçant l'élévation au carré par la norme euclidienne au carré.

Probabilité uniformément continue

La loi PX est dite uniformément continue lorsque la probabilité que X appartienne au segment [a, b] est :

P_x((a,b))=P(X\in (a,b))=\int_a^b f(x)dx

f est une fonction localement intégrable pour la mesure de Lebesgue (La mesure de Lebesgue doit son nom au mathématicien français Henri Léon Lebesgue. Elle est d'une...), par exemple mais pas nécessairement une fonction continue. Cette fonction f s'appelle la densité (La densité ou densité relative d'un corps est le rapport de sa masse volumique à la...) de la loi PX. Elle est globalement intégrable et de carré intégrable.

L'écart type de X est défini par :

\sigma_X=\sqrt{\int_{R} f(x) x^2dx-{\left(\int_{R}f(x) x dx\right)}^2}.

Exemples d'écarts types

Le tableau (Tableau peut avoir plusieurs sens suivant le contexte employé :) suivant donne les écarts types pour les lois couramment rencontrées :

Nom de la loi Paramètre Description Ecart-type
Loi de Bernoulli (En mathématiques, la distribution de Bernoulli ou loi de Bernoulli, du nom du...) p Loi discrète de valeurs 0 avec probabilité 1-p et 1 avec probabilité p \sigma=\sqrt{p.(1-p)}
Loi binomiale (En mathématiques, une loi binomiale de paramètres n et p est une loi de probabilité...) p et n>1 Loi de la somme indépendantes de n variables suivant la loi de Bernoulli de paramètre p \sigma=\sqrt{n \cdot p \cdot (1-p)}
Loi géométrique (La loi géométrique est une loi de probabilité apparaissant dans de nombreuses...) p Loi discrète sur N telle que la probabilité d'obtenir l'entier n soit (1-p).pn σ = p / (1 − p)2
Loi uniforme sur un segment a<b Loi uniformément continue sur R de densité la fonction indicatrice de [a, b] à un coefficient (En mathématiques un coefficient est un facteur multiplicatif qui dépend d'un certain...) près \sigma=\frac{b-a}{\sqrt{12}}
Loi exponentielle (La fonction exponentielle est l'une des applications les plus importantes en analyse, ou plus...) p Loi uniformément continue de support R+ de densité la fonction f(x)=p.exp(-p.x) σ = 1 / p
Page générée en 0.280 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique