Recherchez sur tout Techno-Science.net
       
Techno-Science.net : Suivez l'actualité des sciences et des technologies, découvrez, commentez
Catégories
Techniques
Sciences
Encore plus...
Techno-Science.net
Partenaires
Organismes
 CEA
 ESA
Sites Web
Photo Mystérieuse

Que représente
cette image ?
 A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | +
Écart type

En mathématiques, l'écart type est une quantité réelle positive, éventuellement infinie, utilisée dans le domaine des probabilités pour caractériser la répartition d'une variable aléatoire autour de sa moyenne. En particulier, la moyenne (La moyenne est une mesure statistique caractérisant les éléments d'un ensemble de quantités : elle exprime la grandeur qu'auraient chacun des membres de l'ensemble s'ils étaient tous...) et l'écart type (En mathématiques, l'écart type est une quantité réelle positive, éventuellement infinie, utilisée dans le domaine des probabilités pour caractériser la répartition d'une variable...) caractérisent entièrement les lois gaussiennes à un paramètre (Un paramètre est au sens large un élément d'information à prendre en compte pour prendre une décision ou pour effectuer un calcul.) réel, de sorte qu'ils sont utilisés pour les paramétrer. Plus généralement, l'écart type, à travers son carré (Un carré est un polygone régulier à quatre côtés. Cela signifie que ses quatre côtés ont la même longueur et ses quatre angles la même mesure. Un carré est à la fois un...) appelé variance ( En statistique et en probabilité, variance En thermodynamique, variance ) , permet de caractériser des lois gaussiennes en dimension (Dans le sens commun, la notion de dimension renvoie à la taille ; les dimensions d'une pièce sont sa longueur, sa largeur et sa profondeur/son épaisseur, ou bien son diamètre si c'est...) supérieure. Ces considérations ne sont pas sans importance, notamment dans l'application du théorème (Un théorème est une proposition qui peut être mathématiquement démontrée, c'est-à-dire une assertion qui peut être établie comme vraie au travers d'un raisonnement logique construit à partir d'axiomes. Un théorème est à distinguer d'une...) central limite.

En statistiques, l'écart type ou déviation standard est défini au contraire pour un ensemble fini (En mathématiques, un ensemble E est dit fini si et seulement si E est vide ou s'il existe un entier n et une bijection de E dans l'ensemble des n premiers entiers naturels.) de données numériques interprétées comme la réalisation d'une variable aléatoire (Une variable aléatoire est une fonction définie sur l'ensemble des résultats possibles d'une expérience aléatoire, telle qu'il soit possible de déterminer...). Il est alors utilisé pour mettre en place des tests, autrement dit, il permet de décider si une probabilité (La probabilité (du latin probabilitas) est une évaluation du caractère probable d'un évènement. En mathématiques, l'étude des probabilités est un...) est plausible compte tenu des valeurs disposées avec une certaine marge d'erreur. L'écart type est aussi utilisé dans les problèmes de régression linéaire.

Les écarts types connaissent de nombreuses applications, tant dans les sondages, qu'en physique (La physique (du grec φυσις, la nature) est étymologiquement la « science de la nature ». Dans un sens général et ancien, la physique désigne la connaissance de la...), ou en biologie (La biologie, appelée couramment la « bio », est la science du vivant. Prise au sens large de science du vivant, elle recouvre une partie des sciences...). Ils permettent en pratique de rendre compte des résultats numériques d'une expérience répétée.

Définition (Une définition est un discours qui dit ce qu'est une chose ou ce que signifie un nom. D'où la division entre les définitions réelles et les définitions nominales.)

Dans la formulation (La formulation est une activité industrielle consistant à fabriquer des produits homogènes, stables et possédant des propriétés spécifiques, en mélangeant différentes...) moderne des probabilités, suite aux travaux de Henri Lebesgue, une variable (En mathématiques et en logique, une variable est représentée par un symbole. Elle est utilisée pour marquer un rôle dans une formule, un prédicat ou un algorithme. En statistiques, une variable peut...) aléatoire X est une application à valeurs réelles ou vectorielles, dépendant d'un paramètre x suivant une loi de probabilité P. Si la compréhension du formalisme fait appel à la théorie (Le mot théorie vient du mot grec theorein, qui signifie « contempler, observer, examiner ». Dans le langage courant, une théorie est une idée ou une...) de la mesure, son utilisation reste simple. L'application X ne joue (La joue est la partie du visage qui recouvre la cavité buccale, fermée par les mâchoires. On appelle aussi joue le muscle qui sert principalement à ouvrir et fermer la bouche et à mastiquer.) pas un rôle fondamental ; seule sa loi, l'image de P par X, notée PX, importe. Il s'agit d'une mesure sur R ou sur Rn. Deux quantités lui sont associées :

  • Sa moyenne, notée E[X], aussi appelée espérance :
  • Son écart type, généralement noté σX, défini comme la racine carrée (La racine carrée d’un nombre réel positif x est le nombre positif dont le carré vaut x. On le note ou x½; dans cette expression, x est appelé le radicande.) de l'espérance de (X-E[X])2 :
\sigma_X^2=E[(X-E[X])^2]=E[X^2]-E[X]^2.

Ici, l'élévation au carré pour le membre de droite désigne implicitement la norme (Une norme, du latin norma (« équerre, règle ») désigne un état habituellement répandu ou moyen considéré le plus souvent comme une règle à suivre. Ce...) euclidienne au carré dans le cas où X est à valeurs vectorielles.

Cette identité se spécialise dans un grand nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) de cas particuliers. Entre autres :

Probabilité discrète

Si la variable X prend un nombre fini de valeurs réelles x1, ..., xn, avec des probabilités respectives p1, ..., pn (sous la condition \sum_{i=1}^n p_i=1), l'écart type est donnée (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un événement, etc.) par :

\sigma = \sqrt{ \sum_{i=1}^n p_i.(x_i-\overline{x})^2} = \sqrt{ \left( \sum_{i=1}^n p_i.x_i^2 \right) - \overline{x}^2 }, où : \overline{x}=\sum_{i=1}^n p_i.x_i.

En particulier, si la loi de X est uniforme sur un ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble), « une multitude qui peut être...) fini de valeurs, on a :

\sigma_X=\sqrt{ \frac{1}{n}\sum_{i=1}^n (x_i-\overline{x})^2} = \sqrt{ \frac{1}{n}\left( \sum_{i=1}^n x_i^2 \right) - \overline{x}^2 }, où : \overline{x}=\frac{1}{n}\sum_{i=1}^n x_i.

Ces formules se généralisent immédiatement en dimension supérieure en remplaçant l'élévation au carré par la norme euclidienne au carré.

Probabilité uniformément continue

La loi PX est dite uniformément continue lorsque la probabilité que X appartienne au segment [a,b] est :

P_x((a,b))=P(X\in (a,b))=\int_a^b f(x)dx

f est une fonction localement intégrable pour la mesure de Lebesgue (La mesure de Lebesgue doit son nom au mathématicien français Henri Léon Lebesgue. Elle est d'une importance capitale en théorie de l'intégration.), par exemple mais pas nécessairement une fonction continue. Cette fonction f s'appelle la densité (La densité ou densité relative d'un corps est le rapport de sa masse volumique à la masse volumique d'un corps pris comme référence. Le corps de référence est l'eau pure à 4 °C...) de la loi PX. Elle est globalement intégrable et de carré intégrable.

L'écart type de X est défini par :

\sigma_X=\sqrt{\int_{R} f(x)^2dx-{\left(\int_{R}f(x)dx\right)}^2}.

Exemples d'écart types

Le tableau (Tableau peut avoir plusieurs sens suivant le contexte employé :) suivant donne les écarts types pour les lois couramment rencontrées :

Nom de la loi Paramètre Description Ecart type
Loi de Bernoulli (En mathématiques, la distribution de Bernoulli ou loi de Bernoulli, du nom du mathématicien suisse Jacques Bernoulli, est une distribution discrète de probabilité, qui prend la valeur 1 avec la...) p Loi discrète de valeurs 0 avec probabilité 1-p et 1 avec probabilité p \sigma=\sqrt{p(1-p)}
Loi binomiale (En mathématiques, une loi binomiale de paramètres n et p correspond au modèle suivant :) p et n>1 Loi de la somme indépendantes de n variables suivant la loi de Bernouilli de paramètre p \sigma=\sqrt{n.p.(1-p)}
Loi géométrique p Loi discrète sur N telle que la probabilité d'obtenir l'entier n soit (1-p).pn σ = p / (1 − p)2
Loi uniforme sur un segment a<b Loi uniformément continue sur R de densité la fonction indicatrice de [a,b] à un coefficient (En mathématiques un coefficient est un facteur multiplicatif qui dépend d'un certain objet, comme une variable (par exemple, les coefficients d'un polynôme), un espace vectoriel,...) près \sigma=\frac{b-a}{\sqrt{12}}
Loi exponentielle (La fonction exponentielle est l'une des applications les plus importantes en analyse, ou plus généralement en mathématiques et dans ses domaines d'applications. Il existe plusieurs définitions équivalentes : un...) p Loi uniformément continue de support R+ de densité la fonction f(x)=p.exp(-p.x) σ = 1 / p


En théorie des sondages

Lorsqu'il s'agit d'estimer la dispersion (La dispersion, en mécanique ondulatoire, est le phénomène affectant une onde dans un milieu dispersif, c'est-à-dire dans lequel les différentes fréquences constituant l'onde ne se propagent pas à...) autour (Autour est le nom que la nomenclature aviaire en langue française (mise à jour) donne à 31 espèces d'oiseaux qui, soit appartiennent au genre Accipiter, soit...) de la moyenne d'un caractère statistique (La statistique est à la fois une science formelle, une méthode et une technique. Elle comprend la collecte, l'analyse, l'interprétation de données ainsi que la présentation de ces ressources afin de les rendre...) dans une population de grande taille à partir d'un échantillon (De manière générale, un échantillon est une petite quantité d'une matière, d'information, ou d'une solution. Le mot est utilisé dans différents domaines :) de taille n, on utilise pour l'écart type la valeur suivante

s=\sqrt{\frac{1}{n-1}\sum_{i=1}^n(x_i-\overline{x})^2}.

On peut remarquer que

s = \sigma\sqrt{\frac{n}{n-1}}

Pourquoi n - 1 ?

La question que l'on se pose généralement est " Pourquoi n - 1 ? ". La raison pour laquelle on divise par n - 1 au lieu de n est un bel (Nommé en l’honneur de l'inventeur Alexandre Graham Bell, le bel est unité de mesure logarithmique du rapport entre deux puissances, connue pour exprimer la puissance du son. Grandeur sans dimension en...) exemple de l'interaction (Une interaction est un échange d'information, d'affects ou d'énergie entre deux agents au sein d'un système. C'est une action réciproque qui suppose l'entrée en...) permanente entre les statistiques et les probabilités.

Le sondage ( Un sondage peut désigner une technique d'exploration locale d'un milieu particulier. Un sondage peut également être une méthode statistique d'analyse d'une population humaine ou non humaine à partir d'un...) de n individus correspond à une série de n variables aléatoires xi indépendantes d'espérance E(X) et de variance V(X).
La moyenne \overline{x} de l'échantillon est une variable aléatoire d'espérance E(X) et de variance \frac{1}{n} \cdot V(X) (la moyenne de n variables aléatoires fluctue moins qu'une seule variable aléatoire).
La variance v de l'échantillon est une variable aléatoire dont on veut calculer l'espérance.
v=\left(\frac{1}{n}\sum x_i^2\right) - \overline{x}^2.
x_i^2 est une variable aléatoire d'espérance E(x_i^2) = E(x_i)^2 + V(x_i) donc égale à E(X)2 + V(X).
\frac{1}{n}\sum x_i^2 est une variable aléatoire d'espérance E(X)2 + V(X).
\overline{x}^2 est une variable aléatoire d'espérance E(\overline{x})^2+V(\overline{x})=E(X)^2+\frac{1}{n}V(X) .
Donc E(v) = E(X)^2+V(X) - E(X)^2-\frac{1}{n}V(X)=\frac{n-1}{n}V(X).
La variance v de l'échantillon fluctue donc autour de \frac{n-1}{n}V(X) et non autour de V(X) comme on aurait pu s'y attendre.
Pour obtenir une estimation de V(X), il est donc nécessaire de prendre \frac{n}{n-1}v. On pourrait dire que v est un estimateur biaisé.
Et pour obtenir une estimation de l'écart type σ(X), il est nécessaire de prendre \sigma \sqrt{\frac{n}{n-1}}.

Aspect qualitatif

Plus communément appelée écart type, la déviation standard caractérise la largeur (La largeur d’un objet représente sa dimension perpendiculaire à sa longueur, soit la mesure la plus étroite de sa face. En géométrie plane, la largeur est la plus petite des deux mesures d'un...) de la distribution. Elle est exprimée mathématiquement comme étant la racine carrée de la variance, celle-ci mesurant la distribution des valeurs autour du centre de la courbe (En géométrie, le mot courbe, ou ligne courbe désigne certains sous-ensembles du plan, de l'espace usuels. Par exemple, les droites, les segments, les lignes polygonales et les cercles sont des...).

Écart type (S) = Racine carrée de la variance

  • L'écart type est la mesure de dispersion, ou étalement, la plus couramment utilisée en statistique (Une statistique est, au premier abord, un nombre calculé à propos d'un échantillon. D'une façon générale, c'est le résultat de...) lorsqu'on emploie la moyenne pour calculer une tendance centrale. Il mesure donc la dispersion autour de la moyenne. En raison de ses liens étroits avec la moyenne, l'écart type peut être grandement influencé si cette dernière donne une mauvaise mesure de tendance centrale.
  • Contrairement à l'étendue et aux quartiles, la variance permet de combiner toutes les valeurs à l'intérieur d'un ensemble de données afin d'obtenir la mesure de dispersion. La variance (symbolisée par S²) et l'écart type (la racine carrée de la variance, symbolisée par S) sont les mesures de dispersion les plus couramment utilisées.

La variance est définie comme étant la moyenne arithmétique (La moyenne arithmétique d'une série statistique est la moyenne ordinaire, c'est-à-dire le rapport de la somme d’une distribution d’un caractère...) des carrés des différences entre les valeurs observées et la moyenne. C'est une mesure du degré (Le mot degré a plusieurs significations, il est notamment employé dans les domaines suivants :) de dispersion d'un ensemble de données. On la calcule sous la forme de l'écart au carré moyen de chaque nombre par rapport à la moyenne d'un ensemble de données.

Répartition de la population

Lorsque la variable étudiée est gaussienne (répartition selon une courbe en cloche), l'écart type permet de déterminer la répartition de la population autour de la valeur moyenne.

Par exemple : Si par convention, la déviation standard par rapport à un échantillon équivaut à 15 points de QI de différence, cela signifie que les 2/3 environ de la population d'une classe d'âge ont un QI compris entre 85 et 115. Voir également à ce sujet l'intervalle de confiance d'une distribution normale gaussienne.

Interprétation d'un écart type élevé

Généralement, plus les valeurs sont largement distribuées, plus l'écart type est élevé. Imaginez, par exemple, que nous devions séparer deux ensembles différents de résultats d'examens de 30 élèves; les notes du premier examen varient de 31 % à 98 % et celles du second, de 82 % à 93 %. Compte tenu de ces étendues, l'écart type serait plus grand pour les résultats du premier examen.

Cependant, il n'est pas toujours facile d'évaluer l'importance que doit avoir l'écart type pour que les données soient largement dispersées.
L'importance de l'écart type dépend aussi de l'importance de la valeur moyenne de l'ensemble des données. Lorsque vous mesurez quelque chose en millions, le fait d'avoir des mesures qui se rapprochent de la valeur moyenne n'a pas la même signification que si vous mesurez le poids (Le poids est la force de pesanteur, d'origine gravitationnelle et inertielle, exercée par la Terre sur un corps massique en raison uniquement du...) de deux personnes.
Par exemple, si après avoir mesuré les recettes annuelles de deux grandes entreprises, vous constatez un écart de 100 000 euros, la différence est considérée comme étant peu significative, alors que si vous mesurez le poids de deux personnes, dont l'écart est de 30 kilogrammes (Le kilogramme (symbole kg) est l’unité de masse du Système international d'unités (SI).), la différence est considérée comme étant très significative.
Voilà pourquoi il est parfois utile de travailler, dans certains cas, sur l'écart type relatif (écart type quotienté par la moyenne).

On nomme variance le carré de l'écart type : V(X) = σ2

Source: Wikipédia publiée sous licence CC-BY-SA 3.0.

Vous pouvez soumettre une modification à cette définition sur cette page. La liste des auteurs de cet article est disponible ici.