Critères de dispersion
Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.
image:icone_math_élém.jpg
Cet article fait partie de la série
Mathématiques élémentaires
Algèbre
Analyse
Arithmétique
Géométrie
Logique (La logique (du grec logikê, dérivé de logos (λόγος), terme inventé par Xénocrate signifiant à la fois raison, langage, et raisonnement) est dans une première approche l'étude des...)
Probabilité (La probabilité (du latin probabilitas) est une évaluation du caractère probable d'un évènement. En mathématiques, l'étude des probabilités est un sujet de grande importance donnant lieu...)
Statistique (La statistique est à la fois une science formelle, une méthode et une technique. Elle comprend la collecte, l'analyse, l'interprétation de données ainsi que la présentation de...)

Après avoir déterminé où se situent les valeurs du caractère statistique (Une statistique est, au premier abord, un nombre calculé à propos d'un échantillon. D'une façon générale, c'est le résultat de l'application d'une méthode statistique à un...) en cherchant des critères de position (Les valeurs numériques d'un caractère statistique se répartissent dans , il est nécessaire de définir leurs positions.), on peut chercher à déterminer la dispersion (La dispersion, en mécanique ondulatoire, est le phénomène affectant une onde dans un milieu dispersif, c'est-à-dire dans lequel les...) de ces valeurs.

En mesure physique (La physique (du grec φυσις, la nature) est étymologiquement la « science de la nature ». Dans un sens général et ancien, la physique...) (métrologie), cette dispersion est estimée par l'écart type (En mathématiques, l'écart type est une quantité réelle positive, éventuellement infinie, utilisée dans le domaine des probabilités pour caractériser la répartition d'une variable...), qui sert à calculer l'erreur de mesure. De manière plus générale, il est important de savoir si les valeurs sont groupées ou au contraire dispersées, ce qui indique si la population est uniforme ou pas vis-à-vis du critère testé.

Étendue

L'étendue est la différence entre la valeur maximale et la valeur minimale du caractère statistique.

étendue =xmaxxmin

Écart interquartile

L'écart inter-quartile est la différence entre le troisième et le premier quartile (En statistique descriptive, un quartile est chacune des 3 valeurs qui divisent les données triées en 4 parts égales, de sorte que chaque partie représente 1/4 de l'échantillon...).

écart interquartile = Q3 - Q1

L'écart interquartile correspond à l'étendue de la série statistique après élimination de 25% des valeurs les plus faibles et de 25% des valeurs les plus fortes.

Dispersion autour (Autour est le nom que la nomenclature aviaire en langue française (mise à jour) donne à 31 espèces d'oiseaux qui, soit appartiennent au genre Accipiter, soit constituent les 5 genres...) de la moyenne (La moyenne est une mesure statistique caractérisant les éléments d'un ensemble de quantités : elle exprime la grandeur qu'auraient...)

Après avoir calculé la moyenne, \overline{x}, on peut chercher à savoir de quelle façon les valeurs s'éloignent de cette moyenne. On crée alors une nouvelle série statistique: la série des écarts.

e_i=x_i - \overline{x}

Ecart moyen

Le premier réflexe (Le réflexe d'une façon générale fait intervenir des propriétés intégratrices d'un centre nerveux. Il résulte d'un réflexe des activités musculaires en réponse à un stimulus. Ces activités musculaires sont involontaires,...) serait de calculer la moyenne de ces écarts. Mais les propriétés de la moyenne nous assurent que la moyenne des écarts est nulle. En effet, certains de ces écarts sont négatifs et d'autres sont positifs, la somme des écarts positifs compensant exactement la somme des écarts négatifs. Il faut donc s'abstraire du signe et calculer alors la moyenne de la valeur absolue (Un nombre réel est constitué de deux parties: un signe + ou - et une valeur absolue.) des écarts. C'est ce que l'on appelle l'écart moyen.

  • écart moyen = \frac{1}{n}\sum_{i=1}^n|x_i-\overline{x}| dans le cas d'une série discrète non triée.
  • écart moyen = \frac{\sum_{i=1}^nn_i|x_i-\overline{x}|}{\sum_{i=1}^nn_i}=\sum_{i=1}^nf_i|x_i-\overline{x}| dans le cas d'une série discrète regroupée.
  • écart moyen = \frac{\sum_{i=1}^nn_i|m_i-\overline{x}|}{\sum_{i=1}^nn_i}=\sum_{i=1}^nf_i|m_i-\overline{x}| dans le cas d'une série continue.

Variance ( En statistique et en probabilité, variance En thermodynamique, variance )

L'utilisation des valeurs absolues est souvent une impasse en mathématique (Les mathématiques constituent un domaine de connaissances abstraites construites à l'aide de raisonnements logiques sur des concepts tels que les nombres, les figures, les structures et les transformations....) (parce que la fonction valeur absolue (L'absolue est un extrait obtenu à partir d’une concrète ou d’un résinoïde par extraction à l’éthanol à température ambiante ou plus...) n'est pas dérivable). Pour rendre positifs les écarts, un autre outil (Un outil est un objet finalisé utilisé par un être vivant dans le but d'augmenter son efficacité naturelle dans l'action. Cette augmentation se traduit par la simplification des actions entreprises, par une plus...) est à notre disposition: la mise au carré (Un carré est un polygone régulier à quatre côtés. Cela signifie que ses quatre côtés ont la même longueur et ses quatre angles la même mesure. Un carré est à la fois un rectangle et un...). On ne va donc pas calculer la moyenne des écarts mais la moyenne des écarts au carré. C'est ce qu'on appelle la variance :

  • V=\frac{1}{n}\sum_{i=1}^n(x_i-\overline{x})^2 dans le cas d'une série discrète non triée.
  • V=\frac{\sum_{i=1}^nn_i(x_i-\overline{x})^2}{\sum_{i=1}^nn_i}=\sum_{i=1}^nf_i(x_i-\overline{x})^2 dans le cas d'une série discrète regroupée.
  • V=\frac{\sum_{i=1}^nn_i(m_i-\overline{x})^2}{\sum_{i=1}^nn_i}=\sum_{i=1}^nf_i(m_i-\overline{x})^2 dans le cas d'une série continue.

La disparition des valeurs absolues permet des calculs plus simples. On démontre que la variance peut se calculer plus simplement par les formules suivantes:

  • V=\frac{1}{n}\left(\sum_{i=1}^nx_i^2\right)-\overline{x}^2 dans le cas d'une série discrète non triée.
  • V=\frac{\sum_{i=1}^nn_ix_i^2}{\sum_{i=1}^nn_i}-\overline{x}^2=\left(\sum_{i=1}^nf_ix_i^2\right)-\overline{x}^2 dans le cas d'une série discrète regroupée.
  • V=\frac{\sum_{i=1}^nn_im_i^2}{\sum_{i=1}^nn_i}-\overline{x}^2=\left(\sum_{i=1}^nf_im_i^2\right)-\overline{x}^2 dans le cas d'une série continue.

Ces formules étaient surtout utiles dans le cadre de calculs à la main ; l'usage (L’usage est l'action de se servir de quelque chose.) des ordinateurs les rend un peu obsolètes...

Écart type

De par la mise au carré des écarts, l'unité de la variance est le carré de celle du caractère (si le caractère est en kg, sa moyenne est en kg mais sa variance est en kg2) d'ou l'impossibilité d'additionner la moyenne et la variance. On a donc défini l'écart type noté σ. L'écart type est la racine de la variance (et donc son unité est la même que celle de la moyenne. Cela a l'air (L'air est le mélange de gaz constituant l'atmosphère de la Terre. Il est inodore et incolore. Du fait de la diminution de la pression de l'air avec...) anecdotique mais la possibilité d'additionner moyenne et écart type est fondamentale (En musique, le mot fondamentale peut renvoyer à plusieurs sens.), en particulier pour le calcul d'intervalle de confiance (voir plus bas).

  • \sigma=\sqrt{\frac{1}{n}\sum_{i=1}^n(x_i-\overline{x})^2} dans le cas d'une série discrète non triée.
  • \sigma=\sqrt{\frac{\sum_{i=1}^nn_i(x_i-\overline{x})^2}{\sum_{i=1}^nn_i}}=\sqrt{\sum_{i=1}^nf_i(x_i-\overline{x})^2} dans le cas d'une série discrète regroupée.
  • \sigma=\sqrt{\frac{\sum_{i=1}^nn_i(m_i-\overline{x})^2}{\sum_{i=1}^nn_i}}=\sqrt{\sum_{i=1}^nf_i(m_i-\overline{x})^2} dans le cas d'une série continue.

Propriétés de l'écart type

  • Invariance par translation. L'écart type n'est pas modifié si on ajoute ou retranche une constante à la série statistique. Si yi = xi + C alors σy = σx.
  • Stabilité par multiplication (La multiplication est l'une des quatre opérations de l'arithmétique élémentaire avec l'addition, la soustraction et la division .) par une constante. Si on multiplie une série par une constante positive, l'écart type est multiplié par la même constante. Si yi = Kxi alors σy = Kσx.
  • L'écart type est toujours positif et est nul si la série statistique est constante.
  • Sensibilité aux valeurs extrêmes. Comme la moyenne, l'écart type est sensible aux valeurs extrêmes ou aberrantes et il est parfois nécessaire d'éliminer ces valeurs avant de faire le calcul de l'écart type.

Écart type relatif

Pour comparer deux séries statistiques qui n'ont pas le même ordre de grandeur, il est parfois bon de comparer l'écart type et la moyenne en faisant le quotient, on obtient alors l'écart type relatif. \sigma / \overline{x}.

Remarque l'écart type relatif est aussi appelé coefficient (En mathématiques un coefficient est un facteur multiplicatif qui dépend d'un certain objet, comme une variable (par exemple, les coefficients d'un polynôme), un espace vectoriel, une fonction de base et ainsi de suite....) de variation

Intervalle de confiance ou plage (La géomorphologie définit une plage comme une « accumulation sur le bord de mer de matériaux d'une taille allant des sables fins aux blocs ». La plage ne se limite donc pas aux étendues de sable fin ; on trouve...) de normalité

Lorsque le caractère statistique a une distribution normale gaussienne, grossièrement en forme de cloche, l'écart type prend tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou l'univers.) son sens (SENS (Strategies for Engineered Negligible Senescence) est un projet scientifique qui a pour but l'extension radicale de l'espérance de vie humaine. Par une évolution progressive allant du ralentissement du...).

  • Dans l'intervalle [\overline{x}-\sigma;\overline{x}+\sigma], on trouve 68% de la population.
  • Dans l'intervalle [\overline{x}-2\sigma;\overline{x}+2\sigma], on trouve 95% de la population.
  • Dans l'intervalle [\overline{x}-3\sigma;\overline{x}+3\sigma], on trouve 99,7% de la population.

On appelle ces intervalles les plages de normalité à niveau de confiance de 68%, 95%, 99,7%.

Question de minimum

La médiane (Le terme de médiane, du latin medius, qui est au milieu, possède plusieurs acceptations en mathématiques :) est la valeur qui rend minimum la fonction f définie par

  • f(X)=\frac{1}{n}\sum_{i=1}^n|x_i-X| dans le cas d'une série discrète triée non regroupée.

La moyenne est la valeur qui rend minimum la fonction g définie par

  • g(X)=\sqrt{\frac{1}{n}\sum_{i=1}^n(x_i-X)^2} dans le cas d'une série discrète non triée.
  • g(X)=\sqrt{\frac{\sum_{i=1}^nn_i(x_i-X)^2}{\sum_{i=1}^nn_i}}=\sqrt{\sum_{i=1}^nf_i(x_i-X)^2} dans le cas d'une série discrète regroupée.
  • g(X)=\sqrt{\frac{\sum_{i=1}^nn_i(m_i-X)^2}{\sum_{i=1}^nn_i}}=\sqrt{\sum_{i=1}^nf_i(m_i-X)^2} dans le cas d'une série continue.
Page générée en 0.088 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique