Critère de position - Définition et Explications

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Introduction

Icone math élém.jpg
Algèbre
Logique
Arithmétique
Probabilités
Statistiques

Les critères de position d'un ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection...) (de valeurs numériques d'un caractère statistique (La statistique est à la fois une science formelle, une méthode et une technique. Elle...) donné) sont quelques valeurs calculées caractérisant globalement la position de cet ensemble, par exemple sa moyenne (La moyenne est une mesure statistique caractérisant les éléments d'un ensemble de...), son mode, sa médiane (Le terme de médiane, du latin medius, qui est au milieu, possède plusieurs acceptations en...), ou ses quantiles (quartiles, déciles) Dans le jargon mathématique belge, on les appelle aussi les valeurs centrales.

En statistiques, on est en général en présence d'un grand nombre (La notion de nombre en linguistique est traitée à l’article « Nombre...) de valeurs. Or, si l'intégralité de ces valeurs forme l'information, il n'est pas aisé de manipuler plusieurs centaines voir milliers de chiffres, ni d'en tirer des conclusions. Il faut donc calculer quelques valeurs qui vont permettre d'analyser les données.

En mesure physique (La mesure physique est l'estimation ou la détermination d'une dimension spécifique...) (métrologie), on va en général calculer deux valeurs : la moyenne, qui représentera la « valeur » de la mesure, et l'écart type (En mathématiques, l'écart type est une quantité réelle positive, éventuellement infinie,...), qui va estimer l'erreur de mesure. Dans d'autres domaines, on va vouloir avoir une description plus fine de la répartition des valeurs, et donc calculer d'autres positions.

Valeur maximum et valeur minimum

La valeur maximale est la plus grande valeur prise par le caractère statistique (Une statistique est, au premier abord, un nombre calculé à propos d'un échantillon....).

La valeur minimale est la plus petite valeur prise par le caractère statistique.

Moyenne

Cas de la série statistique discrète triée mais non regroupée

\overline{x}=\dfrac{1}{n}\sum_{i=1}^{n}x_i

L'article Statistiques élémentaires discrètes (Dans une enquête statistique, lorsque le caractère statistique prend un nombre fini raisonnable...) explique cette formule.

Cas de la série statistique discrète regroupée

\overline{x}=\dfrac{\sum_{i=1}^{N}n_ix_i}{\sum_{i=1}^Nn_i}=\sum_{i=1}^Nf_ix_i

L'article Statistiques élémentaires discrètes explique cette formule.

Cas de la série continue

*\overline{x}=\dfrac{\sum_{i=1}^{N}n_im_i}{\sum_{i=1}^Nn_i}=\sum_{i=1}^Nf_im_i

L'article Statistiques élémentaires continues (Dans une enquête statistique, lorsque le caractère statistique peut prendre des valeurs multiples...) explique cette formule.

Stabilité par transformation affine (En mathématiques, affine peut correspondre à :)

La moyenne est stable par transformation affine, c'est-à-dire : si yi = axi + b, si \overline{x} est la moyenne de la série x alors la moyenne de la série y est \overline{y} = a\overline{x}+b.

Cette propriété est utile pour changer d'unité: si on connaît une moyenne de température (La température est une grandeur physique mesurée à l'aide d'un thermomètre et...) en degré (Le mot degré a plusieurs significations, il est notamment employé dans les domaines...) Fahrenheit, il est inutile de convertir toutes les valeurs en degrés Celsius pour calculer la moyenne en degrés Celsius, il suffit de ne convertir que la moyenne.

Il est aussi intéressant, pour limiter la taille des nombres, de partir d'un moyenne estimée et de calculer la moyenne des di = xiMestim.. Alors \overline{x} = M_{estim.} + \overline{d}

Découpage en sous-population

Si la population est découpée en deux sous-populations P1 et P2 de tailles n1 et n2, si la moyenne du caractère statistique pour la population P1 est \overline{x_1} et la moyenne pour la population P2 est \overline{x_2} alors la moyenne pour la population P est \overline{x} = \dfrac{n_1\overline{x_1}+n_2\overline{x_2}}{n_1+n_2}.

Sensibilité aux valeurs extrêmes

La moyenne est sensible aux valeurs extrêmes ou aberrantes.

Exemple: dans une entreprise, 9 salariés sont payés 2000 Euros mensuels. Le patron se paie 22000 Euros mensuels.

Effectuer la moyenne dans ces conditions conduit à une valeur non représentative: \overline{x}=\dfrac{9\times2000+22000}{10}=4000 Euros.

Pour éviter ce genre de piège, il arrive que l'on tronque volontairement la population et qu'on élimine 10% des valeurs les plus basses et 10% des valeurs les plus hautes.

Médiane

La médiane tend à partager la population en deux populations de taille égale. Si m est la médiane, le nombre d"individus dont le caractère statistique est inférieur à m doit correspondre au nombre d'individus dont le caractère statistique est supérieur à m. Si cette définition (Une définition est un discours qui dit ce qu'est une chose ou ce que signifie un nom. D'où la...) s'accorde bien avec le cas d'une variable (En mathématiques et en logique, une variable est représentée par un symbole. Elle...) continue, elle n'est pas adaptée au cas d'une variable discrète où une autre définition est donnée (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent...). Si les valeurs du caractère statistique sont toutes différentes, la médiane, telle qu'elle est définie dans le cas discret, partage bien la population en deux, mais ce n'est pas toujours le cas si certaines valeurs du caractère statistique sont prises plusieurs fois.

Cas de la variable discrète

On trie les valeurs par ordre croissant.

  • Si la population comporte n individus et si n est impair alors n = 2p+1, la médiane sera la (p+1)e valeur du caractère statistique.
Exemple: série de 13 notes 4, 5, 7, 8, 8, 9, 10, 10, 10, 11,12, 13, 16.
Médiane = M = 10
  • Si la population comporte n individus et si n est pair alors n = 2p, la médiane sera la moyenne entre la pe et (p+1)e valeur du caractère statistique.
Exemple: série de 12 notes: 4, 5, 7, 8, 8, 9, 10, 10, 10, 11, 13, 16.
Médiane = M = 9,5

Cas de la variable continue

On utilise le polygone (En géométrie euclidienne, un polygone (du grec polus, nombreux, et gônia, angle) est...) des fréquences cumulées croissantes et le tableau (Tableau peut avoir plusieurs sens suivant le contexte employé :) correspondant et on détermine graphiquement ou par interpolation linéaire la valeur M pour laquelle la fréquence (En physique, la fréquence désigne en général la mesure du nombre de fois qu'un...) de l'intervalle [valeur min, M] vaut 50%.

Utilisation du polygone des fréquences cumulées croissantes

Dans l'exemple développé dans statistiques élémentaires continues, le polygone des fréquences cumulées est le suivant:

Polygone et mediane.png

La droite d'équation (En mathématiques, une équation est une égalité qui lie différentes quantités, généralement...) y = 50 coupe le polygone environ au point (Graphie) d'abscisse 21. M \approx 21.

Remarque: Le polygone des fréquences cumulées croissantes et celui des fréquences cumulées décroissantes se coupent exactement en un point dont l'abscisse est la médiane.

Utilisation du tableau des fréquences cumulées croissantes

Dans l'exemple précédent, le tableau des fréquences cumulées croissantes est :

xi 0 8 12 16 20 30 40 60
fréquences cumulées croissantes 0 7 12,3 21,1 48,1 81,7 94,7 100

Les 50% sont atteint entre 20 et 30 donc pour une valeur M que l'on estime à 20+10\dfrac{50-48,1}{81,7-48,1}= 20,56 par interpolation linéaire.

Page générée en 0.011 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique