Cet article fait partie de la série Mathématiques élémentaires |
Algèbre |
Analyse |
Arithmétique |
Géométrie |
Logique |
Probabilité |
Statistique |
Après avoir déterminé où se situent les valeurs du caractère statistique en cherchant des critères de position, on peut chercher à déterminer la dispersion de ces valeurs.
En mesure physique (métrologie), cette dispersion est estimée par l'écart type, qui sert à calculer l'erreur de mesure. De manière plus générale, il est important de savoir si les valeurs sont groupées ou au contraire dispersées, ce qui indique si la population est uniforme ou pas vis-à-vis du critère testé.
L'étendue est la différence entre la valeur maximale et la valeur minimale du caractère statistique.
L'écart inter-quartile est la différence entre le troisième et le premier quartile.
L'écart interquartile correspond à l'étendue de la série statistique après élimination de 25% des valeurs les plus faibles et de 25% des valeurs les plus fortes.
Après avoir calculé la moyenne,
Le premier réflexe serait de calculer la moyenne de ces écarts. Mais les propriétés de la moyenne nous assurent que la moyenne des écarts est nulle. En effet, certains de ces écarts sont négatifs et d'autres sont positifs, la somme des écarts positifs compensant exactement la somme des écarts négatifs. Il faut donc s'abstraire du signe et calculer alors la moyenne de la valeur absolue des écarts. C'est ce que l'on appelle l'écart moyen.
L'utilisation des valeurs absolues est souvent une impasse en mathématique (parce que la fonction valeur absolue n'est pas dérivable). Pour rendre positifs les écarts, un autre outil est à notre disposition: la mise au carré. On ne va donc pas calculer la moyenne des écarts mais la moyenne des écarts au carré. C'est ce qu'on appelle la variance :
La disparition des valeurs absolues permet des calculs plus simples. On démontre que la variance peut se calculer plus simplement par les formules suivantes:
Ces formules étaient surtout utiles dans le cadre de calculs à la main ; l'usage des ordinateurs les rend un peu obsolètes...
De par la mise au carré des écarts, l'unité de la variance est le carré de celle du caractère (si le caractère est en kg, sa moyenne est en kg mais sa variance est en kg2) d'ou l'impossibilité d'additionner la moyenne et la variance. On a donc défini l'écart type noté σ. L'écart type est la racine de la variance (et donc son unité est la même que celle de la moyenne. Cela a l'air anecdotique mais la possibilité d'additionner moyenne et écart type est fondamentale, en particulier pour le calcul d'intervalle de confiance (voir plus bas).
Pour comparer deux séries statistiques qui n'ont pas le même ordre de grandeur, il est parfois bon de comparer l'écart type et la moyenne en faisant le quotient, on obtient alors l'écart type relatif.
Remarque l'écart type relatif est aussi appelé coefficient de variation
Lorsque le caractère statistique a une distribution normale gaussienne, grossièrement en forme de cloche, l'écart type prend tout son sens.
On appelle ces intervalles les plages de normalité à niveau de confiance de 68%, 95%, 99,7%.
La médiane est la valeur qui rend minimum la fonction f définie par
La moyenne est la valeur qui rend minimum la fonction g définie par