Statistiques élémentaires discrètes - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Notion de moyenne

Imaginons que nous ayons une classe d'élèves de différentes tailles et que nous désirions faire représenter la classe par un élève idéal ni trop grand ni trop petit.Y a-t-il un élève qui ait la taille « représentative » de la classe et quelle est cette taille?

Exemple de classe (1) avec les mesures observées

Tailles en cm 178 180 182 181 179

En additionnant tous les résultats et en divisant par le nombre d'individus dans la classe, nous obtiendrons ce que l'on appelle la moyenne.

178+180+182+181+179=900

900/5 = 180

La moyenne est donc 180 cm.

Autre exemple de classe

Classe (2) plus importante avec différents élèves ayant la même taille. Nous allons compter le nombre d'élèves ayant une taille donnée et placer les résultats dans un tableau.

xi 178 179 180 181 182 Nombre d'élèves
ni 5 2 3 1 4 =5+2+3+1+4=15= \sum_{i=1}^5n_i
xi.ni 178  \times 5 179 \times 2 180 \times 3 181 \times 1 182 \times 4 Somme des tailles
xi.ni 890 358 540 181 728 =890+358+540+181+728=2697= \sum_{i=1}^5n_i.x_i

La moyenne est ici le total des tailles à diviser par le nombre d'élèves: soit 2697/15 = 179,8 cm.

On calcule d'abord la somme des produits des mesures par le nombre de fois où l'on a observé ces mesures.

  • \sum_{i=1}^Nn_i.x_i

Ensuite on divise par le total de toutes les mesures.

  • \sum_{i=1}^Nn_i

La formule générale est donc :

  • m=\overline{x}=\dfrac{\sum_{i=1}^Nn_i.x_i}{\sum_{i=1}^Nn_i}

La moyenne est un des critères de position.

Variance et écart-type

Pour voir si les résultats s’agglomèrent autour de la moyenne (courbe en forme de pic) ou au contraire s'étalent en prenant de nombreuses valeurs distinctes (courbe aplatie), on peut utiliser ce qu'on appelle un indice de dispersion. Le plus connu a pour nom variance et est défini comme suit :

V = \sum_{i=1}^N f_i(x_i-\overline{x})^2 où les xi sont les valeurs du caractère statistique, les fi leurs fréquences d'apparition et \overline{x} la moyenne.

On définit aussi l'écart-type comme étant la racine carrée de la variance

écart-type = \sigma=\sqrt{V}

Exemple  : Si la série comporte 3 mesures et que les nombres 3, 4 et 2 apparaissent une seule fois, la moyenne est 3 et la variance 0,667.

V = \dfrac{1(2-3)^2+ 1(3-3)^2+1(4-3)^2}{3}\approx 0,667
Comme le calcul de la variance se fait à partir des carrés des écarts, les unités de mesure ne sont pas les mêmes que celles des observations originales. Par exemple, les longueurs mesurées en mètres (m) auront une variance mesurée en mètres carrés (m²).
L'écart-type, correspondant à la racine carrée de la variance nous donnera par contre l'unité utilisée dans l'échelle originale.
Page générée en 0.104 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise