Statistiques élémentaires continues
Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.
image:icone_math_élém.jpg
Cet article fait partie de la série
Mathématiques élémentaires
Algèbre
Analyse
Arithmétique
Géométrie
Logique (La logique (du grec logikê, dérivé de logos (λόγος), terme inventé par Xénocrate signifiant à la...)
Probabilité (La probabilité (du latin probabilitas) est une évaluation du caractère probable d'un évènement. En mathématiques, l'étude des probabilités est un sujet de grande importance donnant lieu à de...)
Statistique (Une statistique est, au premier abord, un nombre calculé à propos d'un échantillon. D'une façon générale, c'est le résultat de...)

Dans une enquête statistique, lorsque le caractère statistique peut prendre des valeurs multiples (taille, superficie (L'aire ou la superficie est une mesure d'une surface. Par métonymie, on désigne souvent cette mesure par le terme...), salaire…) le caractère statistique est considéré comme continu.

Traitement des données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un événement, etc.)

Lorsque les résultats de l'enquête statistique sont trop nombreux pour que la liste triée des valeurs soit lisible, on préfère perdre de l'information et ranger les données par intervalles appelés classes. Il faut alors que, dans chaque classe, la répartition des valeurs soit régulière. Sinon, il faut affiner et prendre des classes plus petites. Il n'est pas indispensable que les classes soient de même amplitude (Dans cette simple équation d’onde :), mais il est préférable de ne pas définir de classes de la forme " plus de ... " qui empêcherait alors tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou l'univers.) traitement ultérieur (histogramme, moyenne (La moyenne est une mesure statistique caractérisant les éléments d'un ensemble de quantités : elle exprime la grandeur qu'auraient chacun des membres de l'ensemble s'ils...)...). On compte alors le nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) de fois où la valeur du caractère tombe dans l'intervalle [xi;xi + 1[, ce nombre est appelé effectif de la classe [xi;xi + 1[.

Exemple de tableau statistique à classes : Répartition des revenus annuels en milliers d'euros dans une population de 4370 personnes.

Salaires entre 0 (inclus)
et 8 (exclus)
entre 8 (inclus)
et 12 (exclus)
entre 12 (inclus)
et 16 (exclus)
entre 16 (inclus)
et 20 (exclus)
entre 20 (inclus)
et 30 (exclus)
entre 30 (inclus)
et 40 (exclus)
entre 40 (inclus)
et 60 (exclus)
Total ( Total est la qualité de ce qui est complet, sans exception. D'un point de vue comptable, un total est le résultat d'une addition, c'est-à-dire une somme. Exemple : "Le total des...)
Effectifs 306 231 385 1180 1468 568 232 4370

Les effectifs ici sont trop grands pour que l'on puisse se faire une idée simple de la répartition, on préfère alors travailler en pourcentages ou fréquences et se ramener ainsi à une population de 100.

Salaires entre 0 (inclus)
et 8 (exclus)
entre 8 (inclus)
et 12 (exclus)
entre 12 (inclus)
et 16 (exclus)
entre 16 (inclus)
et 20 (exclus)
entre 20 (inclus)
et 30 (exclus)
entre 30 (inclus)
et 40 (exclus)
entre 40 (inclus)
et 60 (exclus)
Total
Fréquences 7,0 5,3 8,8 27,0 33,6 13,0 5,3 100

Moyenne

Puisque l’on a estimé que la répartition dans chaque classe était régulière, on peut affirmer que le milieu de la classe est représentatif de la classe. On va donc remplacer les ni individus de la classe [xi;xi + 1[ par ni individus dont le caractère statistique prendrait la valeur m_i = \frac{x_i+x_{i+1}}{2}. Puis on calcule la moyenne comme dans le cadre de la variable (En mathématiques et en logique, une variable est représentée par un symbole. Elle est utilisée pour marquer un rôle dans une...) discrète :

Salaires entre 0 (inclus)
et 8 (exclus)
entre 8 (inclus)
et 12 (exclus)
entre 12 (inclus)
et 16 (exclus)
entre 16 (inclus)
et 20 (exclus)
entre 20 (inclus)
et 30 (exclus)
entre 30 (inclus)
et 40 (exclus)
entre 40 (inclus)
et 60 (exclus)
Total
Effectifs 306 231 385 1180 1468 568 232 4370
Salaire moyen
de chaque classe
4 10 14 18 25 35 50 total des salaires
Total des salaires
de chaque classe
1224 2310 5390 21240 36700 19880 11600 98344

Le salaire moyen parmi cet échantillon (De manière générale, un échantillon est une petite quantité d'une matière, d'information, ou d'une solution. Le mot est utilisé dans différents domaines :) est donc de 98344/4370 = 22,5 soit environ 22500 Euros annuels.

La formule utilisée ici est : \overline{x}=\frac{\sum_{i=1}^N n_im_i}{\sum_{i=1}^N n_i}

La moyenne est un des critères de position (Les valeurs numériques d'un caractère statistique se répartissent dans , il est nécessaire de définir leurs positions.).

Représentations graphiques

Histogramme (L'histogramme est le graphe permettant de représenter l'impact de diverses variables continues.)

  • Voir article détaillé : Histogramme

Pour représenter graphiquement cette enquête statistique, le diagramme (Un diagramme est une représentation visuelle simplifiée et structurée des concepts, des idées, des constructions, des relations, des données statistiques, de l'anatomie etc. employé dans tous...) en bâtons est inapproprié. En effet, plus la classe est grande, plus l'effectif risque d'être important. Il faut donc représenter l'effectif de chaque classe par un rectangle (En géométrie, un rectangle est un quadrilatère dont les quatre angles sont des angles droits.) dont la base est l'amplitude de la classe et dont l'aire est proportionnelle à l'effectif ou à la fréquence (En physique, la fréquence désigne en général la mesure du nombre de fois qu'un phénomène périodique se reproduit par unité de temps. Ainsi lorsqu'on emploie le mot...). Ce diagramme s'appelle un histogramme.

Exemple: si 1% est représenté par 1 carreau unité.

Salaires entre 0 (inclus)
et 8 (exclus)
entre 8 (inclus)
et 12 (exclus)
entre 12 (inclus)
et 16 (exclus)
entre 16 (inclus)
et 20 (exclus)
entre 20 (inclus)
et 30 (exclus)
entre 30 (inclus)
et 40 (exclus)
entre 40 (inclus)
et 60 (exclus)
Fréquences 7,0 5,3 8,8 27,0 33,6 13,0 5,3
Amplitudes
ai = xi + 1xi
8 4 4 4 10 10 20
Hauteurs
hi = fi / ai
0,9 1,3 2,2 6,8 3,4 1,3 0,3

Il ne reste plus qu'à tracer l'histogramme:

Remarque : si les amplitudes des classes sont identiques, les hauteurs des rectangles sont proportionnelles aux effectifs ou aux fréquences.

Polygone (En géométrie euclidienne, un polygone (du grec polus, nombreux, et gônia, angle) est une figure géométrique plane, formée d'une suite...) des fréquences cumulées

Puisque la répartition dans chaque classe est supposée régulière, on peut admettre que l'accroissement de la fréquence est une fonction linéaire (Dans les mathématiques élémentaires, les fonctions linéaires sont les fonctions les plus simples que l'on rencontre. Ce sont des cas particuliers d'applications linéaires.). On trace (TRACE est un télescope spatial de la NASA conçu pour étudier la connexion entre le champ magnétique à petite échelle du Soleil et la géométrie du plasma coronal, à travers des...) alors le polygone des fréquences cumulées croissantes qui permet de lire la fréquence de la classe [x1;x] pour tout x.

Au préalable, il faut remplir le tableau des fréquences cumulées:

xi 0 8 12 16 20 30 40 60
Fréquences cumulées croissantes 0 7 12,3 21,1 48,1 81,7 94,7 100

Il ne reste plus qu'à tracer le polygone:

On peut construire de même le polygone des fréquences cumulées décroissantes.

Variance ( En statistique et en probabilité, variance En thermodynamique, variance ) et écart type (En mathématiques, l'écart type est une quantité réelle positive, éventuellement infinie, utilisée dans le domaine des probabilités pour caractériser la répartition d'une...)

Les formules précédemment établies pour les variables discrètes restent valables à condition de remplacer xi par mi milieu de la classe [xi;xi + 1[:

  • V = \sum_{i=1}^Nf_i(m_i-\overline{x})^2fi est la fréquence, mi le milieu de la classe et \overline{x} la moyenne.
  • \sigma = \sqrt{V}

L'écart type est une des critères de dispersion (Après avoir déterminé où se situent les valeurs du caractère statistique en cherchant des critères de position, on peut chercher à déterminer la dispersion de ces...)

Page générée en 0.144 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique