Statistiques élémentaires discrètes
Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.
image:icone_math_élém.jpg
Cet article fait partie de la série
Mathématiques élémentaires
Algèbre
Analyse
Arithmétique
Géométrie
Logique (La logique (du grec logikê, dérivé de logos (λόγος), terme inventé par Xénocrate signifiant à la fois raison, langage, et raisonnement) est dans une...)
Probabilité (La probabilité (du latin probabilitas) est une évaluation du caractère probable d'un évènement. En mathématiques, l'étude des probabilités est un sujet de grande importance donnant lieu...)
Statistique (Une statistique est, au premier abord, un nombre calculé à propos d'un échantillon. D'une façon générale, c'est le résultat de l'application d'une méthode statistique à un ensemble de...)

Dans une enquête statistique, lorsque le caractère statistique prend un nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) fini raisonnable de valeurs (note, nombre d’enfants, nombre de pièces, secteur d’activité…), le caractère statistique est appelé caractère discret.

Traitement des données

Les résultats d’une enquête consistent en une liste désordonnée d’informations.

Ex1 - note de la classe X : 10, 9, 12, 11, 10, 8, 14 ,11 ,9 ,16 ,5 ,12 ,10 ,11 ,10 ,13

Ex2 - couleur préférée : bleu (Bleu (de l'ancien haut-allemand « blao » = brillant) est une des trois couleurs primaires. Sa longueur d'onde est comprise approximativement...), rouge (La couleur rouge répond à différentes définitions, selon le système chromatique dont on fait usage.), bleu, bleu, jaune (Il existe (au minimum) cinq définitions du jaune qui désignent à peu près la même couleur :), bleu, rouge, bleu, bleu, jaune, jaune, bleu, jaune.

Il faut alors les trier, par ordre croissant, pour le caractère quantitatif, par genre, pour le caractère qualitatif.

Notes triées : 5, 8, 9, 9, 10, 10, 10, 10, 11, 11, 11, 12, 12, 13, 14, 16

Couleurs préférées triées : bleu, bleu, bleu, bleu, bleu, bleu, bleu, rouge, rouge, jaune, jaune, jaune, jaune.

Cette présentation sous forme de liste est peu exploitable, on décide alors de présenter les résultats de l’enquête sous forme d’un tableau (Tableau peut avoir plusieurs sens suivant le contexte employé :) d’effectifs. L’effectif d’une valeur est le nombre de fois où cette valeur apparaît.

Exemple 1: note des élèves

notes xi 5 8 9 10 11 12 13 14 16 Total ( Total est la qualité de ce qui est complet, sans exception. D'un point de vue comptable, un total est le résultat d'une addition, c'est-à-dire une somme. Exemple : "Le total des dettes". En physique le total n'est pas forcément...)
effectifs ni 1 1 2 4 3 2 1 1 1 16

Exemple 2: couleur préférée

Couleurs Effectifs ni
Bleu 7
Rouge 2
Jaune 4
Total 13

Lorsque la population étudiée est trop grande, ou bien lorsque l’on cherche à faire la comparaison entre deux populations de tailles différentes, on préfère se ramener à une population de 100, donc travailler en pourcentages, appelés ici fréquences.

Exemple 1: note des élèves

notes x_i 5 8 9 10 11 12 13 14 16 Total
fréquences fi en % 6,25 6,25 12,50 25,00 18,75 12,50 6,25 6,25 6,25 100

Exemple 2: couleur préférée

Couleurs Fréquences fien %
Bleu 53,85
Rouge 15,38
Jaune 30,77
Total 100

Notion de moyenne (La moyenne est une mesure statistique caractérisant les éléments d'un ensemble de quantités : elle exprime la grandeur qu'auraient chacun des membres de l'ensemble s'ils étaient tous identiques sans changer la...)

Imaginons que nous ayons une classe d'élèves de différentes tailles et que nous désirions faire représenter la classe par un élève idéal (En mathématiques, un idéal est une structure algébrique définie dans un anneau. Les idéaux généralisent de façon féconde l'étude de la divisibilité pour les entiers. Il est...) ni trop grand ni trop petit.Y a-t-il un élève qui ait la taille " représentative " de la classe et quelle est cette taille?

Exemple de classe (1) avec les mesures observées

Tailles en cm 178 180 182 181 179

En additionnant tous les résultats et en divisant par le nombre d'individus dans la classe, nous obtiendrons ce que l'on appelle la moyenne.

178+180+182+181+179=900

900/5 = 180

La moyenne est donc 180 cm

Autre exemple de classe

Classe (2) plus importante avec différents élèves ayant la même taille. Nous allons compter le nombre d'élèves ayant une taille donnée (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un événement, etc.) et placer les résultats dans un tableau.

xi 178 179 180 181 182 Nombre d'élèves
ni 5 2 3 1 4 =5+2+3+1+4=15= \sum_{i=1}^5n_i
xi.ni 178\times5 179\times2 180\times3 181\times1 182\times4 Somme des tailles
xi.ni 890 358 540 181 728 =890+358+540+181+728=2697= \sum_{i=1}^5n_i.x_i

La moyenne est ici le total des tailles à diviser par le nombre d'élèves: soit 2697/15 = 179,8 cm On calcule d'abord la somme des produits des mesures par le nombre de fois où l'on a observé ces mesures.

  • \sum_{i=1}^Nn_i.x_i

Ensuite on divise par le total de toutes les mesures.

  • \sum_{i=1}^Nn_i

La formule générale est donc :

  • m=\overline{x}=\frac{\sum_{i=1}^Nn_i.x_i}{\sum_{i=1}^Nn_i}

La moyenne est un des critères de position (Les valeurs numériques d'un caractère statistique se répartissent dans , il est nécessaire de définir leurs positions.)

Présentation des résultats

Les résultats obtenus se présentent, outre le tableau de mesures ci-dessus, par un diagramme (Un diagramme est une représentation visuelle simplifiée et structurée des concepts, des idées, des constructions, des relations, des données statistiques, de...) en bâtons ou encore par un diagramme en camembert.

Diagramme en bâtons

Reprenons la classe (2) et élevons pour chaque mesure un trait vertical (Le vertical (rare), ou style vertical, est un style d’écriture musicale consistant en accords plaqués.) proportionnel au nombre d'élèves. Nous obtenons un diagramme en bâtons.

diagramme_en_batons.png
Répartition des 15 élèves selon leur taille en cm.

Si nous regroupons maintenant chaque personne ayant une taille comprise entre 179 et 180 cm dans une même classe: la classe des 179 cm -180 cm (c'est ce que nous faisons dans la vie (La vie est le nom donné :) de tous les jours), il est préférable de traiter le caractère comme continu et de tracer un histogramme (L'histogramme est le graphe permettant de représenter l'impact de diverses variables continues.).

Diagramme en camembert

Pour un caractère qualitatif, on préfère le diagramme en camembert: on découpe un cercle (Un cercle est une courbe plane fermée constituée des points situés à égale distance d'un point nommé centre. La valeur de cette distance est appelée rayon du cercle. Celui-ci étant infiniment variable, il...) en " morceaux de tartes " dont la surface (Une surface désigne généralement la couche superficielle d'un objet. Le terme a plusieurs acceptions, parfois objet géométrique, parfois frontière physique, et est souvent abusivement confondu avec sa mesure,...) est proportionnelle à l'effectif ou la fréquence (En physique, la fréquence désigne en général la mesure du nombre de fois qu'un phénomène périodique se reproduit par unité de temps. Ainsi lorsqu'on emploie le mot fréquence sans précision, on...). Reprenons l'exemple des couleurs et complétons le tableau par le calcul des angles au centre.

Couleurs Fréquences fien % Angle (En géométrie, la notion générale d'angle se décline en plusieurs concepts apparentés.) en degré (Le mot degré a plusieurs significations, il est notamment employé dans les domaines suivants :)
Bleu 53,85 194
Rouge 15,38 55
Jaune 30,77 111
Total 100 360

Il ne reste plus qu'à dessiner les " parts de tarte ".

Image:Diagramme_en_camembert.PNG

Variance ( En statistique et en probabilité, variance En thermodynamique, variance ) et écart-type

Pour voir si les résultats s’agglomèrent autour (Autour est le nom que la nomenclature aviaire en langue française (mise à jour) donne à 31 espèces d'oiseaux qui, soit appartiennent au genre Accipiter, soit...) de la moyenne (courbe en forme de pic) ou au contraire s'étalent en prenant de nombreuses valeurs distinctes (courbe aplatie), on peut utiliser ce qu'on appelle un indice de dispersion (La dispersion, en mécanique ondulatoire, est le phénomène affectant une onde dans un milieu dispersif, c'est-à-dire dans lequel les différentes fréquences constituant l'onde...). Le plus connu a pour nom variance et est défini comme suit :

V = \sum_{i=1}^N f_i(x_i-\overline{x})^2 où les xi sont les valeurs du caractère statistique, les fi leurs fréquences d'apparition et \overline{x} la moyenne.

On définit aussi l'écart-type comme étant la racine carrée (La racine carrée d’un nombre réel positif x est le nombre positif dont le carré vaut x. On le note ou x½; dans cette...) de la variance

écart-type = \sigma=\sqrt{V}

Exemple  : Si la série comporte 3 mesures et que les nombres 3, 4 et 2 apparaissent une seule fois , la moyenne est 3 et la variance 0,667.

V = \frac{1(2-3)^2+ 1(3-3)^2+1(4-3)^2}{3}\approx 0,667
Comme le calcul de la variance se fait à partir des carrés des écarts, les unités de mesure ne sont pas les mêmes que celles des observations (L’observation est l’action de suivi attentif des phénomènes, sans volonté de les modifier, à l’aide de moyens d’enquête et d’étude appropriés. Le plaisir procuré explique la très grande...) originales. Par exemple, les longueurs mesurées en mètres (m) auront une variance mesurée en mètres carrés (m²).
L'écart-type, correspondant à la racine carrée de la variance nous donnera par contre l'unité utilisée dans l'échelle originale.
Page générée en 0.137 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique