Histogramme
Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

L'histogramme est le graphe permettant de représenter l'impact de diverses variables continues.

Construction théorique

Soit \left([a_i,a_{i+1}[,n_i\right)_i, la distribution statistique d'une variable aléatoire continue. Pour chaque classe [ai,ai + 1[, nous allons associer un rectangle (En géométrie, un rectangle est un quadrilatère dont les quatre angles sont des angles droits.) de largeur (La largeur d’un objet représente sa dimension perpendiculaire à sa longueur, soit la mesure la plus étroite de sa face. En géométrie plane, la largeur est la plus petite des deux mesures...) ai + 1ai et d'aire l'effectif ni.

Si l'unité d'aire est le carré (Un carré est un polygone régulier à quatre côtés. Cela signifie que ses quatre côtés ont la même longueur et ses quatre angles la même mesure. Un carré est...) unité, la hauteur (La hauteur a plusieurs significations suivant le domaine abordé.) du rectangle est donc \frac{n_i}{a_{i+1}-a_i}.

Plus généralement, pour un même effectif, si l'amplitude (Dans cette simple équation d’onde :) de la classe est deux fois plus grande, la hauteur du rectangle doit être deux fois plus petite.

Exemple

Considérons une population d’individus et intéressons nous à leurs tailles respectives.

Le relevé de leurs tailles donne la répartition suivante :

Classe
(unité : mètre)
Nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) de personnes
dont la taille
est incluse dans la classe
[1,60 ;1,70[ 16
[1,70 ;1,75[ 15
[1,75 ;1,80[ 18
[1,80 ;1,85[ 7
[1,85 ;1,95[ 8
[1,95 ;2,05[ 2
Ce qui donne l’histogramme suivant :

L'amplitude des classes [1,60;1,70[, [1,85;1,95[ et [1,95;2,05[ est de 0,10 m. Les trois classes [1,70;1,75[, [1,75;1,80[ et [1,80;1,85[ est de 0,05 m. Elles ont une largeur moitié moins grande. Si l'unité d'aire est donnée (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un événement, etc.) par un rectangle de base 0,05 et de hauteur 1 unité, les hauteurs du premier et des deux derniers rectangles doivent être respectivement de 8,4 et 1 unités.

L’histogramme un outil (Un outil est un objet finalisé utilisé par un être vivant dans le but d'augmenter son efficacité naturelle dans l'action. Cette augmentation se traduit...) pour la gestion de la qualité (La gestion de la qualité est l'ensemble des activités qui concourent à l'obtention de la qualité dans un cadre de production de biens ou de services.)

L’histogramme est un moyen simple et rapide pour représenter la distribution d’un paramètre (Un paramètre est au sens large un élément d'information à prendre en compte pour prendre une décision ou pour effectuer un calcul.) obtenu lors d’une fabrication.

Exemple :

  • diamètre (Dans un cercle ou une sphère, le diamètre est un segment de droite passant par le centre et limité par les points du cercle ou de la...) d’un arbre (Un arbre est une plante terrestre capable de se développer par elle-même en hauteur, en général au delà de sept mètres. Les arbres acquièrent une structure rigide composée d'un tronc qui...) après usinage,
  • dureté (Il existe différentes définitions de la dureté : pour un solide (minéral ou métal) et pour l'eau.) d’une série de pièces après un traitement thermique (Le traitement thermique d'une pièce consiste à lui faire subir des transformations de structure grâce à des cycles prédéterminés de chauffage et de...),
  • concentration d’un élément dans la composition d’alliages produit par une fonderie (La fonderie est l'un des procédés de formage des métaux qui consiste à couler un métal ou un alliage liquide dans un moule pour reproduire, après refroidissement, une...),
  • masse (Le terme masse est utilisé pour désigner deux grandeurs attachées à un corps : l'une quantifie l'inertie du corps (la masse inerte) et l'autre la contribution du corps à la force de gravitation (la...) de préparation alimentaire dans une boîte de conserve
  • etc

L’histogramme est un outil " visuel " qui permet de détecter certaines anomalies ou de faire un diagnostic (Le diagnostic (du grec δι?γνωση, diágnosi, à partir de δια-, dia-, „par, à travers, séparation, distinction“ et γν?ση, gnósi, „la...) avant d’engager une démarche d’amélioration. Utilisé dans ce cadre, l’histogramme est un outil " qualitatif ". Pour pouvoir bien mener l’étude de la dispersion (La dispersion, en mécanique ondulatoire, est le phénomène affectant une onde dans un milieu dispersif, c'est-à-dire dans lequel les différentes...) d’un paramètre à l’aide d’un ou de plusieurs histogrammes, il faut avoir une bonne connaissance du paramètre étudié. De même, il faut connaître les conditions de collecte des données : fréquence (En physique, la fréquence désigne en général la mesure du nombre de fois qu'un phénomène périodique se reproduit par...) de mesure, outil de mesure utilisé, possibilité de mélange (Un mélange est une association de deux ou plusieurs substances solides, liquides ou gazeuses qui n'interagissent pas chimiquement. Le résultat de l'opération est une préparation aussi...) de lots, possibilité de tri etc.

Construction d’un histogramme (L'histogramme est le graphe permettant de représenter l'impact de diverses variables continues.)

Collecte des données

La première phase (Le mot phase peut avoir plusieurs significations, il employé dans plusieurs domaines et principalement en physique :) est la collecte des données en cours de fabrication. Cette collecte peut être réalisée soit de façon exceptionnelle à l’occasion de l’étude du paramètre soit en utilisant un relevé automatique (L'automatique fait partie des sciences de l'ingénieur. Cette discipline traite de la modélisation, de l'analyse, de la commande et, de la régulation des systèmes dynamiques. Elle a pour fondements théoriques les mathématiques, la théorie du...) ou manuel fait lors d’un contrôle (Le mot contrôle peut avoir plusieurs sens. Il peut être employé comme synonyme d'examen, de vérification et de maîtrise.) réalisé dans le cadre de la surveillance du procédé de fabrication.

Sans qu’il soit réellement possible de donner un nombre minimum, il faut que le nombre de valeurs relevées soit suffisant. Plus l’on dispose d’un nombre élevé de valeurs, plus l’interprétation sera aisée.

Nombre de classes

La première opération est de déterminer le nombre de classes de l’histogramme. Généralement, dans le cadre d’une analyse de ce type, on utilise des classes de largeur identique.

Le nombre de classes dépend du nombre de valeurs N dont on dispose.

Le nombre de classe K (Ces navires britanniques de la Première Guerre Mondiale présentent les caractéristiques suivantes :) peut être déterminé par la formule suivante :

K= 1 + \frac{10 \log(N)}{3}

ou plus simplement

K = \sqrt{N}\,

Cependant, l’histogramme étant un outil visuel, il est possible de faire varier le nombre de classes. Ceci permet de voir l’histogramme avec un nombre différent de classes et ainsi de trouver le meilleur compromis qui facilitera l’interprétation. L’utilisation d’un logiciel (En informatique, un logiciel est un ensemble d'informations relatives à des traitements effectués automatiquement par un appareil informatique. Y sont inclus les...) dédié ou plus simplement d’un tableur facilite cette opération.

Intervalles de classe

L’amplitude w de l’histogramme est

w = \hbox{valeur maximale} - \hbox{valeur minimale}\,

L’amplitude h théorique de chaque classe est alors :

h = \frac{w}{K}

Il faut arrondir cette valeur à un multiple de résolution de l’instrument de mesure (arrondi à l'excès).

Exemple : Soit la masse d’une préparation culinaire avant conditionnement. Le calcul d'amplitude de classe donne hth = 0,014 kg. La résolution de la balance utilisée est de 0,001 kg. On arrondit la valeur h à 0,015 kg.

Les classes peuvent être du type [limite inférieure ; limite supérieure[ ou ] limite inférieure ; limite supérieure].

La valeur minimale de la première classe (Dans un moyen de transport (avion, train ou bateau), la première classe est la classe la plus confortable et celle offrant généralement le plus de prestations. En...) est donnée (Dans les technologies de l'information, une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction, d'un événement, etc.) par la valeur minimale de la série moins une demi-résolution.

Exemple : la valeur la plus petite relevée lors de la fabrication de la préparation culinaire est de 0,498 g. La limite inférieur sera : 0,498 – (0,001 / 2) = 0,4975 kg.

Pour plus de facilité, il est préférable de prendre une valeurs " ronde " par exemple 0,495 kg

Exemple

Soit la fabrication de rations alimentaires, la pesée des rations avant emballage donne la série de mesures suivantes en kg :

0,547 0,563 0,532 0,521 0,514 0,547 0,578 0,532 0,552 0,526 0,534 0,560 0,502 0,503 0,516 0,565
0,532 0,574 0,521 0,523 0,542 0,539 0,543 0,548 0,565 0,569 0,574 0,596 0,547 0,578 0,532 0,552
0,554 0,596 0,529 0,555 0,559 0,503 0,499 0,526 0,551 0,589 0,588 0,568 0,564 0,568 0,556 0,523
0,526 0,579 0,551 0,584 0,551 0,512 0,536 0,567 0,512 0,553 0,534 0,559 0,498 0,567 0,589 0,579

Les caractéristiques du relevé sont les suivantes :

  • Le nombre d'échantillons : N=64
  • L'étendue : w=0,098 kg
  • Valeur minimale : 0,498 kg
  • Valeur maximale : 0,596 kg

On en déduit les paramètres suivants pour l'histogramme :

  • Le nombre de classes est de 7 (en utilisant la formule avec le logarithme)
  • L'amplitude de classe est 0,098/7 = 0,014 kg que l'on arrondit à 0,015 kg (résolution de la balance : 0,001 kg)
  • La valeur minimale de la première classe est de 0,498 – (0,001/2) = 0,4975. Par souci de facilité pour l'interprétation, on peut arrondir cette valeur à 0,495 kg.

On obtient l'histogramme suivant

Interprétation d'un histogramme

Comparaison d'un histogramme avec la courbe d'une loi normale

La distribution de beaucoup de paramètres industriels correspond souvent à une loi normale. On compare souvent l'histogramme obtenu au profil " en cloche " de la loi normale. Cette comparaison est visuelle et même si elle peut être une première approche, elle ne constitue pas un test de " normalité ". Pour cela, il faut exécuter un test dont un des plus classique est la droite de Henry (La droite de Henry est une méthode pour visualiser les chances qu'a une distribution d'être gaussienne. Elle permet de lire rapidement la moyenne et l'écart type d'une telle distribution.).

Nota : la distribution suivant la loi normale, si elle est extrêmement fréquente, n'est pas systématique (En sciences de la vie et en histoire naturelle, la systématique est la science qui a pour objet de dénombrer et de classer les taxons dans un certain ordre, basé sur des principes divers. Elle ne doit...). On vérifiera que la distribution ne correspond pas à une distribution de défaut de forme (exemple : mesure de l'excentration dans un tube, position d'objets lancés dans la direction d'un mur (Un mur est une structure solide qui sépare ou délimite deux espaces.) dont certains rebondissent sur ce mur).

L'interprétation peut, par exemple, donner les résultats suivants :

Histogramme montrant un mélange de deux lots. Histogramme montrant un mélange de deux lots mais avec une moyenne (La moyenne est une mesure statistique caractérisant les éléments d'un ensemble de quantités : elle exprime la grandeur qu'auraient chacun des membres de l'ensemble s'ils étaient tous identiques sans...) proche. On veillera dans ce cas à faire aussi varier le nombre de classes pour vérifier qu'il ne s'agit pas d'un problème de construction. Histogramme montrant que le lot a subi un tri. Tous les éléments pour lesquels la valeur du paramètre mesuré était inférieure à A ont été supprimés.

Nota : dans le cas d'histogramme montrant un mélange de deux lots ayant une moyenne différente (En mathématiques, la différente est définie en théorie algébrique des nombres pour mesurer l'éventuel défaut de dualité d'une application définie à l'aide de...), il existe des cas où la dispersion présente cet aspect sans pour autant incriminer un mélange. C'est par exemple le cas de la mesure d'une pièce cylindrique mais qui présente un défaut de type ovalisation. Les deux moyennes représentent alors le grand diamètre et le petit diamètre. C'est la connaissance du procédé et/ou du produit qui permet de réaliser ce type d'interprétation.

Page générée en 0.096 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique