Histogramme
En statistiques, un histogramme est un graphe servant à représenter la répartition d'une variable.
Catégories :
Diagramme - Statistiques - Outil du management de la qualité - Outil du management - Management
Définitions :
- Graphique qui illustre des données recueillies au cours d'une période donnée. Un histogramme représente une seule série de données et il est utile quand on veut indiquer les changements qui ont été observés à différents moments. (source : statcan.gc)
- Graphique représentant la répartition des tons sur une image. L'axe horizontal indique le niveau des tons (luminosité), l'axe vertical le nombre de pixels. Pour une luminosité donnée, le graphique affiche le nombre de pixels.... (source : nikoncanada-fr.custhelp)
En statistiques, un histogramme est un graphe servant à représenter la répartition d'une variable.
Un outil de gestion de la qualité
L'histogramme est un moyen rapide pour représenter la distribution d'un paramètre obtenu lors d'une fabrication.
Exemples :
- diamètre d'un arbre après usinage,
- dureté d'une série de pièces après un traitement thermique,
- concentration d'un élément dans la composition d'alliages produit par une fonderie,
- masse de préparation alimentaire dans une boîte de conserve,
- répartition de la luminosité des pixels dans une photographie.
L'histogramme est un outil «visuel» qui sert à détecter certaines anomalies ou de faire un diagnostic avant d'engager une démarche d'amélioration. Utilisé dans ce cadre, l'histogramme est un outil «qualitatif». Pour pouvoir bien mener l'étude de la dispersion d'un paramètre avec un ou de plusieurs histogrammes, il faut avoir une bonne connaissance du paramètre étudié. De même, il faut connaître les conditions de collecte des données : fréquence de mesure, outil de mesure utilisé, possibilité de mélange de lots, possibilité de tri etc.
Construction
Collecte des données
La première phase est la collecte des données en cours de fabrication. Cette collecte peut être réalisée soit de façon exceptionnelle à l'occasion de l'étude du paramètre soit en utilisant un relevé automatique ou manuel fait lors d'un contrôle réalisé dans le cadre de la surveillance du procédé de fabrication.
Sans qu'il soit réellement envisageable de donner un nombre minimum, il faut que le nombre de valeurs relevées soit suffisant. Plus on dispose d'un nombre élevé de valeurs, plus l'interprétation sera aisée.
Nombre de classes
La première opération est de déterminer le nombre de classes de l'histogramme. Le plus souvent, dans le cadre d'une analyse de ce type, on utilise des classes de largeur semblable.
Le nombre de classes dépend du nombre de valeurs N dont on dispose.
Le nombre de classes K peut être déterminé par la formule suivante :
ou plus simplement
Cependant, l'histogramme étant un outil visuel, il est envisageable de faire fluctuer le nombre de classes. Ceci sert à voir l'histogramme avec un nombre différent de classes et ainsi de trouver le meilleur compromis qui favorisera l'interprétation. L'utilisation d'un logiciel dédié ou plus simplement d'un tableur favorise cette opération.
Intervalles de classe
L'amplitude w de l'histogramme est
L'amplitude h théorique de chaque classe est alors :
Il faut arrondir cette valeur à un multiple de résolution de l'instrument de mesure (arrondi à l'excès).
Exemple : Soit la masse d'une préparation culinaire avant conditionnement. Le calcul d'amplitude de classe donne hth = 0, 014 kg. La résolution de la balance utilisée est de 0, 001 kg. On arrondit la valeur h à 0, 015 kg.
Les classes peuvent être du type [limite inférieure ; limite supérieure[ ou ] limite inférieure ; limite supérieure].
La valeur minimale de la première classe est donnée par la valeur minimale de la série moins une demi-résolution.
Exemple : la valeur la plus petite relevée lors de la fabrication de la préparation culinaire est de 0, 498 g. La limite inférieur sera : 0, 498 – (0, 001 / 2) = 0, 4975 kg.
Pour plus de facilité, il est préférable de prendre une valeurs «ronde» par exemple 0, 495 kg
Exemple
Soit la fabrication de rations alimentaires, la pesée des rations avant emballage donne la série de mesures suivantes en kg :
0, 547 | 0, 563 | 0, 532 | 0, 521 | 0, 514 | 0, 547 | 0, 578 | 0, 532 | 0, 552 | 0, 526 | 0, 534 | 0, 560 | 0, 502 | 0, 503 | 0, 516 | 0, 565 |
0, 532 | 0, 574 | 0, 521 | 0, 523 | 0, 542 | 0, 539 | 0, 543 | 0, 548 | 0, 565 | 0, 569 | 0, 574 | 0, 596 | 0, 547 | 0, 578 | 0, 532 | 0, 552 |
0, 554 | 0, 596 | 0, 529 | 0, 555 | 0, 559 | 0, 503 | 0, 499 | 0, 526 | 0, 551 | 0, 589 | 0, 588 | 0, 568 | 0, 564 | 0, 568 | 0, 556 | 0, 523 |
0, 526 | 0, 579 | 0, 551 | 0, 584 | 0, 551 | 0, 512 | 0, 536 | 0, 567 | 0, 512 | 0, 553 | 0, 534 | 0, 559 | 0, 498 | 0, 567 | 0, 589 | 0, 579 |
Les caractéristiques du relevé sont les suivantes :
- Le nombre d'échantillons : N=64
- L'étendue : w=0, 098 kg
- Valeur minimale : 0, 498 kg
- Valeur maximale : 0, 596 kg
On en déduit les paramètres suivants pour l'histogramme :
- Le nombre de classes est de 7 (en utilisant la formule avec le logarithme)
- L'amplitude de classe est 0, 098/7 = 0, 014 kg qu'on arrondit à 0, 015 kg (résolution de la balance : 0, 001 kg)
- La valeur minimale de la première classe est de 0, 498 – (0, 001/2) = 0, 4975. Par souci de facilité pour l'interprétation, on peut arrondir cette valeur à 0, 495 kg.
On obtient l'histogramme suivant :
Interprétation
La distribution largement de paramètres industriels correspond fréquemment à une loi normale. On compare fréquemment l'histogramme obtenu au profil «en cloche» de la loi normale. Cette comparaison est visuelle et même si elle peut être une première approche, elle ne forme pas un test de «normalité». Pour cela, il faut exécuter un test dont un des plus classiques est la droite de Henry.
La distribution suivant la loi normale, si elle est extrêmement fréquente, n'est pas systématique. On vérifiera que la distribution ne correspond pas à une distribution de défaut de forme (exemple : mesure de l'excentration dans un tube, position d'objets lancés dans la direction d'un mur dont certains rebondissent sur ce mur).
L'interprétation peut, par exemple, donner les résultats suivants :
Histogramme montrant un mélange de deux lots. | Histogramme montrant un mélange de deux lots mais avec une moyenne proche. On veillera dans ce cas à faire aussi fluctuer le nombre de classes pour vérifier qu'il ne s'agit pas d'un problème de construction. | Histogramme montrant que le lot a subi un tri. L'ensemble des éléments pour lesquels la valeur du paramètre mesuré était inférieure à A ont été supprimés. |
Dans le cas d'histogramme montrant un mélange de deux lots ayant une moyenne différente, il existe des cas où la dispersion présente cet aspect sans pour tout autant incriminer un mélange. C'est par exemple le cas de la mesure d'une pièce cylindrique mais qui présente un défaut de type ovalisation. Les deux moyennes représentent alors le grand diamètre et le petit diamètre. C'est la connaissance du procédé et/ou du produit qui sert à réaliser ce type d'interprétation.
Un outil pour estimer une densité
Dans cette section, on utilise l'histogramme non pas comme un outil de visualisation, mais comme une estimation statistique de la distribution sous-jacente de l'échantillon. On dispose d'un échantillon indépendamment et semblablement distribué selon une loi. On souhaite déduire de l'échantillon une estimation de la densité inconnue, notée f.
Le cas discret
On recherche les probabilités pi qui caractérisent la distribution. On note cette distribution f par abus. Un estimateur naturel est :
où n (x) est le nombre d'observations de l'échantillon qui sont identiques à x. Une manière alternative de noter cet estimateur est :
où est la fonction indicatrice : elle vaut 1 quand son argument est vrai.
Le cas continu
L'estimateur précédent n'est plus valable, car dans le cas continu, on ne peut plus compter le nombre d'observations précisément identiques à x. Par contre, on considère généralement une boîte centrée en x, et de largeur h, paramètre positif. On peut compter le nombre d'observations approximativement (et non plus précisément) identiques à x, en comptant les observations tombant dans ladite boîte. L'estimateur[1] devient :
où toujours, en posant yi = (xi − x) / h :
- .
Le paramètre h contrôle le niveau de lissage de l'estimation et doit être recherché avec soin. L'estimateur précédent présente de bonnes propriétés identiques à celles d'une densité continue :
- il est positif ;
- il s'intègre à l'unité.
Cependant, il présente un gros défaut pour pouvoir estimer une densité : il n'est pas continu. Pour gagner la continuité, on utilisera l'estimateur de Parzen (ou à noyau) . Le principe est simple : il suffit de remplacer la fonction indicatrice par une fonction réelle, qui attribue un poids d'autant plus important que les observations sont localisées à proximité de x.
Origine
William Playfair (Commercial and political atlas, 1786) est le premier promoteur de l'exploitation des observations statistiques par des courbes de distribution et des diagrammes en bâtons. Le mot histogramme a été proposé par Pearson en 1895.
Notes et références
- Fix, E., Hodges Jr., J., 1951. Discriminatory analysis : non-parametric discrimination : Consistency properties. Report No. 4, USAF School of Aviation Medicine, Randolph Field, TX.
Voir aussi
Bibliographie
- Maurice Lethielleux, Statistique descriptive, éditions Dunod, Paris, 1999 (ISBN 2 10 003513 4) , 124 pages.
- Maurice Pillet, Appliquer la maîtrise statistique des procédés MSP/SPC, Les Éditions d'Organisation, 1995 (ISBN 2-7081-1774-2) , 336 pages.
- Pierre Souvay, Statistique et qualité, AFNOR, Paris, collection «A savoir», 1994, 40 pages.
- Pierre Souvay, Savoir utiliser la statistique, outil à la décision ainsi qu'à le perfectionnement de la qualité, AFNOR, Saint-Denis-la-Plaine, 2002 (ISBN 2-12-475821-7) , 434 pages
Liens externes
Recherche sur Google Images : |
"L'histogramme correspondant" L'image ci-contre est extraite du site bibmath.net Il est possible que cette image soit réduite par rapport à l'originale. Elle est peut-être protégée par des droits d'auteur. Voir l'image en taille réelle (593 × 381 - 5 ko - png)Refaire la recherche sur Google Images |
Recherche sur Amazone (livres) : |
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 26/10/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.