Test d'hypothèse
Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

En statistiques, un test d'hypothèse est une démarche consistant à rejeter ou à accepter une hypothèse statistique, appelée hypothèse nulle, en fonction d'un jeu de données (échantillon).

Classification

De manière schématique, on distingue généralement les tests d'homogénéité et les tests de conformité.

  • Dans le cas d'un test d'homogénéité, on veut comparer deux échantillons entre eux. L'hypothèse nulle H0 supposera l'homogénéité des deux échantillons. Par exemple on comparera deux moyennes.
  • Dans le cas d'un test de conformité, on veut déterminer si un échantillon (De manière générale, un échantillon est une petite quantité d'une matière, d'information, ou d'une solution. Le mot est utilisé dans différents domaines :) suit une loi statistique (La statistique est à la fois une science formelle, une méthode et une technique. Elle comprend la collecte, l'analyse, l'interprétation de données ainsi que la...) connue. L'hypothèse nulle H0 supposera l'adéquation de l'échantillon à cette loi.

Risque de première et de deuxième espèce (Dans les sciences du vivant, l’espèce (du latin species, « type » ou « apparence ») est le taxon de base de la systématique. L'espèce est un concept...)

Dans tous les cas, le test suit une succession d'étapes définies:

  1. Énoncé de l'hypothèse nulle H0 et de l'hypothèse alternative (Alternatives (titre original : Destiny Three Times) est un roman de Fritz Leiber publié en 1945.) H1.
  2. Calcul d'une variable (En mathématiques et en logique, une variable est représentée par un symbole. Elle est utilisée pour marquer un rôle dans une formule, un prédicat ou un algorithme. En statistiques,...) de décision correspondant à une mesure de la distance entre les deux échantillons dans le cas de l'homogénéité, ou entre l'échantillon et la loi statistique (Une statistique est, au premier abord, un nombre calculé à propos d'un échantillon. D'une façon générale, c'est le résultat de l'application d'une méthode statistique à un ensemble de...) dans le cas de la conformité. Plus cette distance sera grande et moins l'hypothèse nulle H0 sera probable.
  3. Calcul de la probabilité (La probabilité (du latin probabilitas) est une évaluation du caractère probable d'un évènement. En mathématiques, l'étude des...) d'obtenir une valeur de la variable de décision aussi extrême ou plus extrême que la valeur obtenue, en supposant que H0 soit vraie. Cette probabilité, généralement appelée risque de première espèce et notée α0, correspond au risque de rejeter à tort H0 si H0 est en fait vraie.
  4. Conclusion du test, en fonction d'un risque seuil αseuil, en dessous duquel on est prêt à rejeter H0. Souvent, un risque de 5% est considéré comme acceptable (c'est-à-dire que dans 5% des cas quand H0 est vraie, l'expérimentateur se trompera et la rejettera). Mais le choix du seuil à employer dépendra de la certitude désirée et de la vraisemblance des alternatives.

La probabilité pour que H0 soit acceptée alors qu'elle est fausse est β, le risque de deuxième espèce. C'est le risque de ne pas rejeter H0 quand on devrait la rejeter. Sa valeur dépend du contexte (Le contexte d'un évènement inclut les circonstances et conditions qui l'entourent; le contexte d'un mot, d'une phrase ou d'un texte inclut les mots qui l'entourent. Le concept de contexte issu...), et est très difficilement évaluable (voire impossible à évaluer), c'est pourquoi seul le risque α est utilisé comme critère de décision.

Tests classiques

Il existe de nombreux tests statistiques classiques parmi lesquels on peut citer :

  • le test de Student, parfois appelé aussi test de Student-Fisher, qui sert à la comparaison d'une moyenne (La moyenne est une mesure statistique caractérisant les éléments d'un ensemble de quantités : elle exprime la grandeur qu'auraient chacun des membres de l'ensemble s'ils étaient tous...) observée avec une valeur " attendue "
  • le test de Fisher, parfois appelé aussi test de Fisher-Snedecor, qui sert à la comparaison de deux variances observées.
  • l'Analyse de la variance ( En statistique et en probabilité, variance En thermodynamique, variance ) ou ANOVA, qui sert à comparer plusieurs moyennes observées entre-elles, selon un plan expérimental prédéterminé. Il se base sur une décomposition (En biologie, la décomposition est le processus par lequel des corps organisés, qu'ils soient d'origine animale ou végétale dès l'instant qu'ils...) de la variance en une partie " explicable " et une partie " erreur ", supposée distribuée selon la loi normale. Ce test est particulièrement utilisé dans les sciences humaines et sociales (SHS), les sciences cognitives, les sciences médicales et les sciences du vivant.
  • le test de Khi-2, qui sert notamment à la comparaison d'un couple d'effectifs observés, ou à la comparaison globale de plusieurs couples d'effectifs observés, et plus généralement à la comparaison de deux distributions observées.
  • le test de Kolmogorov-Smirnov (En statistiques, le test de Kolmogorov-Smirnov est un test d'hypothèse utilisé pour déterminer si un échantillon suit bien une loi donnée connue par sa fonction de répartition continue,...), qui comme le test de Khi-2 est un test d'adéquation entre des échantillons observés et une distribution de probabilité. Il compare la fonction de répartition (En probabilité, la fonction de répartition d'une variable aléatoire X est la fonction qui à tout réel x associe) observée et la fonction de répartition attendue. Il est particulièrement utile pour les variables aléatoires continues.

En méthodes bayésiennes, on utilise beaucoup le psi-test (mesure de distance dans l'espace des possibles) dont on montre que le Khi-2 constitue une très bonne approximation (Une approximation est une représentation grossière c'est-à-dire manquant de précision et d'exactitude, de quelque chose, mais encore assez significative pour...) asymptotique lorsqu'existe un grand nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) d'observations (L’observation est l’action de suivi attentif des phénomènes, sans volonté de les modifier, à l’aide de moyens d’enquête et d’étude appropriés. Le plaisir procuré explique la très grande participation des...).

Page générée en 0.101 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique