Hypothèse statistique
Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

À la différence du data mining, les méthodes de statistiques classiques exigent de se fixer une hypothèse de façon préalable à tout travail. Cet article présente cette notion d’hypothèse et en donne quelques exemples.

Hypothèse générale

L’hypothèse est une explication anticipée, une affirmation provisoire qui décrit ou explique un phénomène. Elle est une prédiction consistant à mettre en relation une variable (En mathématiques et en logique, une variable est représentée par un symbole. Elle est utilisée pour marquer un rôle dans une formule, un prédicat ou un algorithme. En statistiques, une...) et un comportement. Elle s’exprimera toujours sous la forme " telle variable a tel effet sur tel comportement ". Cette prédiction peut naître soit de l’observation, soit de données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un...) précédemment recueillies, soit d’une théorie (Le mot théorie vient du mot grec theorein, qui signifie « contempler, observer, examiner ». Dans le langage courant, une théorie est une idée ou une connaissance spéculative,...) qu’elle va tenter de valider. Elle s’exprimera alors sous la forme suivante : "  si telle théorie est juste dans telle situation (En géographie, la situation est un concept spatial permettant la localisation relative d'un espace par rapport à son environnement proche ou non. Il inscrit un lieu dans un...) il se produira tel phénomène ". L’hypothèse générale comprend une variable indépendante (VI) et une variable dépendante (VD). Elle peut avoir plusieurs opérationnalisations, elle peut donc renvoyer à plusieurs hypothèses opérationnelles. Elle est précise et non ambiguë.Une bonne hypothèse est une prédiction précise qui peut être opérationnelle et de façon simple. Une hypothèse ne peut prédire une conséquence et son contraire. Une prédiction non réfutable ne saurait être une hypothèse scientifique (Un scientifique est une personne qui se consacre à l'étude d'une science ou des sciences et qui se consacre à l'étude d'un domaine avec la rigueur et les méthodes scientifiques.). Avec Popper, il faut rappeler que la réfutabilité est la qualité de toutes hypothèse scientifique.

Hypothèse opérationnelle

L’hypothèse opérationnelle précise l’hypothèse générale. Elle se présente comme l’exemple concret d’application de l’hypothèse générale. Reprend le même schéma mais en précisant les variables et les comportements qui seront étudiés dans l'expérience. L'hypothèse opérationnelle consiste donc à prédire l'effet du ou des facteurs (variables indépendantes) manipulé(s) dans l'expérience sur le ou les indicateurs (variables dépendantes) du comportement étudié par le chercheur (Un chercheur (fem. chercheuse) désigne une personne dont le métier consiste à faire de la recherche. Il est difficile de bien cerner le métier de chercheur tant les domaines de recherche sont diversifiés et...).La qualité principale d’une hypothèse générale est de pouvoir être opérationnalisée. Des hypothèses trop vagues ou trop générales ne pourront évidemment pas générer des hypothèses opérationnelles. Seules les hypothèses ayant des implications concrètes pouvant être l’objet d’observations pourront être retenues.Pour renforcer des hypothèses opérationnelles, il faut prendre des décisions. Ces décisions reviennent à donner une forme concrète (La concrète est une pâte plus ou moins dure obtenue après extraction d’une matière première fraîche d’origine végétale (fleurs,...) avec force (Le mot force peut désigner un pouvoir mécanique sur les choses, et aussi, métaphoriquement, un pouvoir de la volonté ou encore une vertu morale...) de l’hypothèse. On dit qu’il s’agit d’opérationnaliser les éléments théoriques. Pour cela il faut introduire la VI, la VD et une prédiction.

Ex. : ? l’avancée en âge influence les performances mnésiques.

 
 o  Les personnes de plus de 50 ans ont de moins bonnes performances à un test de rappel libre (mémorisation de 10 mots) que les personnes de moins de 50. 
 o       Les personnes se situant dans la classe d’âge 50-70 ans ont de moins bonnes performances à une tâche de rappel d’informations spatiales (placer des points de repères sur une carte) que les personnes se situant dans la classe d’âge 20-40 ans. 
 

? Les voitures (Une automobile, ou voiture, est un véhicule terrestre se propulsant lui-même à l'aide d'un moteur. Ce véhicule est conçu pour le transport terrestre...) françaises sont moins chères que les voitures allemandes

 
 o  Les Citroën (Citroën est un constructeur automobile français fondé en 1919 par André Citroën.) sont moins chères que les BMW (Bayerische Motoren Werke AG Bayerische Motoren Werke Aktiengesellschaft.ogg  ou BMW (en français : manufacture bavaroise de moteurs) est une société industrielle allemande constructrice d'automobiles et de motos après avoir été un...) 
 o       Les Peugeot (Peugeot est une marque de constructeur automobile français fondée par Armand Peugeot de la famille Peugeot en 1896. Le siège est à Paris et les bureaux d'étude et de recherche à Vélizy, La Garenne-Colombes, Carrières-sous-Poissy...) sont moins chères que les Mercedes 
 

Hypothèse statistique (À la différence du data mining, les méthodes de statistiques classiques exigent de se fixer une hypothèse de façon préalable à tout travail. Cet article présente cette...)

Les hypothèses statistiques décrivent le modèle mathématique (Un modèle mathématique est une traduction de la réalité pour pouvoir lui appliquer les outils, les techniques et les théories mathématiques, puis généralement, en sens inverse, la traduction des résultats...) permettant de procéder aux inférences.

Exemple de différences entre les formes d’hypothèses:

? Hypothèse générale : la familiarité des mots facilite l’identification des mots.

? Hypothèse opérationnelle : le seuil d’identification des mots fréquents est inférieur au seuil d’identification des mots rares.

? Hypothèse statistique (La statistique est à la fois une science formelle, une méthode et une technique. Elle comprend la collecte, l'analyse, l'interprétation de données ainsi...) : dans la mesure où le chercheur veut généraliser le résultat obtenu sur un échantillon (De manière générale, un échantillon est une petite quantité d'une matière, d'information, ou d'une solution. Le mot est utilisé dans différents domaines :) représentatif, il va tester une hypothèse statistique (Une statistique est, au premier abord, un nombre calculé à propos d'un échantillon. D'une façon générale, c'est le...) dite hypothèse nulle.

Variable indépendante

La variable indépendante est celle qui est manipulée par le chercheur, elle est dite indépendante parce qu’elle ne dépend pas du sujet. Elle est à l’origine du phénomène étudié : c’est la cause du phénomène d’étude. Elle est manipulée par le chercheur dans le but d’analyser son effet sur un indicateur du comportement étudié.

Variable dépendante

Au sens (SENS (Strategies for Engineered Negligible Senescence) est un projet scientifique qui a pour but l'extension radicale de l'espérance de vie humaine. Par une évolution progressive allant du ralentissement du...) strict, la variable dépendante est la variable qui varie selon la modalité de la variable indépendante. C’est elle dont les variations sont prévues par le chercheur qui établit une relation causale entre les variations de la variable indépendante et celle de la variable dépendante.

La relation entre VI et VD peut être schématisée comme suit : VI > VD.

Variable parasite

Le but de l’expérimentateur est de faire la preuve sans ambiguïté de l’effet de telle VI sur telle variable dépendante. Pour ce faire, il s’agirait d’avoir des groupes de sujets équivalents en tous points hormis les différences induites par les modalités de la variable indépendante. En d’autres termes, il faudrait manipuler une variable indépendante et maîtriser toutes les autres. Les variables indépendantes à maîtriser ou variable parasites (VP) sont très nombreuses et souvent inconnues. Ainsi on essaie de contrôler les variables parasites dont le chercheur sait ou présume l’effet sur la variable dépendante. Les variables parasites fréquemment contrôlées sont : - Les caractéristiques du sujets : le sexe (Le mot sexe désigne souvent l'appareil reproducteur, ou l’acte sexuel et la sexualité dans un sens plus global, mais se réfère aussi aux différences physiques...), l’âge, appartenance religieuse, politique ou culturelle. - Variable " expérimentateur " : lorsque plusieurs expérimentateurs recueillent des données, lorsque le sujet fait plusieurs tâches ou plus généralement appartient à plusieurs groupes expérimentaux. Ex. : si je m’intéresse aux performances dans différents tests de mémoire (D'une manière générale, la mémoire est le stockage de l'information. C'est aussi le souvenir d'une information.), il est important de conserver le même ordre de passage pour tous les sujets.

Comment éliminer les effets des variables parasites ? Les variables parasites contrôlées s’appellent variables contrôles. Toutefois, toutes les variables parasites ne peuvent être contrôlées. On peut, par exemple, maintenir son effet constant sur la variable dépendante c’est-à-dire en considérant qu’une seule de ses modalités.

Ex. : si le sexe a un effet sur la performance mnésique à des tests spatiaux, ne prendre que des groupes homogènes, soit uniquement des hommes, soit uniquement des femmes.

Page générée en 0.106 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique