Statistiques - Définition et Explications

Statistique descriptive et statistique mathématique

Le but de la statistique est d'extraire des informations pertinentes d'une liste de nombres difficile à interpréter par une simple lecture. Deux grandes familles de méthodes sont utilisées selon les circonstances. Rien n'interdit de les utiliser en parallèle dans un problème concret mais il ne faut pas oublier qu'elles résolvent des problèmes de natures totalement distinctes. Selon une terminologie classique, ce sont la statistique descriptive (La statistique descriptive est la branche de la Statistique qui regroupe les nombreuses techniques utilisées pour décrire un ensemble relativement...) et la statistique (La statistique est à la fois une science formelle, une méthode et une technique. Elle comprend la collecte, l'analyse, l'interprétation de données...) mathématique. Aujourd'hui, il semble que des expressions comme analyse des données et statistique inférentielle (L'inférence statistique consiste à induire les caractéristiques inconnues d'une population à partir d'un échantillon issu de cette population. Les caractéristiques de l'échantillon, une fois connues, reflètent avec une...) soient préférées, ce qui est justifié par le progrès des méthodes utilisées dans le premier cas.

Considérons par exemple les notes globales à un examen. Il peut être intéressant d'en tirer une valeur centrale qui donne une idée synthétique sur le niveau des étudiants. Celle-ci peut être complétée par une valeur de dispersion (La dispersion, en mécanique ondulatoire, est le phénomène affectant une onde dans un milieu dispersif, c'est-à-dire dans lequel les différentes fréquences constituant l'onde ne se...) qui mesure, d'une certaine manière, l'homogénéité du groupe. Si on veut une information plus précise sur ce dernier point (Graphie), on pourra construire un histogramme (L'histogramme est le graphe permettant de représenter l'impact de diverses variables continues.) ou, d'un point de vue (La vue est le sens qui permet d'observer et d'analyser l'environnement par la réception et l'interprétation des rayonnements lumineux.) légèrement différent, considérer les déciles. Ces notions peuvent être intéressantes pour faire des comparaisons avec les examens analogues passés les années précédentes ou en d'autres lieux. Ce sont les problèmes les plus élémentaires de l'analyse des données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un...) qui concernent une population finie. Les problèmes portant sur des statistiques multidimensionnelles nécessitent l'utilisation de l'algèbre linéaire (L’algèbre linéaire est la branche des mathématiques qui s'intéresse à l'étude des espaces vectoriels (ou espaces linéaires), de leurs éléments les vecteurs, des transformations linéaires et...). Indépendamment du caractère, élémentaire ou non, du problème il s'agit de réductions statistiques de données connues dans lesquelles l'introduction des probabilités améliorerait difficilement l'information obtenue. Il est raisonnable de regrouper ces différentes notions :

  • statistique (Une statistique est, au premier abord, un nombre calculé à propos d'un échantillon. D'une façon générale, c'est le résultat de l'application d'une méthode...) descriptive pour les notions élémentaires ;
  • analyse en composantes principales ;
  • analyse factorielle (En mathématiques, la factorielle d'un entier naturel n, notée n!, ce qui se lit soit « factorielle de n » soit « factorielle n », est le produit des nombres entiers strictement positifs inférieurs ou égaux à n.) des correspondances ;
  • analyse discriminante ;
  • visualisation des données ;
  • etc.

Un changement radical se produit lorsque les données ne sont plus considérées comme une information complète à décrypter selon les règles de l'algèbre (L'algèbre, mot d'origine arabe al-jabr (الجبر), est la branche des mathématiques qui étudie, d'une façon...) mais comme une information partielle sur une population plus importante, généralement considérée comme une population infinie. Pour induire des informations sur la population inconnue il faut introduire la notion de loi de probabilité (En théorie des probabilités et en statistique, une loi de probabilité décrit soit les probabilités de chaque valeur d'une variable aléatoire (quand la variable aléatoire est discrète),...). Les données connues constituent dans ce cas une réalisation d'un échantillon (De manière générale, un échantillon est une petite quantité d'une matière, d'information, ou d'une solution. Le mot est utilisé dans différents domaines :), ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble), « une multitude qui peut être comprise comme un tout », comme...) de variables aléatoires supposées indépendantes (voir Loi de probabilité (La probabilité (du latin probabilitas) est une évaluation du caractère probable d'un évènement. En mathématiques, l'étude des probabilités est...) à plusieurs variables). La théorie des probabilités (La Théorie des probabilités est l'étude mathématique des phénomènes caractérisés par le hasard et l'incertitude. Les objets centraux de la théorie des...) permet alors, entre autres opérations :

  • d'associer les propriétés de l'échantillon à celles qui sont prêtées à la loi de probabilité, inconnue en toute rigueur, c'est l'échantillonnage ;
  • de déduire inversement les paramètres de la loi de probabilité des informations que donne l'échantillon, c'est l'estimation ;
  • de déterminer un intervalle de confiance qui mesure la validité de l'estimation ;
  • de procéder à des tests d'hypothèse, le plus utilisé étant le Test du χ² pour mesurer l'adéquation de la loi de probabilité choisie à l'échantillon utilisé ;
  • etc.

Domaines d'application

Les statistiques sont utilisées dans des domaines très variés comme :

  • en géophysique, pour les prévisions météorologiques, la climatologie, la pollution (La pollution est définie comme ce qui rend un milieu malsain. La définition varie selon le contexte, selon le milieu considéré et selon ce que l'on peut entendre par malsain [1].), les études des rivières et des océans ;
  • en démographie : le recensement (Le recensement est une opération statistique de dénombrement d'une population.) permet de faire une photographie à un instant (L'instant désigne le plus petit élément constitutif du temps. L'instant n'est pas intervalle de temps. Il ne peut donc être considéré comme une durée.) donné d'une population et permettra par la suite des sondages dans des échantillons représentatifs ;
  • en sciences économiques et sociales (Dans le lycée français, les sciences économiques et sociales (ou SES) sont un enseignements d’exploration de la classe de seconde et une matière suivie par les élèves choisissant la série ES...), et en économétrie : l'étude du comportement d'un groupe de population ou d'un secteur économique s'appuie sur des statistiques. C'est dans cette direction que travaille l'INSEE. Les questions environnementales s'appuient également sur des données statistiques ;
  • en sociologie : les sources statistiques constituent des matériaux (Un matériau est une matière d'origine naturelle ou artificielle que l'homme façonne pour en faire des objets.) d'enquête, et les méthodes statistiques sont utilisées comme techniques de traitement des données ;
  • en marketing : le sondage ( Un sondage peut désigner une technique d'exploration locale d'un milieu particulier. Un sondage peut également être une méthode statistique d'analyse d'une population...) d'opinion devient un outil (Un outil est un objet finalisé utilisé par un être vivant dans le but d'augmenter son efficacité naturelle dans l'action. Cette augmentation se traduit par la simplification des actions entreprises, par...) pour la décision ou l'investissement ;
  • en physique : l'étude de la mécanique (Dans le langage courant, la mécanique est le domaine des machines, moteurs, véhicules, organes (engrenages, poulies, courroies, vilebrequins, arbres de transmission, pistons, ...), bref, de tout ce qui...) statistique et de la thermodynamique (On peut définir la thermodynamique de deux façons simples : la science de la chaleur et des machines thermiques ou la science des grands systèmes en équilibre. La...) statistique (cf Physique (La physique (du grec φυσις, la nature) est étymologiquement la « science de la nature ». Dans un sens général et ancien, la physique désigne la connaissance de la...) statistique) permet de déduire du comportement de particules individuelles un comportement global (passage du microscopique au macroscopique) ;
  • en métrologie (La métrologie est la science de la mesure au sens le plus large.), pour tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou l'univers.) ce qui concerne les systèmes de mesure et les mesures elles-mêmes ;
  • en médecine (La médecine (du latin medicus, « qui guérit ») est la science et la pratique (l'art) étudiant l'organisation du corps humain (anatomie), son fonctionnement normal...) et en psychologie, tant pour le comportement des maladies que leur fréquence (En physique, la fréquence désigne en général la mesure du nombre de fois qu'un phénomène périodique se reproduit par unité de temps. Ainsi lorsqu'on emploie le mot fréquence sans...) ou la validité d'un traitement ou d'un dépistage ;
  • en archéologie, appliquée aux vestiges (céramologie...)
  • en écologie, pour l'étude des communautés végétales et des écosystèmes.
  • en assurance et en finance (calcul des risques,...)
Page générée en 0.007 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique