Échantillon (statistiques) - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Introduction

En statistique la notion d’échantillon désigne un sous ensemble d'individus extraits d'une population initiale, sur lesquels vont être étudiées des grandeurs aléatoires. Le recours à un échantillon répond en général a la nécessité pratique (manque de temps, de place, évaluation destructive d'une production...) ou économique (coût trop élevé) de s'abstraire de l'étude exhaustive de la population.

L'acte de sélection s'appelle l'échantillonnage. Comme il s'agit en général, à partir des résultats ou mesures obtenus sur l'échantillon, d'être en mesure d'inférer des conclusions sur la population tout entière, la théorie statistique s'est intéressée aux principes d'échantillonnage garantissant la qualité des conclusions étendues :

  • capacité à capter la diversité du phénomène étudié ;
  • absence de biais ou erreur systématique ;
  • lien entre la taille de l'échantillon et la confiance que l'on peut accorder à la généralisation des résultats...

sont quelques unes des préoccupations de la théorie de l'échantillonnage.

Méthode

Les statisticiens supposent la population d'une taille donnée et lui associent une loi de probabilité, c'est le rôle de l'inférence statistique ou statistique mathématique. Dans ces conditions, l'échantillon est interprété comme un ensemble de variables aléatoires dont on possède une réalisation supposée issue de tirages indépendants. L'analyse des propriétés de l'échantillon permet d'estimer certaines caractéristiques de la population, de déterminer la validité de ces estimations ou de certaines hypothèses.

Dans les sondages d'opinion la théorie statistique obligerait à tenir à jour la liste des membres de la population, tirer au sort les heureux élus et interroger ceux-ci à l'exclusion de tous les autres. C'est évidemment impossible et les instituts tentent de bâtir ce qu'ils nomment un échantillon représentatif. Celui-ci doit obéir à un certain nombre de règles afin de s'assurer de sa représentativité qui exige l'indépendance des réponses. Le problème concerne la validité d'un tel choix. Il semblerait que, mieux elle est assurée, plus on se rapproche d'un sondage aléatoire avec ses limites parfaitement déterminées par la théorie (une enquête effectuée sur 1000 personnes a 95 chances sur 100 de donner le résultat correct à ±3% près). Selon la plupart des instituts leurs résultats seraient meilleurs, ce qui demanderait quelques justifications.

Page générée en 0.207 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique
Version anglaise | Version allemande | Version espagnole | Version portugaise