Statistique descriptive - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

- Introduction - Description statistique - Étude d'une seule variable - Exemples - Étude de plusieurs variables

Exemples

Grandeurs physiques

Diagramme de phase de l'eau.

Si on mesure de temps à autre la pression, la température et la densité d'un gaz présent dans une cuve, on obtient une collection de triplets de données, indexés par l'instant de mesure.

Grandeurs comportementales ou biologiques

Dans le domaine médical, on peut par exemple mesurer le poids avant et après la prise d'un médicament pour plusieurs personnes. On obtient alors une collection de couples de données (poids avant et après) indexés par le nom de la personne.

En sociologie ou en marketing on peut mesurer le nombre de livres lus par an pour de nombreuses personnes, dont on connait par ailleurs l'âge et le niveau d'étude. Ici aussi on obtient une collection de triplets de données, indexés par le nom du lecteur.

Formalisation des cas pratiques

Les différentes grandeurs mesurées sont appelées des variables.

L'étude statistique nécessite que l'on prenne comme hypothèse qu'il existe un phénomène abstrait plus ou moins caché qui met en œuvre ces variables (et peut-être d'autres).

Chaque valeur l'index (qui peut être une date, ou un numéro identifiant un individu), identifie alors une photographie partielle du phénomène. On appelle les valeurs des variables pour un indice donné des observations ou une réalisation du phénomène.

D'un point de vue formel, on pose le principe que le phénomène abstrait peut comporter des éléments déterministes comme des éléments aléatoires (on dit aussi stochastiques). L'ensemble des variables observées sont alors juxtaposées sous la forme d'un vecteur de données. Il n'y a plus alors qu'une seule variable (mais qui est multi variée).

Les observations sont alors bien des réalisations (au sens des statistiques mathématiques) de cette variable aléatoire multi variée.

Étude de plusieurs variables

Le principe est le même que pour une seule variable, sauf que toutes les caractéristiques (moyenne, mode, écart type, etc) sont bi variées (des vecteurs).

Il y a d'autre part une caractéristique supplémentaire: la corrélation. Elle est une mesure linéaire de la dépendance entre les différentes composantes de la variable multi variée.

Il existe d'autres mesures de dépendance entre deux variables, comme l'information mutuelle (ou l'entropie conditionnelle).

Au delà des mesures, on peut aussi explorer les dépendances à l'aides d'outils graphiques ou de tableaux.

Disjonction des données

Le plus simple des tableaux possible est une disjonction. Lorsque nous avons deux variables $V 1$ et $V 2$ , observées par exemple en plusieurs instants $t_1,\ldots,t_N$ (notons $(V 1 (t n), V 2 (t n))$ l'observation des deux variables à l'instant $t n$ ), il est toujours possible de choisir un seuil $V^*_2$ sur la deuxième variable et de transformer notre échantillon $(V 1 (t n), V 2 (t n)) n$ en $(V_1(t_n),V_2(t_n)>V^*_2)_n$ . Nous formons alors deux groupes d'instants :

ceux pour lesquels la seconde variable est plus grande que $V^*_2$ ;
ceux pour lesquels la seconde variable est plus petite ou égale à $V^*_2$ .

Plus ces deux ensembles seront différents (en termes de critère mono variés: moyenne, écart type, comparaison à une distribution connue, etc), et plus l'événement $V_2>V_2^*$ a un impact sur la distribution des valeurs de $V 1$ . Lorsque c'est le cas, nous avons identifié une dépendance entre $V 1$ et l'événement $V_2>V_2^*$ .

Il est possible de poursuivre cela en découpant notre échantillon en plusieurs morceaux, en recourant à plusieurs seuils $V^*_{2,1},\ldots,V^*_{2,S}$ .

On se retrouve alors avec une population de $S + 1$ échantillons à une seule variable ( $V 1$ ), qui peuvent être étudiés séparément. Si on s'aperçoit que les distributions sur les échantillons sont très différentes, c'est qu'il y a une dépendance entre les deux variables.

Une population aléatoire (la deuxième variable n'est pas affichée)

Après seuillage de la deuxième variable: trois groupes sont formés. On voit nettement que les trois distributions sont très différentes; il y a donc bien une dépendance entre les deux variables

Étude d'une seule variable

- Introduction - Description statistique - Étude d'une seule variable - Exemples - Étude de plusieurs variables

👽 Découvrir enfin une vie extraterrestre

🎯 Une piste très prometteuse pour empêcher les rechutes du cancer du sein

✨ Pourquoi les étoiles paraissent plus brillantes l'été ?

🌱 Comment les plantes résistent-elles à une lumière trop intense ?

⚫ Une IA révèle que le trou noir supermassif de notre galaxie pointe vers la Terre

🏔️ Découverte d'un monde perdu sous l'Antarctique

🌍 Découverte: cette règle universelle régit toute vie sur terre

⏳ L'Univers pourrait disparaître plus tôt que prévu: ce que révèle cette étude

🌍 Les dernières mesures révèlent un niveau de CO₂ jamais vu depuis 4 millions d'années

🛡️ Le paradoxe des gangs de rue

💰 Quelle quantité d'or existe-t-il vraiment sur Terre ?

🦟 Pourquoi les moustiques sont plus nombreux et piquent davantage en été ?

⚫ Ces trous noirs interagissent avec la lumière fossile du Big Bang

🦕 Et si les dinosaures détenaient le secret pour vaincre le cancer ?

😎 Comment font les lunettes de soleil pour filtrer les UV ?

🚶‍♂️‍➡️ La marche des babouins éclaire l'évolution de la bipédie humaine

🔭 James Webb capture cette image directe d'une étrange planète à 60 années-lumière

🦋 Pourquoi et comment les chenilles deviennent-elles des papillons ?

🔭 Voici la plus grande carte de l'Univers. Ses révélations sont surprenantes !

😴 Penser que l'on est éveillé alors que l'on dort, normal ?

🌊 Ce cratère raconte l'histoire de l'eau sur Mars

🐝 Comment les fleurs attirent-elles les insectes pollinisateurs ?

💥 La collision entre notre Voie lactée et la galaxie d'Andromède remise en question

🎶 Pourquoi les oiseaux chantent-ils autant et si fort au printemps ?

💡 Générer de la lumière à partir du vide, c'est possible

Découverte d'un deuxième système d'apprentissage dans le cerveau

☀️ Comment se produit un coup de chaleur et comment s'en protéger ?

⚽ Comment fonctionne la physique d'un tir puissant au foot ?

🧠 Un algorithme révèle comment notre cerveau se motive

🔭 Une si grande planète orbite une si petite étoile, comment est-ce possible ?

🐋 Les baleines développent de nouvelles méthodes pour communiquer avec nous

🥚 Le noyau de Mars sent l'œuf pourri

🧠 On sait enfin pourquoi le sémaglutide fait maigrir

🌱 La vie pourrait renaître sur Europe après la mort de la Terre

🌿 Confirmation scientifique: ce remède ancestral fait naturellement maigrir, et pas qu'un peu !

💥 Des astronomes identifient les plus puissantes explosions depuis le Big Bang

🦕 Ce crâne de stégosaure, le plus complet jamais découvert, réécrit l'histoire

🛏️ Les punaises de lit, ces compagnons indésirables depuis la préhistoire

🕸️ Connaissez-vous la toile cosmique, l'architecte de l'Univers ?

🌋 L'éruption de l'Etna vue depuis l'espace

🐋 Il y a 20 000 ans, l'Homme fabriquait des outils avec des os de baleines

🟠 Quel est le rôle de ce labyrinthe sur Mars ?

🎯 Cette stratégie innovante contre le cancer du sein offre une survie de 100%

💥 Le pulsar à trou noir: un objet qui intrigue les astrophysiciens

🐒 Première: ces singes kidnappent les bébés d'une autre espèce

🌍 Découverte d'une super-Terre à l'habitabilité intermittente

🧠 Ces cellules pourraient jouer un rôle bien plus important que les neurones dans la mémoire

🛰️ Une carte photographique de la Terre toutes les 35 minutes

Pourquoi l'oxygène est-il si indispensable à autant d'êtres vivants ?

🐱 Pourquoi certains chats miaulent et ronronnent plus que d'autres ?

Page générée en 0.127 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise