En théorie des probabilités et en statistiques, la médiane est un nombre qui divise en deux parties l'échantillon, la population ou la distribution de probabilités tel que chaque partie contient le même nombre de valeurs.
Dans une liste finie de valeurs, il suffit d'ordonner les valeurs dans un ordre croissant et de choisir la valeur centrale comme médiane. S'il y a un nombre pair de valeurs, toute valeur située entre les deux valeurs centrales est acceptable, mais c'est le plus souvent la moyenne arithmétique des deux valeurs centrales qui est utilisée.
Contrairement à la moyenne arithmétique, la valeur médiane permet d'atténuer l'influence perturbatrice des valeurs extrêmes enregistrées lors de circonstances exceptionnelles.
Supposons 19 pauvres et un milliardaire dans une pièce. Tous prennent l'argent de leur poche et le déposent sur une table. Chaque pauvre dépose 5 euros, alors que le milliardaire met 1 milliard de euros. Le montant total est 1 000 000 095 euros. Si cet argent est également distribué parmi les vingt personnes, chacune obtient 50 000 004,75 euros. Ce montant est la valeur moyenne de ce qu'elles ont amené. Cependant, la valeur médiane est de 5 euros, puisque le groupe peut être divisé en deux parties égales de 10 personnes. On peut donc affirmer que tous les membres du premier groupe ont amené au plus 5 euros, alors que les membres du deuxième groupe ont amené au moins 5 euros.
Lorsque la médiane est utilisée pour situer des valeurs en statistiques descriptives, il existe différentes possibilités pour exprimer la variabilité : L'étendue, l'écart interquartile et l'écart absolu. Puisque la médiane est la même valeur que le deuxième quartile, son calcul est détaillé dans l'article sur les quartiles.
Théoriquement, il peut y avoir plus qu'une valeur médiane : s'il y a un nombre pair de valeurs, il existe différentes valeurs qui divisent l'ensemble en deux parties. Dans ce cas, la moyenne de ces deux valeurs centrales est généralement choisie comme médiane.
La médiane est principalement utilisée pour les distributions asymétriques, car elle les représente mieux que la moyenne arithmétique. Considérons l'ensemble { 1, 2, 2, 2, 3, 9 }. La médiane est 2, tout comme le mode, ce qui est une meilleure mesure de tendance centrale que la moyenne arithmétique égale à 3,166….
Le calcul de la médiane est couramment effectué pour représenter différentes distributions et elle est facile à comprendre, tout comme à calculer. Elle est aussi plus robuste que la moyenne en présence de valeurs extrêmes.
Pour chacune des distributions de probabilités sur la ligne des nombres réels avec une fonction de distribution cumulative, F, peu importe s'il s'agit d'une distribution continue de probabilités ou d'une distribution discrète de probabilités, une médiane m satisfait l'égalité :
dans laquelle une intégrale de Riemann-Stieltjes apparaît. Pour une distribution de probabilités absolument continue avec une densité de probabilité f, il y a :
Pour toutes les distributions symétriques, la médiane est égale à l'espérance.