En théorie des probabilités ou en statistiques, une densité de probabilité est une fonction qui permet de représenter une loi de probabilité sous forme d'intégrales.
Formellement, une loi de probabilité possède une densité (La densité ou densité relative d'un corps est le rapport de sa masse volumique à la...) ƒ, si ƒ est une fonction définie sur positive ou nulle et Lebesgue-intégrable, telle que la probabilité de l'intervalle [a, b] est donnée (Dans les technologies de l'information, une donnée est une description élémentaire,...) par
pour tous nombres a. Par exemple, si la variable X a pour densité de probabilité (En théorie des probabilités ou en statistiques, une densité de probabilité est...) la fonction ƒ, la probabilité que la variable X soit dans l'intervalle [4,3, 7,8] sera
Cela implique que l'intégrale (Une intégrale est le résultat de l'opération mathématique, effectuée sur une fonction, appelé...) de ƒ sur tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou...) donne 1. Réciproquement, pour toute fonction ƒ positive ou nulle et Lebesgue-intégrable, d'intégrale égale à 1 :
il existe une loi de probabilité (En théorie des probabilités et en statistique, une loi de probabilité décrit...) ayant ƒ pour densité de probabilité.
Intuitivement, si une loi de probabilité a pour densité ƒ, alors l'intervalle infinitésimal [x, x + dx] a pour probabilité ƒ(x) dx.
Informellement, une densité de probabilité peut être vue (La vue est le sens qui permet d'observer et d'analyser l'environnement par la réception et...) comme la limite d'un histogramme : si on dispose d'un échantillon (De manière générale, un échantillon est une petite quantité d'une matière, d'information, ou...) suffisamment important de valeurs d'une variable aléatoire (Une variable aléatoire est une fonction définie sur l'ensemble des...) à densité, représenté par un histogramme (En statistiques, un histogramme est un graphe permettant de représenter la répartition...) des fréquences relatives des différentes classes de valeurs, alors cet histogramme va ressembler à la densité de probabilité de la variable aléatoire, pourvu que les classes de valeurs soient suffisamment étroites.
Définition (Une définition est un discours qui dit ce qu'est une chose ou ce que signifie un nom. D'où la...) — En théorie des probabilités (La théorie des probabilités est l'étude mathématique des phénomènes...) ou en statistiques, on dit qu'une fonction est une densité de probabilité d'une variable aléatoire réelle
si, pour tout réel
La probabilité se calcule alors par la relation suivante :
En traçant la représentation graphique de la densité de probabilité, la probabilité se lit comme l'aire sous la courbe sur l'intervalle
En conséquence, la fonction de répartition de
est continue, et
pour tout nombre réel
En cela, le comportement d'une variable à densité est très différent de celui d'une variable discrète.
La définition qui suit est une reformulation de la définition intégrale proposée en début d'article. C'est la définition utilisée en général par les physiciens, en particulier ceux issus du domaine de la physique statistique (La physique statistique a pour but d'expliquer le comportement et l'évolution de systèmes...).
Si est un nombre réel positif infiniment petit, alors la probabilité que
soit inclus dans l'intervalle
est égale à
soit:
Cette « définition » est très utile pour comprendre intuitivement à quoi correspond une densité de probabilité, et est correcte dans beaucoup de cas importants. On peut tracer une analogie avec la notion de densité de masse (Le terme masse est utilisé pour désigner deux grandeurs attachées à un...), ou encore avec la notion de densité de population. Une formulation (La formulation est une activité industrielle consistant à fabriquer des produits...) plus mathématique serait
ce qui permet de comprendre en quoi la définition donnée en physique (La physique (du grec φυσις, la nature) est étymologiquement la...) n'est pas complètement (Le complètement ou complètement automatique, ou encore par anglicisme complétion ou...) rigoureuse :
et il est alors facile de vérifier que si possède une limite à droite en
, notons-là
on a alors
ce qui corrobore la définition physique lorsque est continue à droite en
mais la met en défaut quand
Bien sûr, les densités de probabilités usuelles sont continues à droite sauf éventuellement en un nombre fini (et en un petit nombre) de points.
Notons que ce genre d'interprétation infinitésimale (ou issue de la physique) s'étend aux dimensions (Dans le sens commun, la notion de dimension renvoie à la taille ; les dimensions d'une pièce...) voir la section suivante.
Soit une suite de 9 v.a. r. i.i.d. de même densité
et de même fonction de répartition
Notons
la médiane de cette suite. Alors :
On peut voir cela comme une suite de 9 expériences aléatoires indépendantes faites dans les mêmes conditions, avec à chaque fois 3 issues : "", "
" et "
", de probabilités respectives
et
donc la probabilité ci dessus est donnée par la loi multinomiale de paramètres 3, 9 et
Ainsi :
et la densité de est
Cette méthode est détaillée dans le livre de David. Un résultat plus général se trouve dans Statistique (La statistique est à la fois une science formelle, une méthode et une technique. Elle...) d'ordre.
En vertu d'un théorème (Un théorème est une proposition qui peut être mathématiquement démontrée, c'est-à-dire une...) dû à Lebesgue, la fonction de répartition d'une variable aléatoire réelle étant croissante, est dérivable presque partout sur
et la dérivée ainsi obtenue est positive et intégrable sur
d'intégrale inférieure ou égale à 1.
Critère 1 — possède une densité de probabilité si et seulement si l'intégrale, sur
de la dérivée de la fonction de répartition est exactement égale à 1. Cette dérivée est alors une des densités de probabilité de
Critère 2 — Si la fonction de répartition de est de classe
par morceaux sur
et est, d'autre part, continue sur
alors la dérivée de la fonction de répartition de
est une des densités de probabilité de
Pour le calcul de la densité de la médiane de 9 variables i.i.d., une solution plus rigoureuse que celle de la section précédente, mais plus lourde, est de calculer la fonction de répartition de la médiane, puis de la dériver. On reconnait un schéma de Bernoulli : le nombre d'indices tels que
suit une loi binomiale de paramètres 9 et
En dérivant, on trouve :
Après quelques manipulations sur les coefficients binomiaux, tous les termes de cette somme se télescopent, sauf une partie du premier terme, ce qui donne :
puis
Pour les deux dernières égalités, se référer aux pages sur la fonction bêta et sur la fonction gamma (La fonction gamma est, en mathématiques, une fonction complexe.). Il en découle que satisfait le critère 1. CQFD
On pourra consulter le livre de David (pages 8-13) pour plus de détails.