Variables aléatoires élémentaires
Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.
image:icone_math_élém.jpg
Cet article fait partie de la série
Mathématiques élémentaires
Algèbre
Analyse
Arithmétique
Géométrie
Logique (La logique (du grec logikê, dérivé de logos (λόγος), terme inventé par Xénocrate signifiant à la fois raison,...)
Probabilité (La probabilité (du latin probabilitas) est une évaluation du caractère probable d'un évènement. En mathématiques, l'étude des...)
Statistique (La statistique est à la fois une science formelle, une méthode et une technique. Elle comprend la collecte, l'analyse, l'interprétation de données ainsi que la présentation de ces ressources afin de...)

La notion de variable aléatoire (Une variable aléatoire est une fonction définie sur l'ensemble des résultats possibles d'une expérience aléatoire, telle qu'il soit possible de déterminer la probabilité pour qu'elle prenne...) réelle est utilisée dès que le résultat d’une expérience aléatoire est quantifiable. Elle est née de considération sur les jeux où, à chaque jeu, pouvait être associé un gain (= somme empochée - mise). La question était de savoir comment répartir de façon juste les mises en cas d’arrêt forcé en cours de partie. Blaise Pascal (Blaise Pascal (19 juin 1623, Clermont (Auvergne) - 19 août 1662, Paris) est un mathématicien et physicien, philosophe, moraliste et théologien français.) contribua grandement à la fonder.

On nomme variable aléatoire réelle une application X d’un univers (L'Univers est l'ensemble de tout ce qui existe et les lois qui le régissent.) Ω muni d’une probabilité p vers R. Cette application crée un nouvel univers X(Ω) sur lequel on peut construire une probabilité issue de p. Cette probabilité s’appelle loi de probabilité de X. Il arrive souvent que l’on oublie l’univers Ω pour ne s’intéresser qu’à l’univers X(Ω). En français, retenons essentiellement qu’une variable aléatoire se présente comme une fonction.

Cas des variables aléatoires définies sur un univers Ω fini.

Si l’univers Ω est fini, alors l’univers X(Ω) est fini. X(Ω) = {x1, x2, ..., xn}.

Loi de probabilité

Attention : l’approche fréquentiste utilisée dans cette section ne résume pas à elle seule la notion de probabilité. Elle ne fait qu’en fournir un exemple. Nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) de probabilités sont associées à des événements où aucune notion de fréquence (En physique, la fréquence désigne en général la mesure du nombre de fois qu'un phénomène périodique se reproduit par unité de temps. Ainsi lorsqu'on emploie le mot fréquence sans précision, on...) n’intervient.

La loi de probabilité peut se construire de la manière suivante : pX(xi) = p(X = xi). = pi

Exemple: En lançant deux dés, on crée un univers Ω de 36 éléments formé de couples d’entiers de 1 à 6. Sur cet univers, on définit une équiprobabilité (les lancers des 2 dés étant deux expériences indépendantes). Si l’on ne s’intéresse qu’à la somme des deux dés, il faut créer une variable aléatoire X qui, à chaque couple, associe leur somme.

L’univers X(Ω) est donc {2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 , 11 , 12}. Cet univers contient 11 éléments, mais il n’est pas adéquat d’y définir une équiprobabilité.

  • pX(7) = p(X = 7) = p({(1 , 6)}) + p({(2, 5)}) + p({(3 , 4)}) + p({(4 , 3)}) + p({(5 , 2)}) + p({(6 , 1)}) = 6/36 = 1/6
  • pX(2) = p(X = 2) = p({1 , 1}) = 1/36

On peut ainsi créer une loi de probabilité sur X(Ω)

xi 2 3 4 5 6 7 8 9 10 11 12
pi 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

Espérance, variance ( En statistique et en probabilité, variance En thermodynamique, variance ) et écart type (En mathématiques, l'écart type est une quantité réelle positive, éventuellement infinie, utilisée dans le domaine des probabilités pour caractériser la répartition d'une...)

La présentation de la loi de probabilité sous forme d’un tableau (Tableau peut avoir plusieurs sens suivant le contexte employé :) ressemblant au tableau des fréquences d’une série statistique (Une statistique est, au premier abord, un nombre calculé à propos d'un échantillon. D'une façon générale, c'est le résultat de l'application d'une méthode...) quantitative discrète et la loi des grands nombres (La loi des grands nombres a été formalisée au XVIIe siècle lors de la découverte de nouveaux langages mathématiques.) qui stipule (En botanique, les stipules sont des pièces foliaires, au nombre de deux, en forme de feuilles réduites située de part et d'autre du pétiole, à sa base, au point d'insertion...) que les deux tableaux coïncident si on renouvelle un grand nombre de fois l’expérience, pousse (Pousse est le nom donné à une course automobile illégale à la Réunion.) à définir aussi pour X la moyenne (La moyenne est une mesure statistique caractérisant les éléments d'un ensemble de quantités : elle exprime la grandeur qu'auraient chacun des...), la variance et l’écart type.

La moyenne de la série statistique sera appelé espérance dans le cas d’une variable aléatoire. Ce terme provient sans doute de l'utilité des premières variables aléatoires dans les calculs statistiques sur les gains des jeux de hasard (Dans le langage ordinaire, le mot hasard est utilisé pour exprimer un manque efficient, sinon de causes, au moins d'une reconnaissance de cause à effet d'un événement.). L’espérance du gain correspond alors à la moyenne des gains au cours de nombreuses parties.

E(X) = \sum_{i=1}^np_ix_i

La variance s’écrit alors, par analogie avec la formule de la variance avec fréquences:

V(X) =  \sum_{i=1}^np_i(x_i - E(X))^2= \left(\sum_{i=1}^np_ix_i^2\right) - (E(X))^2  = E(X^2) - (E(X))^2

L’écart type reste toujours la racine carrée (La racine carrée d’un nombre réel positif x est le nombre positif dont le carré vaut x. On le note ou x½; dans cette expression, x est appelé le radicande.) de la variance : \sigma_X = \sqrt{V(X)}.

Fonction de répartition (En probabilité, la fonction de répartition d'une variable aléatoire X est la fonction qui à tout réel x associe)

La fonction de répartition d'une variable aléatoire X est la fonction F définie sur R par F(x) = p(X ≤ x).

Dans le cas d’une variable discrète, c’est une fonction en escalier (L’escalier est une construction architecturale constituée d'une suite régulière de marches, les degrés, permettant d'accéder à un...). En effet :

  • si x < x1 alors F(x) = 0.
  • si x_1 \leq x < x_2 alors F(x) = p1.
  • si x_2 \leq x < x_3 alors F(x) = p1 + p2.
  • ...
  • si x_{n-1} \leq x < x_n alors F(x) = p1 + p2 + ... + pn − 1.
  • si x \geq x_n alors F(x) = 1.

Lois célèbres

Outre l’équiprobabilité, on peut rencontrer aussi

  • la loi de Bernoulli (En mathématiques, la distribution de Bernoulli ou loi de Bernoulli, du nom du mathématicien suisse Jacques Bernoulli, est une distribution discrète...)
  • la loi binomiale (En mathématiques, une loi binomiale de paramètres n et p correspond au modèle suivant :)
  • la loi hypergéométrique.

Variables aléatoires à densité (La densité ou densité relative d'un corps est le rapport de sa masse volumique à la masse volumique d'un corps pris comme référence. Le corps de référence est l'eau pure à 4 °C...)

Il arrive que l’univers Ω soit infini (Le mot « infini » (-e, -s ; du latin finitus, « limité »), est un adjectif servant à qualifier...) et que l’univers X(Ω) soit aussi infini. Le calcul des pX(x) pour tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou l'univers.) x de X(Ω) n’est souvent pas suffisant pour calculer la probabilité d’un événement et il est même fréquent que ces pX(x) soient tous nuls. Il est alors nécessaire de calculer directement pX([a ; b]).

Densité de probabilité (En mathématiques statistiques, on appelle densité de probabilité d'une variable aléatoire X réelle continue une fonction f)

On dit que X est une variable aléatoire de densité f si la probabilité de l’événement " a ≤ X ≤ b " vaut \int_a^b f(t)\,dt. Il faut évidemment que la fonction f soit à valeurs positives, intégrable sur R, et d'intégrale (Une intégrale est le résultat de l'opération mathématique, effectuée sur une fonction, appelé intégration. Une intégrale est donc composée d'un intégrande (la fonction à...) sur R égale à 1.

On peut remarquer que p([a ; a]) = 0, donc que p(]a ; b]) = p([a ; b]) ce qui explique la liberté prise dans ce cas avec les inégalités larges ou strictes.

De l'histogramme (L'histogramme est le graphe permettant de représenter l'impact de diverses variables continues.) à la densité de probabilité

En renouvelant 10000 fois l'expérience X, on crée une série statistique continue. On peut alors ranger les différentes valeurs obtenues dans des classes de même amplitude (Dans cette simple équation d’onde :) et tracer l'histogramme des fréquences. L’aire du rectangle (En géométrie, un rectangle est un quadrilatère dont les quatre angles sont des angles droits.) de base [xi, xi+1] représente la fréquence de la classe [xi, xi+1]. Cet histogramme dessine une fonction en escalier.

L'aire sous la courbe (En géométrie, le mot courbe, ou ligne courbe désigne certains sous-ensembles du plan, de l'espace usuels. Par exemple, les droites, les segments, les lignes...) entre xi et xj représente la fréquence de la classe [xi , xj]. Or la loi des grands nombres nous dit que cette fréquence est une bonne approximation (Une approximation est une représentation grossière c'est-à-dire manquant de précision et d'exactitude, de quelque chose, mais encore assez significative pour...) de p([xi , xj]). En multipliant les expériences et en affinant les classes, la fonction en escaliers se rapproche d'une fonction souvent continue, l'aire sous cette courbe sur l'intervalle [a ; b] est alors un bon représentant de la probabilité de l'intervalle [a ; b]. Cette fonction s'appelle la densité de probabilité de la variable X.

On prend souvent l’habitude de tracer cette densité de probabilité pour mieux visualiser la loi de probabilité associée en regardant l’aire sous la courbe entre les valeurs qui nous intéressent.

Loi uniforme

Le cas le plus simple de loi à densité est la loi uniforme. Les valeurs de X se répartissent uniformément sur un intervalle [a ; b]. L'histogramme que l'on pourrait dessiner serait une succession de rectangles de même hauteur (La hauteur a plusieurs significations suivant le domaine abordé.). La densité de probabilité est donc une fonction constante k. L'aire sous la courbe sur l'intervalle [a ; b] vaut alors k(b - a). Or cette aire doit valoir 1, donc k = 1/(b-a).

La probabilité de l'intervalle [c ; d] (inclus dans [a ; b]) est alors k(d - c) = \frac{d - c}{b - a}

Autres lois

On rencontre aussi

  • La loi exponentielle (La fonction exponentielle est l'une des applications les plus importantes en analyse, ou plus généralement en mathématiques et dans ses domaines...) dite aussi de durée de vie (La vie est le nom donné :) sans vieillissement (La notion de vieillissement décrit une ou plusieurs modifications fonctionnelles diminuant progressivement l'aptitude d'un objet, d'une information ou d'un organisme à assurer ses fonctions.)
  • La loi normale, dite aussi loi de Laplace-Gauss, ou loi normale gaussienne, ou loi de Gauss.

Ces deux lois sont également celles de distributions d’entropie (En thermodynamique, l'entropie est une fonction d'état introduite au milieu du XIXe siècle par Rudolf Clausius dans le cadre du second principe, d'après les travaux de Carnot[1]. Clausius a montré que le...) maximale sous contrainte, la première quand la seule contrainte imposée est la moyenne, la seconde ( Seconde est le féminin de l'adjectif second, qui vient immédiatement après le premier ou qui s'ajoute à quelque chose de nature identique. La seconde est une unité de...) quand sont imposées une moyenne et une variance. Cette caractéristique montre leur caractère général : de toutes les distributions obéissant à ces contraintes, ce sont les moins prévenues, les moins arbitraires, les plus générales, bref, les plus neutres : celles qui n’introduisent pas d’information supplémentaire (et donc arbitraire) par rapport à ce qui est donné.

Espérance, variance et écart type

La méthode d’approximation d’une intégrale par la méthode des rectangles conduit à définir l’espérance et la variance comme des intégrales issues du passage à la limite des sommes définissant moyenne et variance dans le cas d’une variable statistique continue.

De la moyenne de la série statistique, on passe à l’espérance de X par la formule.

E(X) = \int_{\mathbb{R}} f(x).x.dx si l’intégrale existe

La variance s’écrit alors, par analogie avec la formule de la variance avec fréquences:

V(X) =  \int_{\mathbb{R}} f(x).(x - E(X))^2.dx = \left(\int_{\mathbb{R}} f(x).x^2.dx\right) - (E(X))^2 si l’intégrale existe.

L’écart type reste toujours la racine carrée de la variance : \sigma_X = \sqrt{V(X)}.

Fonction de répartition

La fonction de répartition est la fonction F définie sur R par F(x) = p(X ≤ x).

Dans le cas d’une variable à densité, c’est la primitive de f dont la limite en + ∞ est 1.

En effet F(x) = \int_{- \infty}^xf(t)\, dt

Médiane (Le terme de médiane, du latin medius, qui est au milieu, possède plusieurs acceptations en mathématiques :)

Si la fonction de répartition F est continue et strictement croissante, elle définit une bijection (Une fonction f: X → Y est dite bijective ou est une bijection si pour tout y dans l’ensemble d'arrivée Y il existe un et un seul x dans l’ensemble de définition X tel que f(x) = y. On dit encore...) de R sur ]0 ; 1[. Il existe donc alors une valeur unique M telle que F(M) = 1/2. Cette valeur s'appelle la médiane de la variable aléatoire X. Elle vérifie p(X ≤ M) = p(X > M) = 0,5.

Cas des variables aléatoires ayant une infinité dénombrable de valeurs

Ce cas sort du cadre des mathématiques élémentaires (Les mathématiques élémentaires regroupent les mathématiques abordées et abordables dans l'enseignement primaire et secondaire. Une page méta est dédiée à ce projet :...), mais mérite cependant d'être évoqué. Ces variables font le lien entre les variables discrètes prenant n valeurs, n grand, et les variables continues.

Il est possible de définir pX(xi) pour tout i de N.

Les lois les plus connues de variables aléatoires à valeurs dans N sont :

  • la loi de Poisson (En statistique, la loi de Poisson de paramètre λ, ou loi des événements rares, correspond au modèle suivant:)
  • la loi géométrique
Page générée en 0.137 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique