Variable aléatoire
Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.
Un exemple de variable aléatoire : le résultat du jet d'un dé
Un exemple de variable aléatoire :
le résultat du jet d'un dé

Une variable aléatoire est une fonction définie sur l'ensemble des résultats possibles d'une expérience aléatoire, telle qu'il soit possible de déterminer la probabilité (La probabilité (du latin probabilitas) est une évaluation du caractère probable d'un évènement. En mathématiques, l'étude des probabilités est un sujet de grande importance donnant lieu...) pour qu'elle prenne une valeur donnée (Dans les technologies de l'information, une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction, d'un événement, etc.) ou qu'elle prenne une valeur dans un intervalle donné. À l'origine, une variable (En mathématiques et en logique, une variable est représentée par un symbole. Elle est utilisée pour marquer un rôle dans une formule, un prédicat ou un algorithme. En...) était une fonction de gain, qui représentait le gain obtenu à l'issue du résultat d'un jeu. Par exemple, supposons qu'un joueur lance un dé et que celui-ci gagne 1€ s'il amène un six et perde 10€ s'il amène un autre résultat. Alors il est possible de définir la variable aléatoire (Une variable aléatoire est une fonction définie sur l'ensemble des résultats possibles d'une expérience aléatoire, telle qu'il soit possible de déterminer la probabilité pour qu'elle...) de gain qui associe 1 au résultat " six " et -10 à un résultat inintéressant. La probabilité pour que la variable aléatoire prenne la valeur 1 correspond exactement à la probabilité pour que le joueur gagne 1€. Les variables aléatoires sont très utilisées en théorie des probabilités (La Théorie des probabilités est l'étude mathématique des phénomènes caractérisés par le hasard et l'incertitude. Les objets centraux de la théorie des probabilités sont les variables aléatoires, les processus...) et en statistiques (La statistique est à la fois une science formelle, une méthode et une technique. Elle comprend la collecte, l'analyse, l'interprétation...). Dans les applications, les variables aléatoires sont utilisées pour modéliser le résultat d'un mécanisme non-déterministe ou encore comme le résultat d'une expérience non-déterministe qui génère un résultat aléatoire.

Détails

  • La variable aléatoire la plus simple est donnée par le résultat d'un lancer au jeu de pile ou face, qui vaut pile ou face. Un autre exemple simple est donné par le résultat d'un jet de dés, pour lequel les valeurs possibles sont 1, 2, 3, 4, 5, 6 (si le dé est classiquement cubique). De telles variables aléatoires sont qualifiées de discrètes car elles prennent des valeurs bien séparées. A contrario, la mesure de la taille d'un individu (Le Wiktionnaire est un projet de dictionnaire libre et gratuit similaire à Wikipédia (tous deux sont soutenus par la fondation Wikimedia).) pris au hasard (Dans le langage ordinaire, le mot hasard est utilisé pour exprimer un manque efficient, sinon de causes, au moins d'une reconnaissance de cause à effet d'un événement.) dans une population ressemble davantage à un nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) réel positif (cela n'est pas tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou l'univers.) à fait vrai non plus, car des questions ergonomiques rendent d'autant plus improbable l'énoncé d'un nombre qu'il comporte de décimales significatives; l'attracteur (Dans l'étude des systèmes dynamiques, un attracteur (ou ensemble-limite) est un ensemble, une courbe ou un espace vers lequel un système évolue de façon irréversible en l'absence de perturbations....) est en fait un fractal). Cette variable aléatoire est alors qualifiée par convention de continue. L'étude de la répartition des valeurs prises par une variable aléatoire conduit à la notion de loi de probabilité.
  • En mathématiques, et plus précisément en théorie (Le mot théorie vient du mot grec theorein, qui signifie « contempler, observer, examiner ». Dans le langage courant, une théorie est une idée ou une connaissance spéculative, souvent basée sur l’observation ou...) des probabilités, une variable aléatoire est une fonction mesurable (Soient E et F des espaces mesurables munis respectivement d'une tribu et .) définie sur un espace de probabilités. La mesure image correspondante est appelée loi de la variable aléatoire. Ce type de fonction permet de modéliser un phénomène aléatoire, comme par exemple le résultat d'un jet de dés. Une propriété intéressante de l'intégrale de Lebesgue (En mathématiques dans la branche de l'analyse réelle, l'intégrale de Lebesgue est une intégrale représentative d'une théorie qui étend la notion d'intégrale représentant l'aire du domaine sous...) fait qu'un évènement de probabilité strictement nulle n'est pas nécessairement impossible au sens (SENS (Strategies for Engineered Negligible Senescence) est un projet scientifique qui a pour but l'extension radicale de l'espérance de vie humaine. Par...) strict du terme (ainsi, considérons un réel tiré au hasard dans l'intervalle [0, 1] ; la probabilité qu'il soit rationnel est nulle, alors que les rationnels constituent dans cet intervalle un ensemble infini (En mathématiques, un ensemble est infini s'il n'est pas fini, c'est-à-dire s'il contient un nombre infini d'éléments. En d'autres termes, si E est un ensemble infini alors  : Le cardinal de E n'est pas un entier naturel....), et même partout dense).

Quelques variables aléatoires

En guise d'introduction aux définitions concernant les variables aléatoires, il semble intéressant de présenter brièvement une famille de variables très utilisées.

Outre la variable certaine qui prend une valeur donnée avec une probabilité égale à 1, la variable aléatoire la plus simple est appelée variable de Bernoulli. Celle-ci peut prendre deux états, qu'il est toujours possible de coder 1 et 0, avec les probabilités p et 1-p. Une interprétation simple concerne un jeu de dé dans lequel on gagnerait un euro en tirant le six (p = 1/6). Sur une séquence de parties, la moyenne (La moyenne est une mesure statistique caractérisant les éléments d'un ensemble de quantités : elle exprime la grandeur qu'auraient chacun des membres de l'ensemble s'ils...) des gains tend vers p lorsque le nombre de parties tend vers l'infini (Le mot « infini » (-e, -s ; du latin finitus, « limité »), est un adjectif servant à qualifier quelque chose qui n'a pas de...).

Si on considère qu'une partie est constituée par n tirages au lieu d'un seul, le total ( Total est la qualité de ce qui est complet, sans exception. D'un point de vue comptable, un total est le résultat d'une addition, c'est-à-dire une somme. Exemple : "Le total des dettes". En physique le total n'est...) des gains est une réalisation d'une variable binomiale qui peut prendre toutes les valeurs entières de 0 à n. Cette variable a pour moyenne le produit np. On obtient un exemple moins futile en considérant le score d'un candidat dans un sondage ( Un sondage peut désigner une technique d'exploration locale d'un milieu particulier. Un sondage peut également être une méthode statistique d'analyse d'une population humaine ou non humaine à partir...) électoral.

Si n est assez grand et p pas trop petit, on peut trouver une approximation (Une approximation est une représentation grossière c'est-à-dire manquant de précision et d'exactitude, de quelque chose, mais encore...) convenable en utilisant la variable de Gauss. Dans les sondages cela permet d'associer un intervalle de confiance au résultat brut. Ainsi, il y a 95 chances sur 100 pour qu'une enquête portant sur 1 000 personnes donne un résultat correct à ± 3 % près.

Toujours avec n grand, l'approximation de Poisson (Dans la classification classique, les poissons sont des animaux vertébrés aquatiques à branchies, pourvus de nageoires et dont le corps est le plus souvent couvert...) est préférable si p est assez petit pour que la moyenne np ne soit pas trop grande, de l'ordre de quelques unités. Dans un sondage ce serait la loi applicable aux " petits " candidats. C'est surtout la loi utilisée dans des problèmes de files d'attente.

La somme des carrés de ν variables de Gauss indépendantes est une variable de χ2 à ν degrés de liberté (la variable exponentielle (La fonction exponentielle est l'une des applications les plus importantes en analyse, ou plus généralement en mathématiques et dans ses domaines d'applications. Il existe plusieurs définitions...) en est un cas particulier). Le test du χ2 est utilisé pour apprécier la valeur de l'adéquation d'une loi de probabilité sur une distribution empirique.

Si on divise une variable de Gauss par une variable de χ (racine carrée de la précédente), on obtient une variable de Student. Le rapport de deux variables de χ2 indépendantes définit une variable de Snedecor. Ces deux lois sont utilisées dans l'analyse de populations supposées gaussiennes.

Notions de base

Fonction de répartition (En probabilité, la fonction de répartition d'une variable aléatoire X est la fonction qui à tout réel x associe)

Il serait possible d'introduire cette notion à partir de l'une quelconque des variables précédemment considérées mais il paraît plus clair d'étudier le cas du dé sous un angle (En géométrie, la notion générale d'angle se décline en plusieurs concepts apparentés.) différent. En effet, il définit une variable aléatoire X qui prend avec la même probabilité d'apparition (1/6) des valeurs dans l'ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble), « une multitude qui peut être comprise comme un tout », comme...) {1,2,3,4,5,6}. On peut alors associer à toute valeur réelle x la probabilité d'obtenir un tirage inférieur ou égal à x, ce qui définit une courbe (En géométrie, le mot courbe, ou ligne courbe désigne certains sous-ensembles du plan, de l'espace usuels. Par exemple, les droites, les segments, les lignes polygonales et les cercles sont des courbes.) en escalier (L’escalier est une construction architecturale constituée d'une suite régulière de marches, les degrés, permettant d'accéder à un étage, de passer d'un niveau à un autre en montant et descendant.) dont les marches ont une hauteur (La hauteur a plusieurs significations suivant le domaine abordé.) égale à 1/6.

Formellement, cela conduit à une fonction de répartition

F_X(x) = P(X\leq x)\,

Dans celle-ci, la majuscule X représente la variable aléatoire, ensemble de valeurs numériques, et la minuscule x représente la variable d'état, variable au sens usuel du terme.

Si les événements ne sont plus équiprobables, cela ne fait que déformer la courbe. Pour introduire une notion nouvelle, on peut commencer par remplacer le dé par une roulette à six numéros, ce qui conduit à un problème rigoureusement identique. Ensuite, on ne change rien de fondamental si on remplace les six nombres entiers par les repères des centres d'arcs de 60 degrés. À partir de là il est possible d'augmenter le nombre de secteurs en réduisant leur taille : les échelons deviendront de plus en plus petits jusqu'à être indiscernables sur un dessin. Le passage à la limite remplace la variable discrète par une variable continue qui prend toutes les valeurs réelles dans l'intervalle ]0,360] : c'est une variable uniforme.

Une fonction de répartition est croissante (au sens large) sur l'intervalle ]-∞,+∞[, et continue à droite en tout point ; elle tend vers 0 en -∞ et vers 1 en +∞. Réciproquement, toute fonction vérifiant les propriétés (caractéristiques) précédentes peut être considérée comme la fonction de répartition d'une variable aléatoire.

L'intérêt de la fonction de répartition réside dans le fait qu'elle est valable aussi bien pour les variables continues définies sur un ensemble continu que pour les variables discrètes définies sur un ensemble dénombrable (Un ensemble E est dit dénombrable s'il est équipotent à l'ensemble des entiers naturels , c'est-à-dire s'il existe une bijection de E sur  ; cela équivaut à...) (dans la plupart des cas pratiques il se réduit à un ensemble de valeurs équidistantes que l'on peut ramener à un ensemble d'entiers). Le remplacement progressif de courbes en escaliers par des courbes continues permet de voir intuitivement comment une variable continue peut fournir une approximation souvent plus facile à manipuler que la variable discrète originale.

Malheureusement ces avantages de la fonction de répartition, intéressants pour la visualisation des phénomènes, disparaissent dès que l'on veut approfondir les problèmes. Dans ce cas, il est généralement plus commode d'utiliser les notions décrites dans les paragraphes suivants.

Fonction de probabilité d'une variable discrète

La loi d'une variable discrète est déterminée tout simplement par l'ensemble des probabilités de ses valeurs (Fonction de Masse). Si l'on suppose qu'elle prend des valeurs entières (de signe quelconque), cela s'écrit :

P_X(i) = P(X = i)\ (i \in \mathbb{Z})

On reconstruit la fonction de répartition (dont les valeurs sont alors appelées probabilités cumulées) par la relation :

si n \leq x < n+1, alors F_X(x) = \sum_{k=-\infty}^n P_X(k).

Densité de probabilité (En mathématiques statistiques, on appelle densité de probabilité d'une variable aléatoire X réelle continue une fonction f) d'une variable continue

Une variable continue possède en général une fonction de répartition continue en tout point (Graphie) et dérivable par morceaux. Il est alors commode de la dériver pour obtenir la densité (La densité ou densité relative d'un corps est le rapport de sa masse volumique à la masse volumique d'un corps pris comme référence. Le corps de référence est...) de probabilité, vérifiant :

p_X(x) =  {dF_X \over dx}

qui est définie et à valeurs positives (ou nulles) sur ]-\infty,\, +\infty[\,, telle que \int_{-\infty}^{+\infty} p_X(x)\ dx = 1.

On reconstruit la fonction de répartition par la relation :

F_X(x) = \int_{-\infty}^{x} p_X(\xi)\ d\xi

Dans les raisonnements généraux, il est souvent commode d'écrire ces formules sous forme différentielle :

P(x < X \leq x + dx) = p_X(x)\ dx

Si l'on effectue un changement de variable selon la formule Y = f(X)\,, la nouvelle densité de probabilité se calcule par :

p_Y(y) dy = p_X(x) dx\,

Espérances mathématiques

Définition (Une définition est un discours qui dit ce qu'est une chose ou ce que signifie un nom. D'où la division entre les définitions réelles et les définitions nominales.)

L'espérance mathématique (L'espérance mathématique est une valeur numérique permettant de mesurer le degré d'équité d'un jeu de hasard. Elle est égale à la somme des gains (et des pertes) pondérés par la probabilité du gain (ou de la perte).) d'une variable aléatoire se définit comme la moyenne des valeurs prises par cette variable, pondérées par leurs probabilités.

Dans le cas d'une variable discrète que l'on suppose prendre les valeurs entières, elle se définit simplement par

E[X] = \sum_{k=-\infty}^{+\infty} k\ P_X(k)

(sous réserve d'existence, c'est-à-dire ici de sommabilité).

Pour une variable continue, la formule différentielle donnée précédemment s'intègre en

E[X] = \int_{-\infty}^{+\infty} x\ p_X(x)\ dx

(sous réserve d'existence, c'est-à-dire ici d'intégrabilité).

Généralisation (La généralisation est un procédé qui consiste à abstraire un ensemble de concepts ou d'objets en négligeant les détails de façon à ce qu'ils puissent être considérés de...)

X étant une variable aléatoire, une fonction f supposée régulière définit une nouvelle variable aléatoire f(X) dont l'espérance, lorsqu'elle existe, s'écrit en remplaçant k par f(k) ou x par f(x) dans les formules précédentes (théorème de transfert).

En particulier, il est intéressant de considérer la variable aléatoire à valeurs complexes e^{i \theta X}\, (où \theta \in \mathbb{R}) dont l'espérance mathématique (Les mathématiques constituent un domaine de connaissances abstraites construites à l'aide de raisonnements logiques sur des concepts tels que les nombres, les figures, les structures et les...) est [la valeur en θ de] la transformée de Fourier (En analyse, la transformation de Fourier est un analogue de la théorie des séries de Fourier pour les fonctions non périodiques, et permet de leur associer un spectre en...) inverse (En mathématiques, l'inverse d'un élément x d'un ensemble muni d'une loi de composition interne · notée multiplicativement, est un élément y tel que x·y = y·x = 1, si 1...) de la densité de probabilité :

\phi_X(\theta) = E\left[e^{i \theta X}\right]\,

L'exponentielle se développe en série :

\phi_X(\theta) = E\left[\sum_{k=0}^\infty {(i \theta X)^k \over {k !}}\right]

ou, si la densité de probabilité est une fonction suffisamment régulière  :

\phi_X(\theta) = \sum_{k=0}^\infty {(i \theta)^k \over {k !}}E\left[X^k\right]

Moments par rapport à l'origine

Les quantités E\left[X^k\right]\, sont appelées les moments par rapport à l'origine (moments ordinaires ou raw moments en anglais) de la variable aléatoire X et sont généralement notées :

m_k(X) = E\left[X^k\right]\,

.

Une variable aléatoire suffisamment régulière peut être caractérisée, et de façon équivalente, par sa fonction de répartition, sa densité de probabilité (ou sa fonction de probabilité), sa fonction caractéristique (On rencontre des fonctions caractéristiques dans plusieurs domaines :) ou la suite de ses moments m_k(X)\, .

Moments centrés

Le moment d'ordre 1 par rapport à l'origine, m_1(X) = E[X]\, , souvent noté \overline X , représente la moyenne, valeur centrale.

En ce qui concerne les moments d'ordre supérieur, il est souvent plus commode d'utiliser, plutôt que les moments par rapport à l'origine m_k(X)\,, les moments centrés, notés généralement \mu_k(X)\, et qui se définissent ainsi :

\mu_k(X) = E[(X-\overline X)^k],

Le plus utile de ces moments est la variance ( En statistique et en probabilité, variance En thermodynamique, variance ), valeur de dispersion :

\sigma_X^2 = E[(X-\overline X)^2] = E[X^2] - (E[X])^2 = \overline {X^2} -(\overline X)^2

dont la racine carrée (La racine carrée d’un nombre réel positif x est le nombre positif dont le carré vaut x. On le note ou x½; dans cette expression, x est...) fournit une grandeur homogène à la grandeur de base et à la moyenne, et appelée écart-type de la variable aléatoire X : σX.

Il existe des formules (qui ressemblent à celle du binôme) permettant de calculer un moment centré d'ordre k à partir des moments ordinaires d'ordre inférieur ou égal à k, et réciproquement ; voici quelques exemples (jusqu'à l'ordre 4) :

\mu_2 = m_2 - m^2_1\,
\mu_3 = m_3 -3\,m_1\,m_2 + 2m^3_1\,
\mu_4 = m_4 -4\,m_1\,m_3 + 6\,m^2_1\,m_2 - 3m^4_1\,\!
et :
m_2 = \mu_2 + m^2_1\,
m_3 = \mu_3 + 3\,m_1\mu_2 + m^3_1\,
m_4 = \mu_4 + 4\,m_1\mu_3 + 6\,m^2_1\mu_2 + m^4_1\,

Médiane (Le terme de médiane, du latin medius, qui est au milieu, possède plusieurs acceptations en mathématiques :)

On appelle médiane d'une variable aléatoire X, un réel m tel que

P(X \leq m ) \geq 1/2 \leq P(X \geq m)

Dans le cas d'une variable aléatoire discrète, cette définition est peu intéressante car elle permet l'existence de plusieurs médianes

si X est le numéro apparaissant sur la face supérieure d'un dé à 6 faces parfaitement équilibré, pour tout réel m strictement compris entre 3 et 4, on a :
P(X \leq m ) = P(X \geq m) = 1/2

ou bien l'existence d'une médiane qui ne donne pas une probabilité de 0,5

Si X est la somme obtenue en lançant deux dés à 6 faces parfaitement équilibrés. X ne possède qu'une seule médiane 7 mais P( X \leq 7 ) = 21/36

Dans le cas d'une variable continue, si la fonction de répartition est strictement croissante, la définition est équivalente à la suivante :

la médiane de X est le réel unique m tel que F_X(m)=0,5\,

Le fait que la fonction de répartition soit continue, et supposée strictement croissante, à valeurs dans ]0 ; 1[, assure l'existence et l'unicité de la médiane.

Informatique (L´informatique - contraction d´information et automatique - est le domaine d'activité scientifique, technique et industriel en rapport avec le traitement automatique de l'information par des machines...)

On utilise souvent des générateurs pseudo aléatoires pour simuler le hasard. Il existe également des moyens d'exploiter l'indétermination de phénomènes physiques, par exemple en analysant les variations d'un film de lampe à lave (La lave est une roche en fusion, plus ou moins fluide, émise par un volcan lors d’une éruption. La lave est issue d'un magma, réserve de roche en fusion située dans...), ou en analysant le bruit (Dans son sens courant, le mot de bruit se rapproche de la signification principale du mot son. C'est-à-dire vibration de l'air pouvant donner lieu à la création d'une...) thermique (La thermique est la science qui traite de la production d'énergie, de l'utilisation de l'énergie pour la production de chaleur ou de froid, et des transferts de chaleur suivant différents...).

Page générée en 0.226 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique