L'indépendance est une notion probabiliste qualifiant de manière intuitive des événements aléatoires n'ayant aucune influence l'un sur l'autre. Il s'agit d'une notion très importante en statistique et calcul de probabilités.
Par exemple, la valeur d'un premier lancer de dés n'a aucune influence sur la valeur du second lancer. De même, pour un lancer, le fait d'obtenir une valeur inférieure ou égale à quatre n'influe en rien sur la probabilité que le résultat soit pair ou impair : les deux événements sont dits indépendants.
L'indépendance ou non de deux événements n'est pas toujours facile à établir.
La définition mathématique de l'indépendance de deux évènements est la suivante :
Définition — A et B sont indépendants
La définition mathématique ci-dessus est assez peu parlante. Le lien entre le concept intuitif d'indépendance et la "formule produit" ci-dessus apparaît plus clairement si l'on introduit la notion de probabilité conditionnelle :
Définition — Si
En excluant les cas particuliers peu intéressants où B est impossible, et où B est certain, on peut alors reformuler la définition de l'indépendance de la manière suivante
Définition — Lorsque la probabilité de B n'est ni nulle, ni égale à 1, A et B sont indépendants si l'une des conditions suivantes, toutes équivalentes, est remplie :
Ainsi les évènements A et B sont dits indépendants si notre pronostic sur l'évènement A est le même :
Autrement dit, A est dit indépendant de B si notre pronostic sur l'évènement A n'est affecté par aucune information concernant B, ni par l'absence d'information concernant B. On peut échanger les rôles de A et de B dans la définition utilisant les probabilités conditionnelles, à condition bien sûr d'exclure les cas particuliers peu intéressants où A est impossible, et où A est certain.
Bien que la définition utilisant les probabilités conditionnelles soit plus intuitive, elle a l'inconvénient d'être moins générale, et de ne pas faire jouer un rôle symétrique aux deux événements A et B.
Notons par ailleurs qu'un évènement certain A est indépendant de tout évènement B quel qu'il soit. Un évènement impossible est également indépendant de tout autre évènement. En particulier, un événement A est indépendant de lui-même à la condition que A soit soit certain, soit impossible. En effet, si l'événement A est indépendant de lui-même, on peut écrire :
et on en déduit que la probabilité de l'événement A vaut soit 0, soit 1.
Il y a plusieurs définitions équivalentes de l'indépendance d'une famille finie de variables aléatoires. On peut en particulier définir l'indépendance d'une famille de tribus, et voir ensuite l'indépendance des évènements et l'indépendance des variables aléatoires comme des cas particuliers de l'indépendance des tribus. Cela permet de démontrer certains résultats généraux sur l'indépendance une seule fois, pour les tribus, puis d'en déduire la version "évènements" et la version "variables aléatoires" de ce résultat général immédiatement (un exemple est le lemme de regroupement). Cependant, il est peut-être préférable de donner d'abord deux définitions de l'indépendance des variables aléatoires qui soient opératoires pour les applications, et quelques critères commodes. Dans ce qui suit on considère une suite
Définition —
Les espérances ci-dessus ont un sens si les
Définition — Deux variables aléatoires réelles X et Y sont indépendantes si l'une des deux conditions suivantes est remplie :
Les définitions précédentes traitent de familles finies de variables aléatoires, numérotées de 1 à n par commodité, sans que cela restreigne la généralité des énoncés : en effet, on peut toujours numéroter de 1 à n les éléments d'une famille finie de variables aléatoires. De plus, les définitions font jouer des rôles symétriques à chaque élément de la famille, si bien que le choix d'une numérotation ou d'une autre est sans effet sur la vérification de la définition.
L'indépendance d'une famille quelconque (éventuellement infinie) de variables aléatoires est la suivante :
Définition — Une famille quelconque
Soit une suite
Théorème —
Sens direct.
Comme la densité
et par suite
Par construction les fonctions
Ainsi les fonctions
ce qui entraine l'indépendance des variables
Sens réciproque. Il suffit de montrer que
où
où
En effet
On remarque alors que
Dans le cas des variables discrètes, un critère d'indépendance utile est le suivant :
Cas discret — Soit X=(X1, X2, ... , Xn ) une suite de variables aléatoires discrètes, et soit (S1, S2, ... , Sn ) une suite d'ensembles finis ou dénombrables tels que, pour tout i≤n,
Par exemple,
Critères — Soit X et Y deux variables aléatoires réelles définies sur un espace probabilisé
Par exemple, on peut utiliser le deuxième critère pour démontrer que dans la méthode de rejet, le nombre d'itérations est indépendant de l'objet aléatoire (souvent un nombre aléatoire) engendré au terme de ces itérations.
On peut généraliser ces critères d'indépendance à des familles finies quelconques de variables aléatoires réelles, dont certaines, éventuellement, sont des variables discrètes, à valeurs dans des parties finies ou dénombrables de
L'indépendance implique que la covariance, et donc la corrélation, entre les deux variables est nulle:
Théorème — X et Y sont indépendantes
Cette propriété se déduit très facilement si l'on exprime la covariance comme:
La réciproque du théorème est fausse, comme le montre l'exemple suivant:
Cet exemple est tiré de Ross (2004, p. 306)
La non-corrélation entre X et Y est une propriété plus faible que l'indépendance. En fait l'indépendance entre X et Y est équivalente à la non-corrélation de φ(X) et de ψ(Y) pour tout choix de φ et de ψ (tels que la covariance de φ(X) avec ψ(Y) soit définie ...).