Quotient de Rayleigh - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Introduction

Le quotient de Rayleigh est un nombre réel caractérisant l'effet d'une matrice symétrique (respectivement hermitienne) sur un vecteur, et offrant les deux propriétés fondamentales suivantes :

Ces deux propriétés peuvent servir à déterminer numériquement les Valeur propre, vecteur propre et espace propre d'un opérateur hermitien ou symétrique.

Le quotient de Rayleigh, dont la propriété d'extremum peut être reliée au principe du minimum de l'énergie potentielle en mécanique, a été étudié pour la première fois par Rayleigh (1877). Walter Ritz reprit l'idée en 1909 pour en faire la base d’une méthode d’approximation variationnelle.

Définitions et propriétés caractéristiques

En mathématiques, pour une matrice hermitienne A à coefficients complexes et un vecteur x non nul, on appelle quotient de Rayleigh R(A,x) le scalaire :

{x^{*} A x \over x^{*} x}.

x * désigne le vecteur adjoint de x, c'est-à-dire le conjugué du vecteur transposé.

Pour des matrices et des vecteurs à coefficients réels, le caractère hermitien se traduit par la caractère symétrique, et il faut substituer à la matrice adjointe x * la transposée familière x'. Notez que

pour tout nombre réel c, R(A,cx) = R(A,x).

Rappelons également que les valeurs propres d'une matrice symétrique (respectivement hermitienne) sont toutes réelles. On peut montrer que, sous ces conditions,

  1. le quotient de Rayleigh atteint un minimum \lambda_{\operatorname{min}} (qui n'est autre que la plus petite valeur propre de A) lorsque x est un vecteur propre v_{\operatorname{min}} associé à cette valeur.
  2. En outre, R(A, x) \leq \lambda_{\operatorname{max}} et R(A, v_{\operatorname{max}}) = \lambda_{\operatorname{max}} . Le quotient de Rayleigh, combiné au théorème du minimax, permet de déterminer une à une toutes les valeurs propres d'une matrice. On peut également l'employer pour calculer une valeur approchée d'une valeur propre à partir d'une approximation d'un vecteur propre. Ces idées forment d'ailleurs la base de l’algorithme d’itération de Rayleigh.

Méthode de Rayleigh-Ritz

La Théorie de Sturm-Liouville a trait à l’action de l’application linéaire

L(y) = \frac{1}{w(x)}\left(-\frac{d}{dx}\left[p(x)\frac{dy}{dx}\right] + q(x)y\right)

sur l’espace préhilbertien des fonctions y(x) vérifiant des conditions aux limites particulières en x=a et b, muni du produit scalaire : \langle{y_1,y_2}\rangle = \int_a^b{w(x)y_1(x)y_2(x)}dx .

Dans ce cas, le quotient de Rayleigh est

\rho(x) =\frac{\langle{y,Ly}\rangle}{\langle{y,y}\rangle} = \frac{\int_a^b{y(x)\left(-\frac{d}{dx}\left[p(x)\frac{dy}{dx}\right] + q(x)y(x)\right)}dx}{\int_a^b{w(x)y(x)^2}dx}.

On le présente parfois sous une forme équivalente, obtenue en découpant l'intégrale du numérateur et en intégrant par parties :

\rho(x) =\frac{\langle{y,Ly}\rangle}{\langle{y,y}\rangle} = \frac{\int_a^b{y(x)\left(-\frac{d}{dx}\left[p(x)y'(x)\right]\right)}dx + \int_a^b{q(x)y(x)^2}dx}{\int_a^b{w(x)y(x)^2}dx}
= \frac{-y(x)\left[p(x)y'(x)\right]|_a^b + \int_a^b{y'(x)\left[p(x)y'(x)\right]}dx + \int_a^b{q(x)y(x)^2}dx}{\int_a^b{w(x)y(x)^2}dx}
= \frac{-p(x)y(x)y'(x)|_a^b + \int_a^b\left[p(x)y'(x)^2 + q(x)y(x)^2\right]dx}{\int_a^b{w(x)y(x)^2}dx}.

Pour déterminer une solution approchée \bar y (x) de l’équation

-\frac{d}{dx}\left[p(x)\frac{dy}{dx}\right] + q(x)y = 0

vérifiant les conditions aux limites, on choisit un certain nombre de fonctions u1,u2,...,up vérifiant elles-mêmes les conditions aux limites, et on cherche la solution approchée comme une combinaison linéaire des p modes retenus : \bar y (x) = \sum_{i=1}^p \alpha_i u_i(x) . Les coefficients inconnus αi s’obtiennent en écrivant la stationnarité du quotient de Rayleigh : \frac{\partial \rho}{\partial \alpha_i}=0 , qui détermine p équations linéaires d'inconnues i)i = 1...p

Cas particulier des matrices de covariance

On peut factoriser une matrice de covariance Σ sous la forme A'A. Les valeurs propres d'une telle matrice sont positives, car :

Σvi = λivi
A'Avi = λivi
vi'A'Avi = viivi
 \left\| A v_i \right\|^2 = \lambda _i \left\| v_i \right\|^2
 \lambda _i = \frac{\left\| A v_i \right\|^2}{\left\| v_i \right\|^2} \geq 0.

Les vecteurs propres sont deux à deux orthogonaux :

Σvi = λivi
vjvi = λivj'vi
vj)'vi = λivj'vi
λjvj'vi = λivj'vi
j − λi)vj'vi = 0
vj'vi = 0 (pour des valeurs propres différentes ; en cas de multiplicité, la base de Im(Σ) peut être orthogonalisée).

Disposant donc d'une base, on peut exprimer le quotient de Rayleigh en fonction des valeurs propres en décomposant un vecteur quelconque x sur cette base des vecteurs propres :

x = \sum _{i=1} ^n \alpha _i v_i
\rho = \frac{x' A' A x}{x' x}
\rho = \frac{(\sum _{j=1} ^n \alpha _j v_j)' A' A (\sum _{i=1} ^n \alpha _i v_i)}{(\sum _{j=1} ^n \alpha _j v_j)' (\sum _{i=1} ^n \alpha _i v_i)}

relation qui, de par l’orthogonalité des vecteurs propres, devient :

\rho = \frac{\sum _{i=1} ^n \alpha _i ^2 \lambda _i}{\sum _{i=1} ^n \alpha _i ^2}.

Si un vecteur x rend maximal le scalaire ρ, alors tout vecteur k.x (car k \ne 0 ) produira également ce maximum : il suffit donc de rechercher le vecteur propre de norme égale à 1 ; on peut donc imposer \sum _{i=1} ^n \alpha _i ^2 = 1 .

Par la relation ci-dessus, il apparaît que la recherche d'un vecteur propre se ramène à la recherche d'un extremum de Lagrange, à savoir \sum _{i=1} ^n \alpha _i ^2 \lambda _i \rightarrow max sous la contrainte \sum _{i=1} ^n \alpha _i ^2 = 1 .

Puisque toutes les valeurs propres sont positives, le problème est convexe et le maximum est atteint à la frontière du domaine, à savoir quand α1 = 1 et \forall i > 1, \alpha _i = 0 (en supposant que les valeurs propres soit numérotées par ordre de valeur décroissante).

On aboutit au même résultat par la méthode des multiplicateur de Lagrange. Le problème consiste alors à déterminer les points critiques de la fonction

ρ(x) = xTΣx, sous la contrainte \|x\|^2 = x^Tx = 1 .

c’est-à-dire trouver les points critiques de

\mathcal{L}(x) = x^T\Sigma x  -\lambda (x^Tx - 1) ,

λ est un multiplicateur de Lagrange. Les points stationnaires de \mathcal{L}(x) surviennent pour

\frac{d\mathcal{L}(x)}{dx} = 0 \Longrightarrow 2x^T\Sigma - 2\lambda x^T = 0 \Longrightarrow \Sigma x = \lambda x

et  \rho(x) = \frac{x^T \Sigma x}{x^T x} = \lambda \frac{x^Tx}{x^T x} = \lambda.

Par conséquent, les vecteurs propres x_1 \ldots x_n of Σ ne sont autre que les points critiques du quotient de Rayleigh et les valeurs propres correspondantes \lambda_1 \ldots \lambda_n sont les valeurs rendant ρ(x) stationnaire.

Cette propriété remarquable est à la base de l’analyse en composantes principales et des corrélations canoniques.

Page générée en 0.240 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique
Version anglaise | Version allemande | Version espagnole | Version portugaise