Décomposition en valeurs singulières - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

- Introduction - Contexte mathématique - Exemple - Histoire - Normes - Variantes - Utilisations - Opérateurs bornés sur les espaces de Hilbert - Calcul de la SVD

Utilisations

Calcul du pseudo-inverse

La décomposition en valeurs singulières permet de calculer le pseudo-inverse d'une matrice. En effet, le pseudo-inverse d'une matrice M connaissant sa décomposition en valeurs singulières $M = U Σ V *$ , est donné par :

avec Σ⁺ la transposée de Σ où tout coefficient non-nul est remplacé par son inverse. Le pseudo-inverse lui-même permet de résoudre la méthode des moindres carrés.

Image, rang et noyau

Une autre utilisation de la décomposition en valeurs singulières est la représentation explicite de l'image et du noyau d'une matrice M. Les vecteurs singuliers à droite correspondant aux valeurs singulières nulles de M engendrent le noyau de M. Les vecteurs singuliers à gauche correspondant aux valeurs singulières non-nulles de M engendrent son image.

Par conséquent, le rang de M est égal au nombre de valeurs singulières non-nulles de M. De plus, les rangs de M, de $M * M$ et de $M M *$ sont égaux. $M * M$ et $M M *$ ont les mêmes valeurs propres non-nulles.

En algèbre linéaire, on peut prévoir numériquement le rang effectif d'une matrice, puisque les erreurs d'arrondi pourraient autrement engendrer des valeurs petites mais non-nulles, faussant le calcul du rang de la matrice.

Approximations de matrices, le théorème d'Eckart Young

Approximations successives d'une image, avec 1, 2, 4, 8, 16, 32, 64, 128 puis toutes les valeurs singulières (original à gauche).

Certaines applications pratiques ont besoin de résoudre un problème d'approximation de matrices $M$ à partir d'une matrice $\tilde{M}$ ayant un rang donné, égal à r. Dans le cas où on tente de minimiser la distance au sens de la norme spectrale (ou aussi de Frœbenius) entre $M$ et $\tilde{M}$ , en gardant $\mbox{rg}(\tilde{M}) = r$ , on constate que la solution est la décomposition en valeurs singulières de $M$ , c'est-à-dire :

avec $\tilde{\Sigma}$ égale à $Σ$ , si ce n'est qu'elle ne contient que les $r$ plus grandes valeurs singulières, les autres étant remplacées par 0. Voici la démonstration :

On se limite aux matrices carrées par souci de simplification. On utilise le symbole norme triple pour représenter la norme spectrale. On prouve le théorème d'Eckart Young tout d'abord pour la norme spectrale. Sans perte de généralité, on peut supposer que A est une matrice diagonale et donc que U et V sont la matrice identité. On pose donc $A = Σ$ . Les termes diagonaux de A sont notés $σ i$ . Ils sont triés par ordre décroissant. On a donc

On considère une matrice B quelconque de rang r. On considère le sous-espace vectoriel E de $\mathbb{R}^n$ engendrés par les vecteurs $(e_1,\ldots,e_{r+1})$ où chacun des $e i$ est le vecteur $(0,\ldots,0,1,0,\ldots,0)$ non nul au rang i. Ce sous-espace vectoriel est de dimension r+1. Comme la matrice B est de rang r, le noyau de B est de rang n-r. Par un argument simple aux dimensions, l'intersection de E et du noyau de B n'est pas nulle. On considère un vecteur normalisé x appartenant à cette intersection. On définit $x = \sum_{i=1}^{r+1} x_i e_i$ On a alors

Comme les vecteurs $e i$ sont orthogonaux et normés, on obtient:

Par définition de la norme spectrale, on déduit donc que quelle que soit la matrice B, on a

On conclut la preuve en choisissant $B = \Sigma' = {\rm diag}(\sigma_1,\ldots,\sigma_{r+1},0,\ldots,0)$ . n constate alors aisément que $|\|A-B\|| = \sigma_{r+1}$ .

Donc $B = Σ'$ est la matrice de rang r qui minimise la norme spectrale de A - B.

En ce qui concerne la preuve pour la norme de Frœbenius, on garde les mêmes notations et on remarque que

La preuve est alors similaire.

Ainsi, $\tilde M$ , matrice de rang r, est la meilleure approximation de $M$ au sens de la norme de Frobenius (ou spectrale) quand $\sigma_i = s_i \quad (i=1,\cdots,r)$ . De plus, ses valeurs singulières sont les mêmes que celles de $M$ .

Application aux langues naturelles

Une des principales utilisation de la décomposition en valeurs singulières dans l'étude des langues naturelles est l'analyse sémantique latente (ou LSA, de l'anglais latent semantic analysis), une méthode de la sémantique vectorielle. Ce procédé a pour but l'analyse des relations entre un ensemble de documents et des termes ou expressions qu'on y trouve, en établissant des « concepts » communs à ces différents éléments.

Brevetée en 1988, on parle également d'indexation sémantique latente (LSI). Voici une description sommaire du principe de cet algorithme.

Dans un premier temps, on construit une matrice représentant les différentes occurrences des termes (d'un dictionnaire prédéterminé, ou extraits des documents), en fonction des documents. Par exemple, prenons trois œuvres littéraires :

Document 1 : « J'adore Wikipédia »
Document 2 : « J'adore le chocolat »
Document 3 : « Je déteste le chocolat »

Alors la matrice M associée à ces documents sera :

	J'	Je	adore	déteste	le	Wikipédia	chocolat
Document 1	1	0	1	0	0	1	0
Document 2	1	0	1	0	1	0	1
Document 3	0	1	0	1	1	0	1

Éventuellement, on peut réduire certains mots à leur radical ou à un mot équivalent, ou même négliger certains termes trop courts pour avoir un sens ; la matrice contient alors Je, adorer, détester, Wikipédia, chocolat. Les coefficients (ici 1 ou 0) sont en général non pas un décompte mais une valeur proportionnelle au nombre d'occurrences du terme dans le document, on parle de pondération « tf-id » (term frequency — inverse document frequency).

Alors M sera de la forme :

\begin{matrix} & \textbf{terme}_j \\ & \downarrow \\ \textbf{document}_i^T \rightarrow & \begin{pmatrix} x_{1,1} & \dots & x_{1,n} \\ \vdots & \ddots & \vdots \\ x_{m,1} & \dots & x_{m,n} \\ \end{pmatrix} \end{matrix}

On peut également travailler avec la transposée de M, que l'on note N. Alors les vecteurs lignes de N correspondent à un terme donné, et donnent accès à leur « relation » à chaque document :

Et de même, une colonne de la matrice N représente un document donné, et donne accès à sa relation à chaque terme :

\textbf{document}_j = \begin{bmatrix} x_{1,j} \\ \vdots \\ x_{m,j} \end{bmatrix}

On accède à la corrélation entre les termes de deux documents en effectuant leur produit scalaire. La matrice symétrique obtenue en calculant le produit $S = N N T$ contient tous ces produits scalaires. L'élément de S d'indice $(i, p)$ contient le produit :

De même, la matrice symétrique $Z = N T N$ contient les produits scalaires entre tous les documents, qui donne leur corrélation selon les termes :

On calcule maintenant la décomposition en valeurs singulières de la matrice N, qui donne les matrices telles que :

M = U Σ V T

Alors les matrices de corrélation deviennent :

La matrice U contient les vecteurs propres de S, la matrice V contient ceux de Z. On a alors :

\begin{matrix} & (\textbf{document}_j) & & & & & & & (\widehat{ \textbf{document}_j) } \\ & \downarrow & & & & & & & \downarrow \\ (\textbf{terme}_i^T) \rightarrow & \begin{pmatrix} x_{1,1} & \dots & x_{1,n} \\ \\ \vdots & \ddots & \vdots \\ \\ x_{m,1} & \dots & x_{m,n} \\ \end{pmatrix} & = & (\widehat{ \textbf{terme}_i} ^T) \rightarrow & \begin{pmatrix} \begin{bmatrix} \, \\ \, \\ \textbf{u}_1 \\ \, \\ \,\end{bmatrix} \dots \begin{bmatrix} \, \\ \, \\ \textbf{u}_l \\ \, \\ \, \end{bmatrix} \end{pmatrix} & \cdot & \begin{pmatrix} \sigma_1 & \dots & 0 \\ \vdots & \ddots & \vdots \\ 0 & \dots & \sigma_l \\ \end{pmatrix} & \cdot & \begin{pmatrix} \begin{bmatrix} & & \textbf{v}_1 & & \end{bmatrix} \\ \vdots \\ \begin{bmatrix} & & \textbf{v}_l & & \end{bmatrix} \end{pmatrix}\\ & M & & & U & & \Sigma & & V^T \end{matrix}

Les valeurs singulières, $\sigma_1, \dots, \sigma_l$ peuvent alors être sélectionnées, pour obtenir une « approximation » de la matrice à un rang k arbitraire, qui permet une analyse plus ou moins précise des données.

Cinématique inverse

En robotique, le problème de la cinématique inverse, qui consiste essentiellement à savoir « comment bouger pour atteindre un point, » peut être abordé par la décomposition en valeurs singulières.

Énoncé du problème

On peut considérer — c'est un modèle très général — un robot constitué de bras articulés, indicés i, formant un angle θ_i entre eux, dans un plan. On note X le vecteur représentant la position du « bout » de cette chaine de bras, qui en pratique est une pince, une aiguille, un aimant… Le problème va être de déterminer le vecteur θ, contenant tous les θ_i, de sorte que X soit égal à une valeur donnée X₀.

Résolution

On définit le jacobien de X par :

On a alors :

Si J est inversible (ce qui est, en pratique, toujours le cas), on peut alors accéder à la dérivée de θ :

Si J n'est pas inversible, on peut de toute façon utiliser la notion de pseudo-inverse. Néanmoins, son utilisation ne garantit pas que l'algorithme converge, il faut donc que le jacobien soit nul en un nombre réduit de points. En notant (U,Σ,V) la décomposition en valeurs singulières de J, l'inverse (le pseudo-inverse si J n'est pas inversible) de J est donné par :

(cas inversible) ;

(cas pseudo-inversible).

On a noté Σ⁺ la matrice diagonale comportant l'inverse des valeurs singulières non-nulles. Dans la suite, la notation J^-1 renverra sans distinction à l'inverse ou au pseudo-inverse de J.

Le calcul des vecteurs colonne de J peut être effectué de la manière qui suit :

On note X_i la position de l'articulation i ;
On note e_z le vecteur unitaire de même direction que l'axe de rotation de l'articulation ;

Alors $J_i = \textbf{e}_z \wedge \left( \textbf{X}_0 - \textbf{X} \right)$ .

On peut alors discrétiser l'équation, en posant :

Et en ajoutant Δθ à θ à chaque itération, puis en recalculant ΔX et Δθ, on atteint peu à peu la solution désirée.

Résolution alternative

Il est également possible d'utiliser la décomposition en valeurs singulières de J autrement pour obtenir Δθ :

En multipliant successivement à gauche par J puis par sa transposée, pour enfin utiliser la décomposition en valeurs singulières de J^TJ, on a :

Soit en conclusion :

Autres exemples

Une utilisation courante de la décomposition en valeurs singulières est la séparation d'un signal sur deux sous-espaces supplémentaires, par exemple un sous-espace « signal » et un sous-espace de bruit. La décomposition en valeurs singulières est beaucoup utilisée dans l'étude de l'inversion de matrices, très pratique dans les méthodes de régularisation. On l'emploie également massivement en statistiques, en traitement du signal, en reconnaissance de formes et dans le traitement informatique des langues naturelles.

De grandes matrices sont décomposées au travers de cet algorithme en météorologie, pour l'algorithme de Lanczos par exemple.

L'étude géologique et sismique, qui a souvent à faire avec des données bruitées, fait également usage de cette décomposition - et de ses variantes multidimensionnelles - pour « nettoyer » les spectres obtenus. Étant donnés un certain nombre d'échantillons connus, certains algorithmes peuvent, au moyen d'une décomposition en valeurs singulières, opérer une déconvolution sur un jeu de données.

Variantes

Opérateurs bornés sur les espaces de Hilbert

- Introduction - Contexte mathématique - Exemple - Histoire - Normes - Variantes - Utilisations - Opérateurs bornés sur les espaces de Hilbert - Calcul de la SVD

☄️ 3I/ATLAS: le visiteur interstellaire expulse un jet géant vers le Soleil

🧠 Nos ancêtres humains ont été exposés au plomb, et cela a influencé notre évolution

💉 Masser la peau pour vacciner: une alternative possible aux injections ?

🌑 L'origine du plus grand cratère de la Lune remise en question

🧂 Comparaison du prix des aliments riches en sel et en sucres avec leurs équivalents plus sains

🥤 Sérieusement malade, cette patiente a été soignée avec... du soda

🌡️ Exploiter le bruit comme ressource de calcul 'gratuite' pour l'intelligence artificielle

🌍 Les émissions de gaz à effet de serre ont explosé en 2024

🌑 Une deuxième Lune en orbite autour de la Terre ?

🦠 Des virus pathogènes peuvent survivre des années sur les fruits surgelés

🦅 Des trésors archéologiques de 700 ans découverts dans des nids de rapaces

💘 Le rôle caché de la moelle épinière dans la sexualité

💫 La rotation des astéroïdes: une source d'information des plus importantes

🧠 La suralimentation chez les petites filles: un précurseur de troubles mentaux

🖐️ L'origine de nos doigts

⚫ Les trous noirs deviennent des détecteurs de matière noire

🦴 Découverte d'un "Dragon Épée" datant du jurassique

🫧 Pourquoi certaines mousses tiennent mieux que d'autres ? Une réponse de l'espace !

🐺 Premier hybride loup-chien confirmé en Grèce

💀 Découverte macabre de 7 squelettes de soldats romains jetés dans un puits

🪸 La mort des coraux, un bénéfice pour le climat ?

🩺 Un lien surprenant entre magnétisme solaire et crises cardiaques

🔄 Comment un plasma fait tourner une image

💧 Une loi mathématique unique régit toutes les stalagmites !

💉 Des scientifiques réussissent à inverser le vieillissement

🔭 Découverte d'un objet invisible d'un million de masses solaires

💉 De l'ARN messager plus solide pour les futurs vaccins

🪐 A la recherche des Neptunes perdues

🌊 Découverte: la mer Rouge a disparu puis est réapparue brutalement

🌊 Quand la fonte des glaces nord-américaines a fait monter les océans de 10 mètres

🧲 Des étrangetés magnétiques identifiées autour de la Terre

🐁 Ces souris sauvages possèdent un langage jamais vu

💥 La fin de l'Univers se précise, sa date de mort est déjà calculée

⚠️ Les inhalateurs polluent autant que 530 000 voitures chaque année

🕷️ Découverte d'une araignée mi-mâle mi-femelle qui étonne les scientifiques

🌟 Découverte de la première étoile affichant des caractéristiques originelles !

💊 Cancer du sein: ce nouveau traitement montre des résultats très encourageants

🧻 Voici la première trace fossile de frottement de fesses !

🔌 Voitures électriques: comment optimiser au maximum le coût de recharge ?

🛰️ Quelle est cette anomalie gravitationnelle apparue en Afrique ?

👀 Voici le tout premier animal de la Terre

🔭 Le télescope James Webb aurait-il découvert les premières étoiles noires ?

🤔 Cette femme rit sans raison ni contrôle: pourquoi ?

🔭 Cette cicatrice géante pourrait avoir été causée par un trou noir supermassif errant

🫀 Crise cardiaque: les globules blancs percent des trous dans le cœur !

🏆 Un ordinateur quantique bat enfin les ordinateurs classiques sur un point crucial

🦟 Découverte exceptionnelle: des insectes de 112 millions d'années conservés dans de l'ambre

🔭 Utiliser la Lune pour révéler la matière noire

🧠 Quand le stress renforce l'intelligence collective

💊 Cancer: cette thérapie prête à l'emploi promet d'éliminer les tumeurs

Page générée en 0.237 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise