Théorème des facteurs invariants - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Introduction

En mathématiques, le théorème des facteurs invariants porte sur les modules de type fini sur les anneaux principaux. Les facteurs invariants sont des obstructions à l'inversibilité des matrices qui n'apparaissent pas dans la théorie des espaces vectoriels. Leur calcul a de nombreuses applications : par exemple trouver la classe d'isomorphie d'un groupe abélien de type fini à partir d'une présentation de celui-ci. Dans un cadre précis, le théorème des facteurs invariants se particularise en théorèmes de réduction d'endomorphisme. Il permet alors notamment de calculer les invariants de similitude d'un endomorphisme sur un espace vectoriel. Le résultat du théorème des facteurs invariants est aussi connu sous le nom de forme normale de Smith.

L'approche présentée ici est effective dans le cadre d'un anneau euclidien. Le premier algorithme, dit d'échelonnement, est une généralisation du procédé d'élimination de Gauss-Jordan, de la décomposition LU : il permet de calculer des rangs et déterminants de matrices, et des noyaux et des images de morphismes de modules, ainsi que de résoudre des systèmes linéaires dans ce cadre. Le second algorithme, qui permet d'obtenir les applications annoncées est essentiellement un algorithme d'échelonnement simultané en lignes et en colonnes.

Une autre approche classique consiste à passer par la décomposition de Frobenius.

Rappel sur la décomposition LU

Une matrice A étant donnée, on souhaite la transformer en matrice triangulaire supérieure par opérations élémentaires sur les lignes (c'est-à-dire multiplication à gauche par des matrices de transvection, et des matrices de permutation). Par exemple, pour la matrice :

A=\begin{pmatrix} 2 & 4 & 3\\ 1 & 5 & 0\\ 3 & 8 & 2\\ \end{pmatrix}=\begin{pmatrix}L_1\\L_2\\L_3\end{pmatrix}.

on multiplie à gauche successivement par les matrices :

T_1=\begin{pmatrix} 1 & 0 & 0\\ -1/2 & 1 & 0\\ 0 & 0 & 1\\ \end{pmatrix},T_2=\begin{pmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ -3/2 & 0 & 1\\ \end{pmatrix}.

La première multiplication matricielle revient à remplacer la deuxième ligne de la matrice A par L_2-\frac{1}{2}L_1  ; puis la seconde multiplication revient à remplacer la troisième ligne par L_3-\frac{3}{2}L_1 . On obtient ainsi une égalité matricielle :

T_2T_1A=\begin{pmatrix}&L_1&\\0&*&*\\0&*&*\\ \end{pmatrix}.

c'est-à-dire qu'on a annulé les coefficients sous-diagonaux de la première colonne de A, par multiplication par des matrices Ti de transvection, en se servant de la ligne L1 comme pivot. En itérant le procédé, on peut annuler tous les coefficients sous-diagonaux de A, sous réserve toutefois de ne jamais tomber sur un pivot nul.

Théorème des facteurs invariants

Pour obtenir les conséquences théoriques annoncées,il faut aller plus loin ; on veut essentiellement obtenir une matrice qui soit à la fois échelonnée en lignes et en colonnes. Le théorème s'énonce ainsi :

Théorème

Soit \mathcal{A} un anneau euclidien, et A\in M_{n,m}(\mathcal{A}) . Alors, il existe des matrices T\in Sl_n(\mathcal{A}) et U\in Sl_m(\mathcal{A}) , produits de matrices de transvection généralisées, telles que TAU soit échelonnée en lignes et en colonnes ; c'est-à-dire de la forme :

\begin{pmatrix}p_1&0&&\\0&\ddots&&\\&&p_r&\\&&&0\\ \end{pmatrix}

avec de plus la relation de divisibilité p_1\mid p_2\mid\dots\mid p_r Les coefficients pi forment un système de facteurs invariants pour la matrice A. Les facteurs invariants sont définis de façon unique, à multiplication par inversibles près. La suite des facteurs invariants caractérise les matrices à équivalence près.

Corollaire et remarque

Notons le résultat suivant, corollaire de l'existence d'une mise sous forme diagonale :

Les matrices de Sl_n(\mathcal{A}) peuvent s'écrire comme produit d'un nombre fini de matrices de transvection généralisées.

L'algorithme concerne donc les classes d'équivalence pour la relation A\sim_1 B si et seulement s'il existe U,T\in Sl(\mathcal{A}) telles que A = TBU. Les facteurs invariants, définis à inversibles de \mathcal{A} près, caractérisent en fait les classes pour la relation d'équivalence moins précise A\sim_2 B si et seulement s'il existe telles que A = TBU. Pour trouver les invariants pour la relation \sim_1 , il ne faut plus s'autoriser toutes les multiplications des facteurs invariants par des inversibles.

On rappelle que dans le cas d'un espace vectoriel, les classes d'équivalence de matrice étaient caractérisées par le rang. La situation est ici plus compliquée. Le rang apparaît notamment (comme le nombre de facteurs invariants), mais il ne suffit pas pour classifier ; en particulier, une matrice carrée de rang maximal peut ne pas être inversible : il suffit qu'un de ses facteurs invariants ne soit pas inversible.

Algorithme

Il ne suffit pas d'effectuer d'abord un échelonnement en lignes puis un échelonnement en colonnes. On peut procéder comme suit ; on va utiliser le stathme sur l'anneau \mathcal{A}  :

  • On se ramène d'abord (si c'est possible! c'est-à-dire si A est non nulle) au cas où le coefficient en position (1,1) est non nul, et ce par permutations sur les lignes et les colonnes.
  • On multiplie à gauche par des matrices de transvection (non généralisées), de façon à remplacer chaque coefficient a1,j, j\geq 2 par son reste par la division euclidienne par a1,1.
  • On multiplie à droite par des matrices de transvection (non généralisées), de façon à remplacer chaque coefficient ai,1 par son reste par la division euclidienne par a1,1.
  • Si jamais il y a un (et s'il y en a plusieurs, il est bon de choisir celui de stathme minimal, pour améliorer la vitesse de l'algorithme) coefficient non nul sur la première ligne ou la première colonne ailleurs qu'en position (1,1), il est de stathme inférieur à celui du coefficient en position (1,1), d'après les deux étapes précédentes. On effectue une (anti)-transposition sur les lignes ou sur les colonnes suivant le cas pour le mettre en position (1,1).

On itère ces trois dernières étapes. A chaque passage, le stathme du coefficient a1,1 diminue ; et le seul cas de stagnation est celui où tous les restes obtenus sont nuls : c'est-à-dire qu'on obtient une matrice dont la première ligne et la première colonne sont nulles, excepté le coefficient (1,1). Puisque notre stathme est à valeurs dans les entiers naturels, on finit par tomber sur ce cas.

On a donc écrit T_1AU_1=\begin{pmatrix}a_{1,1}&0\\0&A_1\\ \end{pmatrix}  ; par récurrence sur les dimensions des matrices considérées, on obtient l'écriture souhaitée. Il reste à voir qu'on peut avoir la relation de divisibilité annoncée. Il suffit pour cela de faire la constatation suivante. A partir de la matrice \begin{pmatrix}p_1&0\\0&p_2\\ \end{pmatrix} , on fait les opérations :

  • Muliplier à droite par la matrice de transvection \begin{pmatrix}1&0\\1&1\\ \end{pmatrix} on obtient \begin{pmatrix}p_1&0\\p_2&p_2\\ \end{pmatrix}
  • Multiplier à gauche par la matrice de transvection généralisée \begin{pmatrix}\alpha&\beta\\-\frac{p_2}{p}&\frac{p_1}{p}\\ \end{pmatrix} , où p1α + p2β = p = pgcd(p1,p2) pour obtenir : \begin{pmatrix}p&\beta p_2\\0&\frac{p_1p_2}{p}\\ \end{pmatrix} .
  • Multiplier à droite par la matrice de transvection \begin{pmatrix}1&-\beta\frac{p_2}{p}\\0&1\\ \end{pmatrix}( \beta\frac{p_2}{p}\in\mathcal{A} car p\mid p_2 ), et on obtient :

\begin{pmatrix}p&0\\0&\frac{p_1p_2}{p}\\ \end{pmatrix} , et p\mid\frac{p_1p_2}{p} .

Ainsi, par multiplication à droite et à gauche par des transvections généralisées, on peut remplacer une matrice diagonale par une matrice diagonale avec relations de divisibilité. Dans le cas général de notre matrice doublement échelonnée, on se ramène successivement à p_1\mid p_2 , puis p_1\mid p_3 , en conservant la relation précédente, jusqu'à avoir p_1\mid p_i pour tout i ; puis on s'occupe de p2, etc.

\mathcal{A} -modules de type fini

Soit \mathcal{A} un anneau euclidien, et M un \mathcal{A} -module de type fini ; alors, il existe un unique ensemble \left\{(r,t),d_1,\dots,d_t\right\} tel que r\in\mathbb{N} soit le rang de la partie libre du module M, t soit le cardinal d'un système minimal de générateurs de la partie de torsion, et d_1\mid d_2\mid\dots\mid d_t soient des éléments de \mathcal{A} définis à inversibles près, et tel que :

M\simeq \mathcal{A}^r\oplus\mathcal{A}/d_1\mathcal{A}\oplus\dots\oplus\mathcal{A}/d_t\mathcal{A}

Ce théorème s'applique en particulier aux \mathbb{Z} -modules de type fini, c'est-à-dire aux groupes abéliens de type fini. On dispose d'une part d'un théorème de classification, et d'autre part d'un algorithme pour calculer la classe d'un groupe dont on connaît un système de générateurs ainsi qu'une famille de relations entre ces générateurs, qui engendre l'ensemble des relations.

Page générée en 0.214 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique
Version anglaise | Version allemande | Version espagnole | Version portugaise