En algèbre linéaire, le théorème de Cayley-Hamilton (qui porte les noms des mathématiciens Arthur Cayley et William Hamilton) affirme que tout endomorphisme d'un espace vectoriel de dimension finie sur un corps quelconque annule son propre polynôme caractéristique.
En termes de matrice, cela signifie que :
si A est une matrice carrée d'ordre n et si
est son polynôme caractéristique (polynôme d'indéterminée X), alors en remplaçant formellement X par la matrice A dans le polynôme, le résultat est la matrice nulle :
Le théorème de Cayley-Hamilton s'applique aussi à des matrices carrées à coefficients dans un anneau commutatif quelconque.
Un corollaire important du théorème de Cayley-Hamilton affirme que le polynôme minimal d'une matrice donnée est un diviseur de son polynôme caractéristique.
Ce théorème possède deux familles d'utilisation :
On trouve ce théorème utilisé dans les articles sur les polynômes d'endomorphisme, endomorphismes nilpotents, et plus généralement dans la théorie générale des matrices
Quelle que soit la matrice , il existe une matrice explicitement déterminée, Comp(S), la matrice complémentaire de S, qui vérifie SComp(S) = Comp(S)S = detSIn. La matrice Comp(S) est la transposée de la comatrice ou matrice des cofacteurs de S. Cette relation reste encore vraie si les coefficients de S appartiennent à un anneau, puisqu'on n'a pas fait de divisions. On peut donc poser S = XIn − A, dont les coefficients sont dans et on a alors la relation:
Partons de (1), en écrivant
avec , et
On peut développer le produit (XIn − A)Comp(XIn − A) :
qui est identique à
Les polynomes (2) et (3) sont égaux. Par conséquent,
Il vient alors un télescopage :
La preuve ne consiste pas en une substitution de X par A dans des égalités de polynômes, mais à une identification de leurs coefficients.
On peut également aligner des idées abstraites.
Commençons par introduire un morphisme d'évaluation approprié à la résolution du problème. Tout d'abord, étant une algèbre commutative sur , on a un morphisme d'évaluation : (qui envoie X sur A et λ sur λIn pour tout scalaire λ). Ce morphisme d'anneaux commutatifs induit un morphisme d'évaluation sur les anneaux de matrices .
Une notation auxiliaire nous sera utile : pour deux matrices carrées (n,n) notées C = (cij) et D = (dij), on notera la matrice à coefficients matriciels de terme général cijD. Si le lecteur connaît le produit de Kronecker de deux matrices, il pourra remarquer que c'est presque la même chose que à ceci près que est une matrice (n,n) dont les coefficients sont des matrices (n,n) tandis que est une matrice (n2,n2). Les formules ci-dessous ne contiennent de fait que deux cas particuliers de cette opération : des produits de la forme c'est-à-dire des matrices carrées avec des C sur la diagonale et des 0 ailleurs et un produit c'est-à-dire une variante de A où la matrice aijIn vient remplacer le coefficient aij.
Cette notation posée, appliquons le morphisme d'évaluation à la relation :
On obtient une relation
dans laquelle M est une certaine matrice à coefficients dans dont on n'aura besoin de rien savoir.
Ainsi on a écrit une formule juste, et on en pâtit : on n'a du coup pas fini, l'évaluation de XIn − A par une technique rigoureuse ne fournit pas 0 mais une bizarre matrice à coefficients matriciels.
Il faut une deuxième idée pour conclure. Elle consiste à remarquer que si est un anneau et E un -module à droite, pour tous entiers r, s, t on peut définir par les formules habituelles un produit matriciel :
pour laquelle on a associativité si on veut calculer des produits à trois termes :
Appliquons cette notion à (pour les puristes à ) qui est un module (dont la multiplication s'écrit spontanément à gauche mais peut l'être à droite si on préfère, l'anneau étant commutatif) sur l'anneau commutatif , la multiplication externe étant l'application : définie par (ce étant le produit matriciel ordinaire de la matrice carrée par la matrice colonne ).
Multiplions à gauche la relation ( * ) par le vecteur ligne où désigne la base canonique de : en utilisant l'expression de droite dans ( * ) on obtient le vecteur ligne .
Si maintenant on utilise l'expression de gauche dans ( * ) et qu'on déplace les parenthèses par associativité de la multiplication matricielle un peu inhabituelle décrite ci avant, on est amené à calculer le produit :
Pour chaque indice j, on ne peut que constater que sa j-ème composante vaut :
En multipliant ceci à droite par l'inoffensive matrice M et en comparant les deux expressions du produit, on conclut que pour tout indice j, p(A)ej = 0.
Et donc p(A) = 0.
La preuve qui a été donnée évite la substitution de X par une matrice dans un contexte non commutatif, mais les manipulations effectuées sont quand même proches de cette idée : on a bien décomposé l'équation en composantes suivant les puissances de X, on a multiplié à gauche par Aj la composante qui était en facteur de Xj, et on a additionné tout ensemble. En fait, on a utilisé l'opération EvA définie en (5), sans supposer qu'il s'agisse d'un homomorphisme d'anneaux, de dans . L'opération EvA est une évaluation à gauche, parce que la multiplication par l'indéterminée scalaire X est remplacée par la multiplication à gauche par A.
Une autre observation est importante : la forme exacte du polynôme Comp(XIn − A) n'a aucune importance. Il y a donc quelque chose à exploiter ici, ce que n'ont pas manqué de faire les mathématiciens.
Soit M un anneau non commutatif ; on peut définir une division euclidienne d'un polynôme par un polynôme B monique. C'est un polynôme dont le coefficient du terme de plus haut degré est une unité de M, c'est-à-dire un élément de M qui possède un inverse dans M. Plus précisément, il existe deux polynômes , avec R de degré strictement inférieur au degré de B, tels que
La démonstration est entièrement analogue à celle du cas scalaire. Si B = XIn − A, alors le reste R est de degré 0, et donc identique à une constante appartenant à M. Mais dans ce cas, en raisonnant exactement comme dans la démonstration du théorème de Cayley-Hamilton, on arrive à la conclusion
Il s'ensuit que EvA(P) est nul si et seulement si P est divisible à gauche par XIn − A.
La démonstration du théorème de Cayley-Hamilton donne aussi une autre information : le polynôme Comp(XIn − A) est le quotient à gauche de p(X)In par tIn − A. Comme p(X)In et XIn − A appartiennent tous deux au sous-anneau commutatif K[A][X], la division à gauche se passe entièrement dans ce sous-anneau, c'est donc une division ordinaire. En particulier, les coefficients matriciels de Comp(XIn − A) sont des combinaisons linéaires de puissances de A. En d'autres termes, la matrice complémentaire d'une matrice A est un polynôme en A, ce qu'il n'est pas facile de déduire directement de la définition d'une matrice complémentaire. Mieux, on peut calculer explicitement ses coefficients à partir de ceux du polynôme caractéristique p(X), puisqu'il s'agit de faire une division euclidienne ordinaire, et on trouve
On aurait pu également obtenir cette relation directement à partir du théorème de Cayley-Hamilton, en vertu de l'identité