Matrices A^TA=AA^T Et Leurs Vecteurs Propres Orthogonaux

Dec 27, 2025 by fritz-hansen 57 views

Salut tout le monde ! Aujourd'hui, on plonge dans le monde fascinant de l'algèbre linéaire pour décortiquer une propriété super intéressante des matrices : quand est-ce qu'une matrice $A$ telle que $A^TA = AA^T$ possède des vecteurs propres orthogonaux ? C'est un sujet qui peut sembler un peu costaud au début, mais avec quelques explications claires et un peu de patience, vous allez voir, c'est super logique et même assez élégant. On va explorer ça en détail, répondre à vos questions et même voir si la réciproque est vraie. Préparez vos neurones, c'est parti !

Comprendre la condition $A^TA = AA^T$ : Les matrices normales

Avant de se lancer dans la preuve, il est crucial de comprendre ce que signifie la condition $A^TA = AA^T$ . Les matrices qui satisfont cette égalité sont appelées des matrices normales. Le terme "normal" peut parfois prêter à confusion, car il ne signifie pas que la matrice est "ordinaire" ou "simple" dans le sens courant du terme. Au contraire, cela désigne une propriété mathématique très spécifique qui a des conséquences importantes, notamment concernant la diagonalisation et la nature de leurs vecteurs propres. Pour une matrice $A$ (réelle ou complexe), l'égalité $A^TA = AA^T$ (ou son équivalent pour les complexes, $A^*A = AA^*$ , où $A^*$ est la transposée conjuguée de $A$ ) la classe dans la famille des matrices normales. C'est cette propriété qui va nous permettre de démontrer l'existence de vecteurs propres orthogonaux. On peut voir ça comme un sceau d'approbation mathématique qui garantit certaines belles propriétés. Imaginez que vous ayez un objet, et vous savez qu'il a une forme spécifique, comme un carré. Le fait qu'il soit un carré vous dit immédiatement plein de choses : tous ses côtés sont égaux, tous ses angles sont droits, etc. De la même manière, le fait qu'une matrice soit normale (donc $A^TA = AA^T$ ) nous dit qu'elle a des propriétés spéciales liées à ses vecteurs propres et valeurs propres, notamment cette fameuse orthogonalité.

L'importance de la condition $A^TA = AA^T$ réside dans le fait qu'elle garantit que la matrice $A$ est normalement diagonalisable. Cela signifie qu'il existe une base orthonormale de vecteurs propres pour $A$ . Or, pour les matrices normales, on peut montrer que cette base peut être choisie de manière orthogonale. Si on considère la forme quadratique associée à $A$ , sa matrice $A^TA$ est symétrique. L'égalité $A^TA = AA^T$ nous dit que la matrice $A$ "commute" avec sa transposée, ce qui est une propriété forte. En algèbre linéaire, la commutativité est souvent synonyme de simplification et de comportement prévisible. Quand deux objets mathématiques commutent, cela veut dire que l'ordre dans lequel on les applique n'a pas d'importance : $AB = BA$ . Ici, $A$ et $A^T$ commutent. Cette propriété est la clé pour comprendre pourquoi les vecteurs propres associés à des valeurs propres distinctes doivent être orthogonaux. Si $A$ est normale, elle peut être diagonalisée par une matrice unitaire (ou orthogonale si $A$ est réelle). C'est un résultat fondamental en algèbre linéaire qui découle directement de la définition de matrice normale. On va donc s'appuyer sur ce théorème pour prouver notre résultat.

La preuve : Pourquoi $A^TA = AA^T$ implique des vecteurs propres orthogonaux

Alors, comment on prouve ça, les gars ? On va utiliser une démonstration par cas, en distinguant si les valeurs propres sont distinctes ou non. On sait qu'une matrice normale $A$ est diagonalisable par une matrice unitaire (ou orthogonale si $A$ est réelle). Cela signifie qu'il existe une matrice $U$ inversible (et unitaire/orthogonale) telle que $A = UDU^{-1}$ (ou $A = UDU^*$ ), où $D$ est une matrice diagonale contenant les valeurs propres de $A$ . Les colonnes de $U$ forment une base de vecteurs propres de $A$ . La question est : peut-on choisir cette base de manière orthonormale ? Pour une matrice normale, la réponse est un grand OUI.

Considérons deux vecteurs propres distincts de $A$ , disons $v_1$ et $v_2$ , avec leurs valeurs propres correspondantes $\lambda_1$ et $\lambda_2$ , telles que $\lambda_1 \neq \lambda_2$ . Donc, $Av_1 = \lambda_1 v_1$ et $Av_2 = \lambda_2 v_2$ . Notre objectif est de montrer que $v_1$ et $v_2$ sont orthogonaux, c'est-à-dire que leur produit scalaire (ou produit hermitien pour les complexes) est nul : $v_1^* v_2 = 0$ (ou $v_1^T v_2 = 0$ pour les réels).

On sait que $A$ est normale, donc $A^TA = AA^T$ . Utilisons cette propriété. On va regarder le produit scalaire $(Av_1)^*(Av_2)$ . D'une part, on a :

$(Av_1)^*(Av_2) = (\lambda_1 v_1)^* (\lambda_2 v_2) = \lambda_1^* \lambda_2 (v_1^* v_2)$ .

Et d'autre part, en utilisant la normalité de $A$ :

$(Av_1)^*(Av_2) = v_1^* A^* A v_2$ .

Maintenant, puisqu'on sait que $A^*A = AA^*$ , on peut écrire :

$v_1^* A^* A v_2 = v_1^* A A^* v_2$ .

Comme $Av_2 = \lambda_2 v_2$ , alors $A^*v_2$ n'est pas forcément facile à relier directement à $\lambda_2 v_2$ . Mais on peut utiliser une autre astuce. Pour une matrice normale $A$ , on sait que le sous-espace propre associé à une valeur propre $\lambda$ est stable par $A^*$ . Plus fort encore, si $A$ est normale, alors $A - \lambda I$ est aussi normale. Et si une matrice $B$ est normale et $Bv=0$ , alors $B^*v=0$ . Cela implique que si $Av = \lambda v$ , alors $A^*v = \lambda^* v$ . Donc, on peut réécrire :

$v_1^* A^* A v_2 = v_1^* A^* (Av_2) = v_1^* (A^* (\lambda_2 v_2)) = v_1^* (\lambda_2^* A^* v_2)$ .

Et comme $A^*v_2 = \lambda_2^* v_2$ (car $A$ est normale), on obtient :

$v_1^* (\lambda_2^* A^* v_2) = v_1^* (\lambda_2^* \lambda_2^* v_2) = |\lambda_2|^2 (v_1^* v_2)$ .

Maintenant, on a deux expressions pour $(Av_1)^*(Av_2)$ :

$(Av_1)^*(Av_2) = \lambda_1^* \lambda_2 (v_1^* v_2)$
$(Av_1)^*(Av_2) = |\lambda_2|^2 (v_1^* v_2)$

Donc, $\lambda_1^* \lambda_2 (v_1^* v_2) = |\lambda_2|^2 (v_1^* v_2)$ .

Réorganisons l'équation : $(\lambda_1^* \lambda_2 - |\lambda_2|^2) (v_1^* v_2) = 0$ .

Maintenant, si $A$ est une matrice réelle et normale, alors $A^T = A^*$ . Les valeurs propres peuvent être complexes, mais si $A$ est réelle, ses valeurs propres complexes viennent par paires conjuguées. Cependant, pour une matrice normale, il existe une base orthonormale de vecteurs propres. Si les valeurs propres $\lambda_1$ et $\lambda_2$ sont distinctes, alors on a $v_1^* v_2 = 0$ . Pour une matrice réelle, les valeurs propres peuvent être réelles ou complexes. Si elles sont réelles, alors $\lambda_1^* = \lambda_1$ et $\lambda_2^* = \lambda_2$ . L'équation devient $(\lambda_1 \lambda_2 - \lambda_2^2) (v_1^* v_2) = 0$ , soit $\lambda_2 (\lambda_1 - \lambda_2) (v_1^* v_2) = 0$ . Puisque $\lambda_1 \neq \lambda_2$ et que $\lambda_2$ peut être non nul, on ne peut pas conclure directement que $v_1^* v_2 = 0$ juste avec ça. Il faut être plus subtil.

Revenons à notre point de départ. La propriété clé des matrices normales (réelles ou complexes) est qu'elles sont diagonalisables dans une base orthonormale. Cela signifie qu'il existe une matrice unitaire $U$ telle que $A = UDU^*$ , où $D$ est diagonale. Les colonnes de $U$ sont des vecteurs propres de $A$ et forment une base orthonormale. Si $v_1$ et $v_2$ sont des vecteurs propres associés à des valeurs propres distinctes $\lambda_1$ et $\lambda_2$ , alors ils doivent être orthogonaux. La démonstration formelle s'appuie sur le fait que pour une matrice normale $A$ , si $Av = \lambda v$ , alors $A^*v = \lambda^* v$ .

Considérons $(Av_1)^*(Av_2)$ .

$(Av_1)^*(Av_2) = (\lambda_1 v_1)^* (\lambda_2 v_2) = \bar{\lambda_1} \lambda_2 (v_1^* v_2)$ .

$(Av_1)^*(Av_2) = v_1^* A^* Av_2 = v_1^* AA^* v_2 = v_1^* A (\lambda_2^* v_2) = \lambda_2^* v_1^* A v_2 = \lambda_2^* v_1^* (\lambda_1 v_1) = \lambda_1 \lambda_2^* (v_1^* v_1)$ .

Attention, il y a eu une petite confusion dans ma manipulation précédente. Reprenons plus rigoureusement :

On a $Av_1 = \lambda_1 v_1$ et $Av_2 = \lambda_2 v_2$ .

Considérons le produit scalaire $(Av_1, Av_2) = (Av_1)^*(Av_2)$ .

Par définition des valeurs propres : $(Av_1)^*(Av_2) = (\lambda_1 v_1)^* (\lambda_2 v_2) = \bar{\lambda_1} \lambda_2 (v_1^* v_2)$ .

Maintenant, utilisons la normalité $A^*A = AA^*$ .

$(Av_1)^*(Av_2) = v_1^* A^* Av_2 = v_1^* AA^* v_2$ .

Ici, il faut faire attention. On sait que pour une matrice normale $A$ , si $Av = \lambda v$ , alors $A^*v = ar{\lambda} v$ . Donc, $A^*v_2 = ar{\lambda_2} v_2$ et $A^*v_1 = ar{\lambda_1} v_1$ .

Repartons de $v_1^* A^* Av_2$ :

$v_1^* A^* (Av_2) = v_1^* A^* (\lambda_2 v_2) = \lambda_2 (v_1^* A^* v_2)$ .

Maintenant, $A^* v_2$ n'est pas forcément $\bar{\lambda_2} v_2$ directement dans ce membre de calcul. Essayons différemment. Considérons $(Av_1 - u v_1)^*(Av_1 - u v_1)$ pour une valeur propre $\nu$ . Non, ce n'est pas la bonne voie.

Le théorème clé est : Une matrice $A$ est normale si et seulement si elle est unitairement diagonalisable. Unitairement diagonalisable signifie qu'il existe une matrice unitaire $U$ telle que $A = UDU^{-1}$ où $D$ est diagonale. Les colonnes de $U$ sont les vecteurs propres de $A$ et forment une base orthonormale. L'orthogonalité est donc directement garantie par la normalité de $A$ ! Si $A$ est normale, ses vecteurs propres forment une base orthonormale.

Ce qu'il faut comprendre, c'est que la propriété $A^TA = AA^T$ assure que $A$ est normalement diagonalisable. Cela signifie qu'il existe une base orthonormale constituée de vecteurs propres de $A$ . Pour les valeurs propres distinctes, l'orthogonalité est prouvée comme suit :

Soient $v_1$ et $v_2$ des vecteurs propres de $A$ avec valeurs propres distinctes $\lambda_1$ et $\lambda_2$ .

$(Av_1, Av_2) = (Av_1)^*(Av_2) = ar{\lambda_1} \lambda_2 (v_1^* v_2)$ .

$(Av_1, Av_2) = (v_1, A^*Av_2)$ . Par normalité, $A^*A = AA^*$ . Donc $(v_1, AA^*v_2) = (v_1, A(ar{\lambda_2}v_2))$ .

Ici, il faut utiliser le fait que $(u, Bv) = (B^*u, v)$ .

$(Av_1, Av_2) = (v_1, A^*Av_2) = (v_1, AA^*v_2)$ .

Une autre approche : $A$ est normale ssi $A$ et $A^*$ commutent. $A^*A = AA^*$ .

Soit $v$ un vecteur propre de $A$ avec valeur propre $\lambda$ . On a $Av = \lambda v$ . Alors $A^*v$ est aussi un vecteur propre pour $A$ avec la valeur propre $\bar{\lambda}$ . $A^*(Av) = A^*(\lambda v) = \lambda A^*v$ . Et $(A^*A)v = A^*(Av) = A^*(\lambda v) = \lambda A^*v$ . Aussi $(AA^*)v = A(A^*v)$ . Si $A^*v$ est un vecteur propre de $A$ avec une valeur propre $\mu$ , alors $A^*v = \mu v$ . Donc $(AA^*)v = A(\mu v) = \mu Av = \mu \lambda v$ . Et $(A^*A)v = A^*(\lambda v) = \lambda A^*v = \lambda \mu v$ . Pour que $A^*A=AA^*$ , il faut que $\lambda \mu = \mu \lambda$ . C'est toujours vrai.

La démonstration classique est la suivante :

Soient $v_1, v_2$ des vecteurs propres de $A$ avec valeurs propres $\lambda_1, \lambda_2$ distinctes ( $\lambda_1 \neq \lambda_2$ ).

On veut montrer $v_1^* v_2 = 0$ .

$(Av_1)^*(Av_2) = (\lambda_1 v_1)^* (\lambda_2 v_2) = \bar{\lambda_1} \lambda_2 (v_1^* v_2)$ .

Utilisons la normalité de $A$ . On sait que pour une matrice normale, $||Ax|| = ||A^*x||$ pour tout vecteur $x$ .

Plus utile : pour une matrice normale $A$ , si $Ax = \lambda x$ , alors $A^*x = ar{\lambda} x$ .

Donc, $(Av_1)^*(Av_2) = v_1^* A^* A v_2 = v_1^* A A^* v_2$ .

Ce n'est pas la meilleure voie.

La bonne approche est de considérer le produit scalaire de $v_2$ avec $Av_1$ et le produit scalaire de $v_1$ avec $Av_2$ (en utilisant la conjugaison pour le premier).

$(Av_1)^* v_2 = (\lambda_1 v_1)^* v_2 = \bar{\lambda_1} (v_1^* v_2)$ .
$v_1^* (Av_2) = v_1^* (\lambda_2 v_2) = \lambda_2 (v_1^* v_2)$ .

Maintenant, utilisez la propriété de la transposée conjuguée : $(u, Av) = (A^*u, v)$ .

Donc, $(Av_1)^* v_2 = (v_1, Av_2)$ .

$(Av_1)^* v_2 = v_1^* (Av_2)$ .

En substituant les expressions :

$\bar{\lambda_1} (v_1^* v_2) = \lambda_2 (v_1^* v_2)$ .

$(\bar{\lambda_1} - \lambda_2) (v_1^* v_2) = 0$ .

Si $A$ est une matrice réelle et normale, ses valeurs propres peuvent être complexes. Cependant, si $\lambda_1$ et $\lambda_2$ sont des valeurs propres distinctes, alors $(\bar{\lambda_1} - \lambda_2)$ est non nul. (Si $\lambda_1$ est réelle, $\bar{\lambda_1} = \lambda_1$ , donc $\lambda_1 - \lambda_2 \neq 0$ . Si $\lambda_1$ est complexe, $\lambda_1 = a+bi$ avec $b \neq 0$ . Alors $\bar{\lambda_1} = a-bi$ . Si $\lambda_2$ est aussi complexe, $\lambda_2 = c+di$ . Si $\lambda_1 \neq \lambda_2$ , alors soit $a \neq c$ ou $b \neq d$ . Pour que $\bar{\lambda_1} = \lambda_2$ , il faudrait $a = c$ et $-b = d$ . Si $b \neq 0$ , alors $d \neq 0$ et $d = -b$ . Dans ce cas, $\lambda_1$ et $\lambda_2$ seraient conjuguées. Mais ici on a $\bar{\lambda_1} = \lambda_2$ . Donc, si $\lambda_1$ est complexe, $\lambda_2$ doit être son conjugué. Si $\lambda_2$ est aussi une valeur propre, et $\lambda_1 \neq \lambda_2$ , alors $(\bar{\lambda_1} - \lambda_2)$ est non nul).

Dans tous les cas où $\lambda_1 \neq \lambda_2$ , le terme $(\bar{\lambda_1} - \lambda_2)$ est différent de zéro. Par conséquent, pour que l'égalité $(\bar{\lambda_1} - \lambda_2) (v_1^* v_2) = 0$ soit vraie, il faut nécessairement que $v_1^* v_2 = 0$ . Ceci prouve que les vecteurs propres associés à des valeurs propres distinctes sont orthogonaux.

Maintenant, que se passe-t-il si les valeurs propres ne sont pas distinctes ? Pour une matrice normale, même si les valeurs propres sont répétées, les sous-espaces propres associés sont orthogonaux. Et on peut toujours trouver une base orthonormale de vecteurs propres. C'est la force du théorème de décomposition spectrale pour les matrices normales : toute matrice normale est unitairement (ou orthogonalement pour les matrices réelles) diagonalisable. Cela garantit l'existence d'une base orthonormale de vecteurs propres. Donc, oui, $A^TA = AA^T$ implique que $A$ a des vecteurs propres orthogonaux, formant une base complète.

La réciproque : Est-ce que des vecteurs propres orthogonaux impliquent $A^TA = AA^T$ ?

Maintenant, la question cruciale : si une matrice $A$ a des vecteurs propres orthogonaux, est-ce que cela signifie forcément que $A^TA = AA^T$ (c'est-à-dire que $A$ est normale) ? La réponse, mes amis, est non, pas nécessairement.

Prenons un exemple concret pour illustrer cela. Considérons la matrice suivante :

$A = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}$

Cette matrice a une valeur propre $\lambda = 1$ avec une multiplicité algébrique de 2. Le sous-espace propre associé est engendré par le vecteur $(1, 0)^T$ . On ne peut pas trouver deux vecteurs propres linéairement indépendants pour cette matrice, et encore moins une base orthonormale de vecteurs propres. Donc, cette matrice n'a pas de vecteurs propres orthogonaux formant une base complète.

Essayons un autre exemple pour voir si on peut trouver une matrice non normale avec des vecteurs propres orthogonaux. En fait, le théorème dit que si une matrice est diagonalisable, alors on peut trouver une base de vecteurs propres. La question est la normalité.

Considérons une matrice $A$ qui est symétrique (ou hermitienne pour les matrices complexes). On sait que toutes les matrices symétriques réelles ont des vecteurs propres orthogonaux (elles sont normales, car $A^T=A$ , donc $A^TA = A^2$ et $AA^T = A^2$ ). La réciproque est donc vraie pour les matrices symétriques.

Le contre-exemple vient de matrices qui sont diagonalisables mais pas normalisables.

Prenons une matrice $A$ qui admet une base orthonormale de vecteurs propres. Cela signifie que $A$ est unitairement diagonalisable : $A = UDU^*$ , où $U$ est unitaire et $D$ est diagonale. Les colonnes de $U$ sont les vecteurs propres de $A$ et elles sont orthonormées. Si $A = UDU^*$ , alors $A^* = (UDU^*)^* = (U^*)^* D^* U^* = U D^* U^*$ .

Calculons $A^TA$ et $AA^T$ :

$A^TA = (UDU^*)^*(UDU^*) = (U D^* U^*) (U D U^*) = U D^* (U^* U) D U^* = U D^* I D U^* = U D^* D U^*$ .

$AA^T = (UDU^*) (UDU^*)^* = (UDU^*) (U D^* U^*) = U D (U^* U) D^* U^* = U D I D^* U^* = U D D^* U^*$ .

Pour que $A^TA = AA^T$ , il faut que $U D^* D U^* = U D D^* U^*$ , ce qui implique $D^* D = D D^*$ . Comme $D$ est une matrice diagonale (avec les valeurs propres $\lambda_i$ sur la diagonale), $D = \text{diag}(\lambda_1, ..., \lambda_n)$ . Alors $D^* = \text{diag}(\bar{\lambda_1}, ..., \bar{\lambda_n})$ .

$D^* D = \text{diag}(\bar{\lambda_1}\lambda_1, ..., \bar{\lambda_n}\lambda_n) = \text{diag}(|\lambda_1|^2, ..., |\lambda_n|^2)$ .

$D D^* = \text{diag}(\lambda_1\bar{\lambda_1}, ..., \lambda_n\bar{\lambda_n}) = \text{diag}(|\lambda_1|^2, ..., |\lambda_n|^2)$ .

Donc, $D^*D = DD^*$ est toujours vrai pour une matrice diagonale. Cela signifie que si une matrice $A$ est unitairement diagonalisable (c'est-à-dire qu'elle possède une base orthonormale de vecteurs propres), alors elle est normale : $A^TA = AA^T$ . Attendez, je me suis trompé dans mon raisonnement initial !

Reprenons : Si $A$ est unitairement diagonalisable, alors $A = UDU^*$ avec $U$ unitaire et $D$ diagonale. Alors, $A^TA = U D^* D U^*$ et $AA^T = U D D^* U^*$ . J'ai fait une erreur dans le calcul de $AA^T$ dans mon head. Il faut revoir le calcul de $AA^T$ et $A^TA$ quand $A=UDU^*$ .

$A = UDU^*$ est correct. $A^* = U D^* U^*$ .

$A^TA = (UDU^*)^*(UDU^*) = (U D^* U^*)(UDU^*) = U D^* (U^*U) D U^* = U D^* D U^*$ . Ceci est correct.

$AA^* = (UDU^*)(UDU^*)^* = (UDU^*)(U D^* U^*) = U D (U^* U) D^* U^* = U D D^* U^*$ . Ceci est correct.

Pour que $A$ soit normale, il faut que $A^TA = AA^*$ . Dans le cas réel, $A^TA = AA^T$ . Donc $U D^* D U^* = U D D^* U^*$ . Ceci implique $D^* D = D D^*$ . Pour des matrices diagonales, c'est toujours vrai : $D^* D = \text{diag}(|\lambda_i|^2)$ et $D D^* = \text{diag}(|\lambda_i|^2)$ .

Donc, si $A$ est unitairement diagonalisable, alors $A$ est normale. C'est le théorème de décomposition spectrale.

Le théorème dit : $A$ est normale ssi $A$ est unitairement diagonalisable.

Donc, si $A$ a une base orthonormale de vecteurs propres, alors $A$ est unitairement diagonalisable, et par conséquent $A$ est normale ( $A^TA = AA^T$ ).

L'affirmation initiale était : $A^TA=AA^T$ implique $A$ a des vecteurs propres orthogonaux. C'est vrai (matrice normale => unitairement diagonalisable).

La réciproque : $A$ a des vecteurs propres orthogonaux implique $A^TA=AA^T$ ? Oui, car

Comprendre la condition ATA=AATA^TA = AA^TATA=AAT : Les matrices normales

La preuve : Pourquoi ATA=AATA^TA = AA^TATA=AAT implique des vecteurs propres orthogonaux

La réciproque : Est-ce que des vecteurs propres orthogonaux impliquent ATA=AATA^TA = AA^TATA=AAT ?

Comprendre la condition $A^TA = AA^T$ : Les matrices normales

La preuve : Pourquoi $A^TA = AA^T$ implique des vecteurs propres orthogonaux

La réciproque : Est-ce que des vecteurs propres orthogonaux impliquent $A^TA = AA^T$ ?