Matrices A^TA=AA^T Et Leurs Vecteurs Propres Orthogonaux

by fritz-hansen 57 views

Salut tout le monde ! Aujourd'hui, on plonge dans le monde fascinant de l'algèbre linéaire pour décortiquer une propriété super intéressante des matrices : quand est-ce qu'une matrice AA telle que ATA=AATA^TA = AA^T possède des vecteurs propres orthogonaux ? C'est un sujet qui peut sembler un peu costaud au début, mais avec quelques explications claires et un peu de patience, vous allez voir, c'est super logique et même assez élégant. On va explorer ça en détail, répondre à vos questions et même voir si la réciproque est vraie. Préparez vos neurones, c'est parti !

Comprendre la condition ATA=AATA^TA = AA^T : Les matrices normales

Avant de se lancer dans la preuve, il est crucial de comprendre ce que signifie la condition ATA=AATA^TA = AA^T. Les matrices qui satisfont cette égalité sont appelées des matrices normales. Le terme "normal" peut parfois prêter à confusion, car il ne signifie pas que la matrice est "ordinaire" ou "simple" dans le sens courant du terme. Au contraire, cela désigne une propriété mathématique très spécifique qui a des conséquences importantes, notamment concernant la diagonalisation et la nature de leurs vecteurs propres. Pour une matrice AA (réelle ou complexe), l'égalité ATA=AATA^TA = AA^T (ou son équivalent pour les complexes, A∗A=AA∗A^*A = AA^*, où A∗A^* est la transposée conjuguée de AA) la classe dans la famille des matrices normales. C'est cette propriété qui va nous permettre de démontrer l'existence de vecteurs propres orthogonaux. On peut voir ça comme un sceau d'approbation mathématique qui garantit certaines belles propriétés. Imaginez que vous ayez un objet, et vous savez qu'il a une forme spécifique, comme un carré. Le fait qu'il soit un carré vous dit immédiatement plein de choses : tous ses côtés sont égaux, tous ses angles sont droits, etc. De la même manière, le fait qu'une matrice soit normale (donc ATA=AATA^TA = AA^T) nous dit qu'elle a des propriétés spéciales liées à ses vecteurs propres et valeurs propres, notamment cette fameuse orthogonalité.

L'importance de la condition ATA=AATA^TA = AA^T réside dans le fait qu'elle garantit que la matrice AA est normalement diagonalisable. Cela signifie qu'il existe une base orthonormale de vecteurs propres pour AA. Or, pour les matrices normales, on peut montrer que cette base peut être choisie de manière orthogonale. Si on considère la forme quadratique associée à AA, sa matrice ATAA^TA est symétrique. L'égalité ATA=AATA^TA = AA^T nous dit que la matrice AA "commute" avec sa transposée, ce qui est une propriété forte. En algèbre linéaire, la commutativité est souvent synonyme de simplification et de comportement prévisible. Quand deux objets mathématiques commutent, cela veut dire que l'ordre dans lequel on les applique n'a pas d'importance : AB=BAAB = BA. Ici, AA et ATA^T commutent. Cette propriété est la clé pour comprendre pourquoi les vecteurs propres associés à des valeurs propres distinctes doivent être orthogonaux. Si AA est normale, elle peut être diagonalisée par une matrice unitaire (ou orthogonale si AA est réelle). C'est un résultat fondamental en algèbre linéaire qui découle directement de la définition de matrice normale. On va donc s'appuyer sur ce théorème pour prouver notre résultat.

La preuve : Pourquoi ATA=AATA^TA = AA^T implique des vecteurs propres orthogonaux

Alors, comment on prouve ça, les gars ? On va utiliser une démonstration par cas, en distinguant si les valeurs propres sont distinctes ou non. On sait qu'une matrice normale AA est diagonalisable par une matrice unitaire (ou orthogonale si AA est réelle). Cela signifie qu'il existe une matrice UU inversible (et unitaire/orthogonale) telle que A=UDU−1A = UDU^{-1} (ou A=UDU∗A = UDU^*), où DD est une matrice diagonale contenant les valeurs propres de AA. Les colonnes de UU forment une base de vecteurs propres de AA. La question est : peut-on choisir cette base de manière orthonormale ? Pour une matrice normale, la réponse est un grand OUI.

Considérons deux vecteurs propres distincts de AA, disons v1v_1 et v2v_2, avec leurs valeurs propres correspondantes λ1\lambda_1 et λ2\lambda_2, telles que λ1≠λ2\lambda_1 \neq \lambda_2. Donc, Av1=λ1v1Av_1 = \lambda_1 v_1 et Av2=λ2v2Av_2 = \lambda_2 v_2. Notre objectif est de montrer que v1v_1 et v2v_2 sont orthogonaux, c'est-à-dire que leur produit scalaire (ou produit hermitien pour les complexes) est nul : v1∗v2=0v_1^* v_2 = 0 (ou v1Tv2=0v_1^T v_2 = 0 pour les réels).

On sait que AA est normale, donc ATA=AATA^TA = AA^T. Utilisons cette propriété. On va regarder le produit scalaire (Av1)∗(Av2)(Av_1)^*(Av_2). D'une part, on a :

(Av1)∗(Av2)=(λ1v1)∗(λ2v2)=λ1∗λ2(v1∗v2)(Av_1)^*(Av_2) = (\lambda_1 v_1)^* (\lambda_2 v_2) = \lambda_1^* \lambda_2 (v_1^* v_2).

Et d'autre part, en utilisant la normalité de AA:

(Av1)∗(Av2)=v1∗A∗Av2(Av_1)^*(Av_2) = v_1^* A^* A v_2.

Maintenant, puisqu'on sait que A∗A=AA∗A^*A = AA^*, on peut écrire :

v1∗A∗Av2=v1∗AA∗v2v_1^* A^* A v_2 = v_1^* A A^* v_2.

Comme Av2=λ2v2Av_2 = \lambda_2 v_2, alors A∗v2A^*v_2 n'est pas forcément facile à relier directement à λ2v2\lambda_2 v_2. Mais on peut utiliser une autre astuce. Pour une matrice normale AA, on sait que le sous-espace propre associé à une valeur propre λ\lambda est stable par A∗A^*. Plus fort encore, si AA est normale, alors A−λIA - \lambda I est aussi normale. Et si une matrice BB est normale et Bv=0Bv=0, alors B∗v=0B^*v=0. Cela implique que si Av=λvAv = \lambda v, alors A∗v=λ∗vA^*v = \lambda^* v. Donc, on peut réécrire :

v1∗A∗Av2=v1∗A∗(Av2)=v1∗(A∗(λ2v2))=v1∗(λ2∗A∗v2)v_1^* A^* A v_2 = v_1^* A^* (Av_2) = v_1^* (A^* (\lambda_2 v_2)) = v_1^* (\lambda_2^* A^* v_2).

Et comme A∗v2=λ2∗v2A^*v_2 = \lambda_2^* v_2 (car AA est normale), on obtient :

v1∗(λ2∗A∗v2)=v1∗(λ2∗λ2∗v2)=∣λ2∣2(v1∗v2)v_1^* (\lambda_2^* A^* v_2) = v_1^* (\lambda_2^* \lambda_2^* v_2) = |\lambda_2|^2 (v_1^* v_2).

Maintenant, on a deux expressions pour (Av1)∗(Av2)(Av_1)^*(Av_2) :

  1. (Av1)∗(Av2)=λ1∗λ2(v1∗v2)(Av_1)^*(Av_2) = \lambda_1^* \lambda_2 (v_1^* v_2)
  2. (Av1)∗(Av2)=∣λ2∣2(v1∗v2)(Av_1)^*(Av_2) = |\lambda_2|^2 (v_1^* v_2)

Donc, λ1∗λ2(v1∗v2)=∣λ2∣2(v1∗v2)\lambda_1^* \lambda_2 (v_1^* v_2) = |\lambda_2|^2 (v_1^* v_2).

Réorganisons l'équation : (λ1∗λ2−∣λ2∣2)(v1∗v2)=0(\lambda_1^* \lambda_2 - |\lambda_2|^2) (v_1^* v_2) = 0.

Maintenant, si AA est une matrice réelle et normale, alors AT=A∗A^T = A^*. Les valeurs propres peuvent être complexes, mais si AA est réelle, ses valeurs propres complexes viennent par paires conjuguées. Cependant, pour une matrice normale, il existe une base orthonormale de vecteurs propres. Si les valeurs propres λ1\lambda_1 et λ2\lambda_2 sont distinctes, alors on a v1∗v2=0v_1^* v_2 = 0. Pour une matrice réelle, les valeurs propres peuvent être réelles ou complexes. Si elles sont réelles, alors λ1∗=λ1\lambda_1^* = \lambda_1 et λ2∗=λ2\lambda_2^* = \lambda_2. L'équation devient (λ1λ2−λ22)(v1∗v2)=0(\lambda_1 \lambda_2 - \lambda_2^2) (v_1^* v_2) = 0, soit λ2(λ1−λ2)(v1∗v2)=0\lambda_2 (\lambda_1 - \lambda_2) (v_1^* v_2) = 0. Puisque λ1≠λ2\lambda_1 \neq \lambda_2 et que λ2\lambda_2 peut être non nul, on ne peut pas conclure directement que v1∗v2=0v_1^* v_2 = 0 juste avec ça. Il faut être plus subtil.

Revenons à notre point de départ. La propriété clé des matrices normales (réelles ou complexes) est qu'elles sont diagonalisables dans une base orthonormale. Cela signifie qu'il existe une matrice unitaire UU telle que A=UDU∗A = UDU^*, où DD est diagonale. Les colonnes de UU sont des vecteurs propres de AA et forment une base orthonormale. Si v1v_1 et v2v_2 sont des vecteurs propres associés à des valeurs propres distinctes λ1\lambda_1 et λ2\lambda_2, alors ils doivent être orthogonaux. La démonstration formelle s'appuie sur le fait que pour une matrice normale AA, si Av=λvAv = \lambda v, alors A∗v=λ∗vA^*v = \lambda^* v.

Considérons (Av1)∗(Av2)(Av_1)^*(Av_2).

(Av1)∗(Av2)=(λ1v1)∗(λ2v2)=λ1ˉλ2(v1∗v2)(Av_1)^*(Av_2) = (\lambda_1 v_1)^* (\lambda_2 v_2) = \bar{\lambda_1} \lambda_2 (v_1^* v_2).

Et

(Av1)∗(Av2)=v1∗A∗Av2=v1∗AA∗v2=v1∗A(λ2∗v2)=λ2∗v1∗Av2=λ2∗v1∗(λ1v1)=λ1λ2∗(v1∗v1)(Av_1)^*(Av_2) = v_1^* A^* Av_2 = v_1^* AA^* v_2 = v_1^* A (\lambda_2^* v_2) = \lambda_2^* v_1^* A v_2 = \lambda_2^* v_1^* (\lambda_1 v_1) = \lambda_1 \lambda_2^* (v_1^* v_1).

Attention, il y a eu une petite confusion dans ma manipulation précédente. Reprenons plus rigoureusement :

On a Av1=λ1v1Av_1 = \lambda_1 v_1 et Av2=λ2v2Av_2 = \lambda_2 v_2.

Considérons le produit scalaire (Av1,Av2)=(Av1)∗(Av2)(Av_1, Av_2) = (Av_1)^*(Av_2).

Par définition des valeurs propres : (Av1)∗(Av2)=(λ1v1)∗(λ2v2)=λ1ˉλ2(v1∗v2)(Av_1)^*(Av_2) = (\lambda_1 v_1)^* (\lambda_2 v_2) = \bar{\lambda_1} \lambda_2 (v_1^* v_2).

Maintenant, utilisons la normalité A∗A=AA∗A^*A = AA^*.

(Av1)∗(Av2)=v1∗A∗Av2=v1∗AA∗v2(Av_1)^*(Av_2) = v_1^* A^* Av_2 = v_1^* AA^* v_2.

Ici, il faut faire attention. On sait que pour une matrice normale AA, si Av=λvAv = \lambda v, alors A^*v = ar{\lambda} v. Donc, A^*v_2 = ar{\lambda_2} v_2 et A^*v_1 = ar{\lambda_1} v_1.

Repartons de v1∗A∗Av2v_1^* A^* Av_2:

v1∗A∗(Av2)=v1∗A∗(λ2v2)=λ2(v1∗A∗v2)v_1^* A^* (Av_2) = v_1^* A^* (\lambda_2 v_2) = \lambda_2 (v_1^* A^* v_2).

Maintenant, A∗v2A^* v_2 n'est pas forcément λ2ˉv2\bar{\lambda_2} v_2 directement dans ce membre de calcul. Essayons différemment. Considérons (Av1−uv1)∗(Av1−uv1)(Av_1 - u v_1)^*(Av_1 - u v_1) pour une valeur propre ν\nu. Non, ce n'est pas la bonne voie.

Le théorème clé est : Une matrice AA est normale si et seulement si elle est unitairement diagonalisable. Unitairement diagonalisable signifie qu'il existe une matrice unitaire UU telle que A=UDU−1A = UDU^{-1} où DD est diagonale. Les colonnes de UU sont les vecteurs propres de AA et forment une base orthonormale. L'orthogonalité est donc directement garantie par la normalité de AA ! Si AA est normale, ses vecteurs propres forment une base orthonormale.

Ce qu'il faut comprendre, c'est que la propriété ATA=AATA^TA = AA^T assure que AA est normalement diagonalisable. Cela signifie qu'il existe une base orthonormale constituée de vecteurs propres de AA. Pour les valeurs propres distinctes, l'orthogonalité est prouvée comme suit :

Soient v1v_1 et v2v_2 des vecteurs propres de AA avec valeurs propres distinctes λ1\lambda_1 et λ2\lambda_2.

(Av_1, Av_2) = (Av_1)^*(Av_2) = ar{\lambda_1} \lambda_2 (v_1^* v_2).

(Av1,Av2)=(v1,A∗Av2)(Av_1, Av_2) = (v_1, A^*Av_2). Par normalité, A∗A=AA∗A^*A = AA^*. Donc (v_1, AA^*v_2) = (v_1, A(ar{\lambda_2}v_2)).

Ici, il faut utiliser le fait que (u,Bv)=(B∗u,v)(u, Bv) = (B^*u, v).

(Av1,Av2)=(v1,A∗Av2)=(v1,AA∗v2)(Av_1, Av_2) = (v_1, A^*Av_2) = (v_1, AA^*v_2).

Une autre approche : AA est normale ssi AA et A∗A^* commutent. A∗A=AA∗A^*A = AA^*.

Soit vv un vecteur propre de AA avec valeur propre λ\lambda. On a Av=λvAv = \lambda v. Alors A∗vA^*v est aussi un vecteur propre pour AA avec la valeur propre λˉ\bar{\lambda}. A∗(Av)=A∗(λv)=λA∗vA^*(Av) = A^*(\lambda v) = \lambda A^*v. Et (A∗A)v=A∗(Av)=A∗(λv)=λA∗v(A^*A)v = A^*(Av) = A^*(\lambda v) = \lambda A^*v. Aussi (AA∗)v=A(A∗v)(AA^*)v = A(A^*v). Si A∗vA^*v est un vecteur propre de AA avec une valeur propre μ\mu, alors A∗v=μvA^*v = \mu v. Donc (AA∗)v=A(μv)=μAv=μλv(AA^*)v = A(\mu v) = \mu Av = \mu \lambda v. Et (A∗A)v=A∗(λv)=λA∗v=λμv(A^*A)v = A^*(\lambda v) = \lambda A^*v = \lambda \mu v. Pour que A∗A=AA∗A^*A=AA^*, il faut que λμ=μλ\lambda \mu = \mu \lambda. C'est toujours vrai.

La démonstration classique est la suivante :

Soient v1,v2v_1, v_2 des vecteurs propres de AA avec valeurs propres λ1,λ2\lambda_1, \lambda_2 distinctes (λ1≠λ2\lambda_1 \neq \lambda_2).

On veut montrer v1∗v2=0v_1^* v_2 = 0.

(Av1)∗(Av2)=(λ1v1)∗(λ2v2)=λ1ˉλ2(v1∗v2)(Av_1)^*(Av_2) = (\lambda_1 v_1)^* (\lambda_2 v_2) = \bar{\lambda_1} \lambda_2 (v_1^* v_2).

Utilisons la normalité de AA. On sait que pour une matrice normale, ∣∣Ax∣∣=∣∣A∗x∣∣||Ax|| = ||A^*x|| pour tout vecteur xx.

Plus utile : pour une matrice normale AA, si Ax=λxAx = \lambda x, alors A^*x = ar{\lambda} x.

Donc, (Av1)∗(Av2)=v1∗A∗Av2=v1∗AA∗v2(Av_1)^*(Av_2) = v_1^* A^* A v_2 = v_1^* A A^* v_2.

Ce n'est pas la meilleure voie.

La bonne approche est de considérer le produit scalaire de v2v_2 avec Av1Av_1 et le produit scalaire de v1v_1 avec Av2Av_2 (en utilisant la conjugaison pour le premier).

  1. (Av1)∗v2=(λ1v1)∗v2=λ1ˉ(v1∗v2)(Av_1)^* v_2 = (\lambda_1 v_1)^* v_2 = \bar{\lambda_1} (v_1^* v_2).
  2. v1∗(Av2)=v1∗(λ2v2)=λ2(v1∗v2)v_1^* (Av_2) = v_1^* (\lambda_2 v_2) = \lambda_2 (v_1^* v_2).

Maintenant, utilisez la propriété de la transposée conjuguée : (u,Av)=(A∗u,v)(u, Av) = (A^*u, v).

Donc, (Av1)∗v2=(v1,Av2)(Av_1)^* v_2 = (v_1, Av_2).

(Av1)∗v2=v1∗(Av2)(Av_1)^* v_2 = v_1^* (Av_2).

En substituant les expressions :

λ1ˉ(v1∗v2)=λ2(v1∗v2)\bar{\lambda_1} (v_1^* v_2) = \lambda_2 (v_1^* v_2).

(λ1ˉ−λ2)(v1∗v2)=0(\bar{\lambda_1} - \lambda_2) (v_1^* v_2) = 0.

Si AA est une matrice réelle et normale, ses valeurs propres peuvent être complexes. Cependant, si λ1\lambda_1 et λ2\lambda_2 sont des valeurs propres distinctes, alors (λ1ˉ−λ2)(\bar{\lambda_1} - \lambda_2) est non nul. (Si λ1\lambda_1 est réelle, λ1ˉ=λ1\bar{\lambda_1} = \lambda_1, donc λ1−λ2≠0\lambda_1 - \lambda_2 \neq 0. Si λ1\lambda_1 est complexe, λ1=a+bi\lambda_1 = a+bi avec b≠0b \neq 0. Alors λ1ˉ=a−bi\bar{\lambda_1} = a-bi. Si λ2\lambda_2 est aussi complexe, λ2=c+di\lambda_2 = c+di. Si λ1≠λ2\lambda_1 \neq \lambda_2, alors soit a≠ca \neq c ou b≠db \neq d. Pour que λ1ˉ=λ2\bar{\lambda_1} = \lambda_2, il faudrait a=ca = c et −b=d-b = d. Si b≠0b \neq 0, alors d≠0d \neq 0 et d=−bd = -b. Dans ce cas, λ1\lambda_1 et λ2\lambda_2 seraient conjuguées. Mais ici on a λ1ˉ=λ2\bar{\lambda_1} = \lambda_2. Donc, si λ1\lambda_1 est complexe, λ2\lambda_2 doit être son conjugué. Si λ2\lambda_2 est aussi une valeur propre, et λ1≠λ2\lambda_1 \neq \lambda_2, alors (λ1ˉ−λ2)(\bar{\lambda_1} - \lambda_2) est non nul).

Dans tous les cas où λ1≠λ2\lambda_1 \neq \lambda_2, le terme (λ1ˉ−λ2)(\bar{\lambda_1} - \lambda_2) est différent de zéro. Par conséquent, pour que l'égalité (λ1ˉ−λ2)(v1∗v2)=0(\bar{\lambda_1} - \lambda_2) (v_1^* v_2) = 0 soit vraie, il faut nécessairement que v1∗v2=0v_1^* v_2 = 0. Ceci prouve que les vecteurs propres associés à des valeurs propres distinctes sont orthogonaux.

Maintenant, que se passe-t-il si les valeurs propres ne sont pas distinctes ? Pour une matrice normale, même si les valeurs propres sont répétées, les sous-espaces propres associés sont orthogonaux. Et on peut toujours trouver une base orthonormale de vecteurs propres. C'est la force du théorème de décomposition spectrale pour les matrices normales : toute matrice normale est unitairement (ou orthogonalement pour les matrices réelles) diagonalisable. Cela garantit l'existence d'une base orthonormale de vecteurs propres. Donc, oui, ATA=AATA^TA = AA^T implique que AA a des vecteurs propres orthogonaux, formant une base complète.

La réciproque : Est-ce que des vecteurs propres orthogonaux impliquent ATA=AATA^TA = AA^T ?

Maintenant, la question cruciale : si une matrice AA a des vecteurs propres orthogonaux, est-ce que cela signifie forcément que ATA=AATA^TA = AA^T (c'est-à-dire que AA est normale) ? La réponse, mes amis, est non, pas nécessairement.

Prenons un exemple concret pour illustrer cela. Considérons la matrice suivante :

A=(1101)A = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}

Cette matrice a une valeur propre λ=1\lambda = 1 avec une multiplicité algébrique de 2. Le sous-espace propre associé est engendré par le vecteur (1,0)T(1, 0)^T. On ne peut pas trouver deux vecteurs propres linéairement indépendants pour cette matrice, et encore moins une base orthonormale de vecteurs propres. Donc, cette matrice n'a pas de vecteurs propres orthogonaux formant une base complète.

Essayons un autre exemple pour voir si on peut trouver une matrice non normale avec des vecteurs propres orthogonaux. En fait, le théorème dit que si une matrice est diagonalisable, alors on peut trouver une base de vecteurs propres. La question est la normalité.

Considérons une matrice AA qui est symétrique (ou hermitienne pour les matrices complexes). On sait que toutes les matrices symétriques réelles ont des vecteurs propres orthogonaux (elles sont normales, car AT=AA^T=A, donc ATA=A2A^TA = A^2 et AAT=A2AA^T = A^2). La réciproque est donc vraie pour les matrices symétriques.

Le contre-exemple vient de matrices qui sont diagonalisables mais pas normalisables.

Prenons une matrice AA qui admet une base orthonormale de vecteurs propres. Cela signifie que AA est unitairement diagonalisable : A=UDU∗A = UDU^*, où UU est unitaire et DD est diagonale. Les colonnes de UU sont les vecteurs propres de AA et elles sont orthonormées. Si A=UDU∗A = UDU^*, alors A∗=(UDU∗)∗=(U∗)∗D∗U∗=UD∗U∗A^* = (UDU^*)^* = (U^*)^* D^* U^* = U D^* U^*.

Calculons ATAA^TA et AATAA^T :

ATA=(UDU∗)∗(UDU∗)=(UD∗U∗)(UDU∗)=UD∗(U∗U)DU∗=UD∗IDU∗=UD∗DU∗A^TA = (UDU^*)^*(UDU^*) = (U D^* U^*) (U D U^*) = U D^* (U^* U) D U^* = U D^* I D U^* = U D^* D U^*.

AAT=(UDU∗)(UDU∗)∗=(UDU∗)(UD∗U∗)=UD(U∗U)D∗U∗=UDID∗U∗=UDD∗U∗AA^T = (UDU^*) (UDU^*)^* = (UDU^*) (U D^* U^*) = U D (U^* U) D^* U^* = U D I D^* U^* = U D D^* U^*.

Pour que ATA=AATA^TA = AA^T, il faut que UD∗DU∗=UDD∗U∗U D^* D U^* = U D D^* U^*, ce qui implique D∗D=DD∗D^* D = D D^*. Comme DD est une matrice diagonale (avec les valeurs propres λi\lambda_i sur la diagonale), D=diag(λ1,...,λn)D = \text{diag}(\lambda_1, ..., \lambda_n). Alors D∗=diag(λ1ˉ,...,λnˉ)D^* = \text{diag}(\bar{\lambda_1}, ..., \bar{\lambda_n}).

D∗D=diag(λ1ˉλ1,...,λnˉλn)=diag(∣λ1∣2,...,∣λn∣2)D^* D = \text{diag}(\bar{\lambda_1}\lambda_1, ..., \bar{\lambda_n}\lambda_n) = \text{diag}(|\lambda_1|^2, ..., |\lambda_n|^2).

DD∗=diag(λ1λ1ˉ,...,λnλnˉ)=diag(∣λ1∣2,...,∣λn∣2)D D^* = \text{diag}(\lambda_1\bar{\lambda_1}, ..., \lambda_n\bar{\lambda_n}) = \text{diag}(|\lambda_1|^2, ..., |\lambda_n|^2).

Donc, D∗D=DD∗D^*D = DD^* est toujours vrai pour une matrice diagonale. Cela signifie que si une matrice AA est unitairement diagonalisable (c'est-à-dire qu'elle possède une base orthonormale de vecteurs propres), alors elle est normale : ATA=AATA^TA = AA^T. Attendez, je me suis trompé dans mon raisonnement initial !

Reprenons : Si AA est unitairement diagonalisable, alors A=UDU∗A = UDU^* avec UU unitaire et DD diagonale. Alors, ATA=UD∗DU∗A^TA = U D^* D U^* et AAT=UDD∗U∗AA^T = U D D^* U^*. J'ai fait une erreur dans le calcul de AATAA^T dans mon head. Il faut revoir le calcul de AATAA^T et ATAA^TA quand A=UDU∗A=UDU^*.

A=UDU∗A = UDU^* est correct. A∗=UD∗U∗A^* = U D^* U^*.

ATA=(UDU∗)∗(UDU∗)=(UD∗U∗)(UDU∗)=UD∗(U∗U)DU∗=UD∗DU∗A^TA = (UDU^*)^*(UDU^*) = (U D^* U^*)(UDU^*) = U D^* (U^*U) D U^* = U D^* D U^*. Ceci est correct.

AA∗=(UDU∗)(UDU∗)∗=(UDU∗)(UD∗U∗)=UD(U∗U)D∗U∗=UDD∗U∗AA^* = (UDU^*)(UDU^*)^* = (UDU^*)(U D^* U^*) = U D (U^* U) D^* U^* = U D D^* U^*. Ceci est correct.

Pour que AA soit normale, il faut que ATA=AA∗A^TA = AA^*. Dans le cas réel, ATA=AATA^TA = AA^T. Donc UD∗DU∗=UDD∗U∗U D^* D U^* = U D D^* U^*. Ceci implique D∗D=DD∗D^* D = D D^*. Pour des matrices diagonales, c'est toujours vrai : D∗D=diag(∣λi∣2)D^* D = \text{diag}(|\lambda_i|^2) et DD∗=diag(∣λi∣2)D D^* = \text{diag}(|\lambda_i|^2).

Donc, si AA est unitairement diagonalisable, alors AA est normale. C'est le théorème de décomposition spectrale.

Le théorème dit : AA est normale ssi AA est unitairement diagonalisable.

Donc, si AA a une base orthonormale de vecteurs propres, alors AA est unitairement diagonalisable, et par conséquent AA est normale (ATA=AATA^TA = AA^T).

L'affirmation initiale était : ATA=AATA^TA=AA^T implique AA a des vecteurs propres orthogonaux. C'est vrai (matrice normale => unitairement diagonalisable).

La réciproque : AA a des vecteurs propres orthogonaux implique ATA=AATA^TA=AA^T ? Oui, car