线性代数(六):相似对角化

线性代数(六):相似对角化本文章介绍矩阵相似的定义以及可相似对角化的充要条件及相关定理 相似对角化

大家好,欢迎来到IT知识分享网。

相似对角化

定义6.1:对 n n n阶方阵 A \bold{A} A, B \bold{B} B,若有可逆 n n n阶方阵 P \bold{P} P使得: P − 1 A P = B \bold{P^{-1}AP=B} P1AP=B则称 A A A B B B相似,记作 A ∼ B \bold{A\sim B} AB,而 P \bold{P} P称作相似变换矩阵。

Remark矩阵的相似关系是一种矩阵等价的关系。

定理6.1:若 A ∼ B \bold{A\sim B} AB r ( A ) = r ( B ) , ∣ A ∣ = ∣ B ∣ , 且 A 、 B 具有相同的特征值 r(A)=r(B), |A|=|B|,且A、B具有相同的特征值 r(A)=r(B),A=B,AB具有相同的特征值
证明:由矩阵相似的定义及 定理1.2可知: r ( A ) = r ( B ) r(A)=r(B) r(A)=r(B)
d e t ( P − 1 ) d e t ( A ) d e t ( P ) = d e t ( B ) ⟹ d e t ( A ) = d e t ( B ) det(P^{-1})det(A)det(P)=det(B)\Longrightarrow det(A)=det(B) det(P1)det(A)det(P)=det(B)det(A)=det(B) d e t ( A − λ E ) = d e t ( P − 1 ) d e t ( A − λ E ) d e t ( P ) = d e t ( P − 1 A P − λ E ) = d e t ( B − λ E ) det(A-\lambda E)=det(P^{-1})det(A-\lambda E)det(P)=det(P^{-1}AP-\lambda E)=det(B-\lambda E) det(AλE)=det(P1)det(AλE)det(P)=det(P1APλE)=det(BλE)故方阵 A , B A,B A,B具有相同的特征多项式(特征值)。

定理6.2:在复数域上,任何 n n n阶方阵 A A A均可相似于一个上三角矩阵。

定义6.2:若存在与方阵 A A A相似的对角矩阵,则称方阵 A A A 可相似对角化

定理6.3 n n n阶矩阵 A A A可相似对角化的 ⟺ \Longleftrightarrow 方阵 A A A存在 n n n个线性无关的特征向量,且:
P − 1 A P = d i a g ( λ 1 , λ 2 , … , λ n ) P^{-1}AP=diag(\lambda_1,\lambda_2,\dots,\lambda_n)\uad P1AP=diag(λ1,λ2,,λn)其中, P = [ X ⃗ 1 , X ⃗ 2 , … , X ⃗ n ] , { λ i , X ⃗ i } 为方阵 A 的特征对。 P=[\vec{X}_1,\vec{X}_2,\dots,\vec{X}_n],\{\lambda_i,\vec{X}_i\}为方阵A的特征对。 P=[X
1
,X
2
,,X
n
]{
λi,X
i
}为方阵A的特征对。


证明:若 n n n阶方阵 A A A可相似化,则存在可逆矩阵 P P P,使得: A P = P [ a 11 a 22 ⋱ a n n ] AP=P\begin{bmatrix}a_{11}\\&a_{22}\\&&\ddots\\&&&a_{nn}\end{bmatrix} AP=P
a11a22ann

P P P进行列分块,即 P = [ X ⃗ 1 , X ⃗ 2 , … , X ⃗ n ] P=[\vec{X}_1,\vec{X}_2,\dots,\vec{X}_n] P=[X
1
,X
2
,,X
n
]
X ⃗ i ≠ 0 \vec{X}_i\ne0 X
i
=
0
则有: [ A X ⃗ 1 , A X ⃗ 2 , … , A X ⃗ n ] = [ a 11 X ⃗ 1 , a 22 X ⃗ 2 , … , a n n X ⃗ n ] ⟹ A X ⃗ i = a i i X ⃗ i ( i = 1 , 2 , … , n ) [A\vec{X}_1,A\vec{X}_2,\dots,A\vec{X}_n]=[a_{11}\vec{X}_1,a_{22}\vec{X}_2,\dots,a_{nn}\vec{X}_n]\Longrightarrow A\vec{X}_i=a_{ii}\vec{X}_i(i=1,2,\dots,n) [AX
1
,AX
2
,,AX
n
]=
[a11X
1
,a22X
2
,,annX
n
]
AX
i
=
aiiX
i
i=
1,2,,n

显然, { a i i , X ⃗ i } \{a_{ii},\vec{X}_i\} {
aii,X
i
}
为方阵 A A A的特征对,由于 P P P为可逆矩阵,即满秩,则其 n n n个列向量线性无关。
反而言之,若 A A A存在 n n n个线性无关的特征向量,则按上述构造的可逆矩阵 P P P与对角阵满足矩阵相似的定义式。(证毕)



Remark: 显然,方阵可对角化但与方阵相似的对角矩阵与可逆矩阵P并不唯一。
(1)调整对角阵对角元素的次序可得到不同的对角阵,此时,P阵列向量的次序也需对应作出调整;
(2)对角阵保持不变,此时,P阵也不唯一,因 k X i ( k ≠ 0 ) kX_i(k\ne0) kXik=0也是特征值 λ i \lambda_i λi对应的特征向量。

推论6.1:方阵可相似对角化 ⟺ \Longleftrightarrow 方阵的 r r r重特征值有 r r r个线性无关的特征向量。

证明:由于需要n个线性无关的特征向量,且代数重数大于等于几何重数,故推论6.1成立。

定义6.3:若方阵可相似对角化且逆矩阵为正交矩阵( P − 1 = P T P^{-1}=P^{T} P1=PT)则称该方阵可正交相似对角化。
定理6.4:实对称矩阵必可正交相似对角化。
证明:采用数学归纳法:
   \ \ \uad    n = 1 n=1 n=1阶方阵显然成立。
   \ \ \uad   假设对 n − 1 n-1 n1阶方阵 A A A该定理也成立,则下面证明对 n n n阶矩阵该定理也成立:
   \ \ \uad   记方阵 A A A的一特征值为 λ \lambda λ,其对应的单位特征向量 X ⃗ \vec{X} X

   \ \ \uad   由定理2.7,在 R n R^n Rn空间中存在标准正交向量组: { X ⃗ , α ⃗ 2 , α ⃗ 3 , … , α ⃗ n } \{\vec{X},\vec{\alpha}_2,\vec{\alpha}_3,\dots,\vec{\alpha}_n\} {
X
,α
2
,α
3
,,α
n
}
   \ \ \uad   其中, { α ⃗ 2 , α ⃗ 3 , … , α ⃗ n } \{\vec{\alpha}_2,\vec{\alpha}_3,\dots,\vec{\alpha}_n\} {
α
2
,α
3
,,α
n
}
不一定为 A A A的特征向量。
   \ \ \uad   由定理2.9知有正交矩阵: P = [ X ⃗ , α ⃗ 2 , α ⃗ 3 , … , α ⃗ n ] P=[\vec{X},\vec{\alpha}_2,\vec{\alpha}_3,\dots,\vec{\alpha}_n] P=[X
,α
2
,α
3
,,α
n
]

   \ \ \uad   那么: P − 1 A P = P T A P = [ X ⃗ T α ⃗ 2 T α ⃗ 3 T ⋮ α T ⃗ n ] A [ X ⃗ , α ⃗ 2 , α ⃗ 3 , … , α ⃗ n ] = [ X ⃗ T A X ⃗ X ⃗ T A α ⃗ 2 X ⃗ T A α ⃗ 3 … X ⃗ T A α ⃗ n α ⃗ 2 T A X ⃗ α ⃗ 2 T A α ⃗ 2 T α ⃗ 2 T A α ⃗ 3 … α ⃗ 2 T A α ⃗ n α ⃗ 3 T A X ⃗ α ⃗ 3 T A α ⃗ 2 α ⃗ 3 T A α ⃗ 3 … α ⃗ 3 T A α ⃗ n ⋮ ⋮ ⋮ ⋮ α ⃗ n T A X ⃗ α ⃗ n T A α ⃗ 2 α ⃗ n T A α ⃗ 3 … α ⃗ n T A α ⃗ n ] = [ X ⃗ T ( A X ⃗ ) ( A X ⃗ ) T α ⃗ 2 ( A X ⃗ ) T A α ⃗ 3 … ( A X ⃗ ) T α ⃗ n α ⃗ 2 T ( A X ⃗ ) α ⃗ 2 T A α ⃗ 2 α ⃗ 2 T A α ⃗ 3 … α ⃗ 2 T A α ⃗ n α ⃗ 3 T ( A X ⃗ ) α ⃗ 3 T A α ⃗ 2 α ⃗ 3 T A α ⃗ 3 … α ⃗ 3 T A α ⃗ n ⋮ ⋮ ⋮ ⋮ α ⃗ n T ( A X ⃗ ) α ⃗ n T A α ⃗ 2 α ⃗ n T A α ⃗ 3 … α ⃗ n T A α ⃗ n ] P^{-1}AP=P^TAP=\begin{bmatrix}\vec{X}^T\\\vec{\alpha}_2^T\\\vec{\alpha}_3^T\\\vdots\\\vec{\alpha^T}_n\end{bmatrix}A[\vec{X},\vec{\alpha}_2,\vec{\alpha}_3,\dots,\vec{\alpha}_n] =\begin{bmatrix}\vec{X}^TA\vec{X}&\vec{X}^TA\vec{\alpha}_2&\vec{X}^TA\vec{\alpha}_3&\dots&\vec{X}^TA\vec{\alpha}_n\\ \vec{\alpha}_2^TA\vec{X}&\vec{\alpha}_2^TA\vec{\alpha}_2^T&\vec{\alpha}_2^TA\vec{\alpha}_3&\dots&\vec{\alpha}_2^TA\vec{\alpha}_n\\ \vec{\alpha}_3^TA\vec{X}&\vec{\alpha}_3^TA\vec{\alpha}_2&\vec{\alpha}_3^TA\vec{\alpha}_3&\dots&\vec{\alpha}_3^TA\vec{\alpha}_n\\ \vdots&\vdots&\vdots&&\vdots\\ \vec{\alpha}_n^TA\vec{X}&\vec{\alpha}_n^TA\vec{\alpha}_2&\vec{\alpha}_n^TA\vec{\alpha}_3&\dots&\vec{\alpha}_n^TA\vec{\alpha}_n\\\end{bmatrix} =\begin{bmatrix}\vec{X}^T(A\vec{X})&{(A\vec{X})}^T\vec{\alpha}_2&{(A\vec{X})}^TA\vec{\alpha}_3&\dots&{(A\vec{X})}^T\vec{\alpha}_n\\ \vec{\alpha}_2^T(A\vec{X})&\vec{\alpha}_2^TA\vec{\alpha}_2&\vec{\alpha}_2^TA\vec{\alpha}_3&\dots&\vec{\alpha}_2^TA\vec{\alpha}_n\\ \vec{\alpha}_3^T(A\vec{X})&\vec{\alpha}_3^TA\vec{\alpha}_2&\vec{\alpha}_3^TA\vec{\alpha}_3&\dots&\vec{\alpha}_3^TA\vec{\alpha}_n\\ \vdots&\vdots&\vdots&&\vdots\\ \vec{\alpha}_n^T(A\vec{X})&\vec{\alpha}_n^TA\vec{\alpha}_2&\vec{\alpha}_n^TA\vec{\alpha}_3&\dots&\vec{\alpha}_n^TA\vec{\alpha}_n\\\end{bmatrix} P1AP=PTAP=
X
T
α
2T
α
3T
αT
n

A[X
,α
2
,α
3
,,α
n
]=

X
T
AX
α
2T
AX
α
3T
AX
α
nT
AX
X
T
Aα
2
α
2T
Aα
2T
α
3T
Aα
2
α
nT
Aα
2
X
T
Aα
3
α
2T
Aα
3
α
3T
Aα
3
α
nT
Aα
3
X
T
Aα
n
α
2T
Aα
n
α
3T
Aα
n
α
nT
Aα
n

=

X
T
(AX
)
α
2T
(AX
)
α
3T
(AX
)
α
nT
(AX
)
(AX
)
T
α
2
α
2T
Aα
2
α
3T
Aα
2
α
nT
Aα
2
(AX
)
T
Aα
3
α
2T
Aα
3
α
3T
Aα
3
α
nT
Aα
3
(AX
)
T
α
n
α
2T
Aα
n
α
3T
Aα
n
α
nT
Aα
n


   \ \ \uad    A X ⃗ = λ X ⃗ A\vec{X}=\lambda\vec{X} AX
=
λX
并由正交性得: P − 1 A P = [ X ⃗ T ( A X ⃗ ) ( A X ⃗ ) T α ⃗ 2 ( A X ⃗ ) T A α ⃗ 3 … ( A X ⃗ ) T α ⃗ n α ⃗ 2 T ( A X ⃗ ) α ⃗ 2 T A α ⃗ 2 α ⃗ 2 T A α ⃗ 3 … α ⃗ 2 T A α ⃗ n α ⃗ 3 T ( A X ⃗ ) α ⃗ 3 T A α ⃗ 2 α ⃗ 3 T A α ⃗ 3 … α ⃗ 3 T A α ⃗ n ⋮ ⋮ ⋮ ⋮ α ⃗ n T ( A X ⃗ ) α ⃗ n T A α ⃗ 2 α ⃗ n T A α ⃗ 3 … α ⃗ n T A α ⃗ n ] = [ X ⃗ T ( λ X ⃗ ) ( λ X ⃗ ) T α ⃗ 2 ( λ X ⃗ ) T A α ⃗ 3 … ( λ X ⃗ ) T α ⃗ n α ⃗ 2 T ( λ X ⃗ ) α ⃗ 2 T A α ⃗ 2 α ⃗ 2 T A α ⃗ 3 … α ⃗ 2 T A α ⃗ n α ⃗ 3 T ( λ X ⃗ ) α ⃗ 3 T A α ⃗ 2 α ⃗ 3 T A α ⃗ 3 … α ⃗ 3 T A α ⃗ n ⋮ ⋮ ⋮ ⋮ α ⃗ n T ( λ X ⃗ ) α ⃗ n T A α ⃗ 2 α ⃗ n T A α ⃗ 3 … α ⃗ n T A α ⃗ n ] = [ λ 0 0 … 0 0 α ⃗ 2 T A α ⃗ 2 α ⃗ 2 T A α ⃗ 3 … α ⃗ 2 T A α ⃗ n 0 α ⃗ 3 T A α ⃗ 2 α ⃗ 3 T A α ⃗ 3 … α ⃗ 3 T A α ⃗ n ⋮ ⋮ ⋮ ⋮ 0 α ⃗ n T A α ⃗ 2 α ⃗ n T A α ⃗ 3 … α ⃗ n T A α ⃗ n ] = [ λ 0 0 B n − 1 ] P^{-1}AP=\begin{bmatrix}\vec{X}^T(A\vec{X})&{(A\vec{X})}^T\vec{\alpha}_2&{(A\vec{X})}^TA\vec{\alpha}_3&\dots&{(A\vec{X})}^T\vec{\alpha}_n\\ \vec{\alpha}_2^T(A\vec{X})&\vec{\alpha}_2^TA\vec{\alpha}_2&\vec{\alpha}_2^TA\vec{\alpha}_3&\dots&\vec{\alpha}_2^TA\vec{\alpha}_n\\ \vec{\alpha}_3^T(A\vec{X})&\vec{\alpha}_3^TA\vec{\alpha}_2&\vec{\alpha}_3^TA\vec{\alpha}_3&\dots&\vec{\alpha}_3^TA\vec{\alpha}_n\\ \vdots&\vdots&\vdots&&\vdots\\ \vec{\alpha}_n^T(A\vec{X})&\vec{\alpha}_n^TA\vec{\alpha}_2&\vec{\alpha}_n^TA\vec{\alpha}_3&\dots&\vec{\alpha}_n^TA\vec{\alpha}_n\\\end{bmatrix}= \begin{bmatrix}\vec{X}^T(\lambda\vec{X})&{(\lambda\vec{X})}^T\vec{\alpha}_2&{(\lambda\vec{X})}^TA\vec{\alpha}_3&\dots&{(\lambda\vec{X})}^T\vec{\alpha}_n\\ \vec{\alpha}_2^T(\lambda\vec{X})&\vec{\alpha}_2^TA\vec{\alpha}_2&\vec{\alpha}_2^TA\vec{\alpha}_3&\dots&\vec{\alpha}_2^TA\vec{\alpha}_n\\ \vec{\alpha}_3^T(\lambda\vec{X})&\vec{\alpha}_3^TA\vec{\alpha}_2&\vec{\alpha}_3^TA\vec{\alpha}_3&\dots&\vec{\alpha}_3^TA\vec{\alpha}_n\\ \vdots&\vdots&\vdots&&\vdots\\ \vec{\alpha}_n^T(\lambda\vec{X})&\vec{\alpha}_n^TA\vec{\alpha}_2&\vec{\alpha}_n^TA\vec{\alpha}_3&\dots&\vec{\alpha}_n^TA\vec{\alpha}_n\\\end{bmatrix}= \begin{bmatrix}\lambda&0&0&\dots&0\\ 0&\vec{\alpha}_2^TA\vec{\alpha}_2&\vec{\alpha}_2^TA\vec{\alpha}_3&\dots&\vec{\alpha}_2^TA\vec{\alpha}_n\\ 0&\vec{\alpha}_3^TA\vec{\alpha}_2&\vec{\alpha}_3^TA\vec{\alpha}_3&\dots&\vec{\alpha}_3^TA\vec{\alpha}_n\\ \vdots&\vdots&\vdots&&\vdots\\ 0&\vec{\alpha}_n^TA\vec{\alpha}_2&\vec{\alpha}_n^TA\vec{\alpha}_3&\dots&\vec{\alpha}_n^TA\vec{\alpha}_n\\\end{bmatrix} =\begin{bmatrix}\lambda&0\\0&B_{n-1}\end{bmatrix} P1AP=
X
T
(AX
)
α
2T
(AX
)
α
3T
(AX
)
α
nT
(AX
)
(AX
)
T
α
2
α
2T
Aα
2
α
3T
Aα
2
α
nT
Aα
2
(AX
)
T
Aα
3
α
2T
Aα
3
α
3T
Aα
3
α
nT
Aα
3
(AX
)
T
α
n
α
2T
Aα
n
α
3T
Aα
n
α
nT
Aα
n

=

X
T
(λX
)
α
2T
(λX
)
α
3T
(λX
)
α
nT
(λX
)
(λX
)
T
α
2
α
2T
Aα
2
α
3T
Aα
2
α
nT
Aα
2
(λX
)
T
Aα
3
α
2T
Aα
3
α
3T
Aα
3
α
nT
Aα
3
(λX
)
T
α
n
α
2T
Aα
n
α
3T
Aα
n
α
nT
Aα
n

=

λ0000α
2T
Aα
2
α
3T
Aα
2
α
nT
Aα
2
0α
2T
Aα
3
α
3T
Aα
3
α
nT
Aα
3
0α
2T
Aα
n
α
3T
Aα
n
α
nT
Aα
n

=
[λ00Bn1]

   \ \ \uad   由归纳假设存在正交矩阵Q,使得: Q − 1 B Q = [ λ 2 λ 3 λ 4 ⋱ λ n ] Q^{-1}BQ=\begin{bmatrix}\lambda_2\\&\lambda_3\\&&\lambda_4\\&&&\ddots\\&&&&\lambda_n\end{bmatrix} Q1BQ=
λ2λ3λ4λn

   \ \ \uad    P 1 = [ 1 Q ] P_1=\begin{bmatrix}1\\&Q\end{bmatrix} P1=[1Q]
   \ \ \uad    P 1 − 1 = [ 1 Q − 1 ] = P 1 T = [ 1 Q T ] P_1^{-1}=\begin{bmatrix}1\\&Q^{-1}\end{bmatrix}=P_1^T=\begin{bmatrix}1\\&Q^T\end{bmatrix} P11=[1Q1]=P1T=[1QT]
   \ \ \uad   显然, P 1 P_1 P1为正交矩阵。
   \ \ \uad   那么, P 1 − 1 P − 1 A P P 1 = [ 1 Q T ] [ λ 0 0 B ] [ 1 Q ] = [ λ Q T B Q ] = d i g a { λ , λ 1 , … , λ n } P_1^{-1}P^{-1}APP_1=\begin{bmatrix}1\\&Q^T\end{bmatrix}\begin{bmatrix}\lambda&0\\0&B\end{bmatrix}\begin{bmatrix}1\\&Q\end{bmatrix}=\begin{bmatrix}\lambda\\&Q^TBQ\end{bmatrix}=diga\{\lambda,\lambda_1,\dots,\lambda_n\} P11P1APP1=[1QT][λ00B][1Q]=[λQTBQ]=diga{
λ,λ1,,λn}

   \ \ \uad    P , P 1 P,P_1 P,P1均为正交矩阵,则 P P 1 PP_1 PP1为正交矩阵。(证毕)














推论6.2:实对称矩阵必存在 n n n个线性无关的特征向量,换而言之,其几何重数等于代数重数。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/117095.html

(0)
上一篇 2025-11-23 20:10
下一篇 2025-11-23 20:20

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信