本
文
摘
要
我们计划用几篇短文章把矩阵的对角化问题整理一下,希望对大家有所帮助。
首先回顾下矩阵的对角化问题: nn 阶矩阵 AA 称为可对角化,如果AA相似于一对角矩阵。即:存在nn 阶非奇异矩阵 SS 使得 S−1AS=DS^{-1}AS=D , 其中 DD 是一nn 阶对角矩阵。关于矩阵可对角化的充要条件,我们有下面的定理:
定理:nn 阶矩阵可对角化的充要条件是它有 nn 个线性无关的特征向量。
证明:(充分性)设 X1,X2,...,XnX_1, X_2, ... , X_n是 nn 阶矩阵 AA的 nn 个线性无关的特征向量,其对应的特征值分别为 λ1,λ2,...,λn\lambda_1, \lambda_2, ... , \lambda_n (可以相同),即 AXi=λiXi,i=1,2,...,nAX_i=\lambda_iX_i, i=1, 2, ... ,n。令 S=[X1,X2,...,Xn]S=[X_1, X_2, ... , X_n] , 即每一 XiX_i 是nn 阶矩阵 SS 的第 ii 列。显然 SS 是非奇异的,既然它所有列线性无关。记对角矩阵 D=diag(λ1,λ2,...,λn) D=\mathrm{diag}( \lambda_1, \lambda_2, ... , \lambda_n) ,于是
AS=A[X1,X2,...,Xn]=[AX1,AX2,...,AXn]=[λ1X1,λ2X2,...,λnXn]AS=A[X_1, X_2, ... , X_n]=[AX_1, AX_2, ... , AX_n]=[\lambda_1 X_1, \lambda_2 X_2, ... , \lambda_n X_n]
=[X1,X2,...,Xn]diag(λ1,λ2,...,λn)=SD=[X_1, X_2, ... , X_n] \mathrm{diag}( \lambda_1, \lambda_2, ... , \lambda_n)=S D ⇒\Rightarrow S−1AS=DS^{-1}AS=D
(必要性)设nn 阶非奇异矩阵 SS 使得 S−1AS=DS^{-1}AS=D,其中对角矩阵 D=diag(λ1,λ2,...,λn) D=\mathrm{diag}( \lambda_1, \lambda_2, ... , \lambda_n)。我们把矩阵 SS 按列写,设 S=[X1,X2,...,Xn]S=[X_1, X_2, ... , X_n], 即每一 XiX_i 是nn 阶矩阵 SS 的第 ii 列。既然 SS 是非奇异的,则X1,X2,...,XnX_1, X_2, ... , X_n线性无关。于是
AS=A[X1,X2,...,Xn]=[AX1,AX2,...,AXn]AS=A[X_1, X_2, ... , X_n]=[AX_1, AX_2, ... , AX_n]
SD=[X1,X2,...,Xn]diag(λ1,λ2,...,λn)=[λ1X1,λ2X2,...,λnXn]SD=[X_1, X_2, ... , X_n] \mathrm{diag}( \lambda_1, \lambda_2, ... , \lambda_n)=[\lambda_1 X_1, \lambda_2 X_2, ... , \lambda_n X_n]
由 S−1AS=DS^{-1}AS=D ,我们得到 AS=SDAS=SD , 从而 [AX1,AX2,...,AXn]=[λ1X1,λ2X2,...,λnXn][AX_1, AX_2, ... , AX_n]=[\lambda_1 X_1, \lambda_2 X_2, ... , \lambda_n X_n] ,于是
AXi=λiXi,i=1,2,...,nAX_i=\lambda_i X_i, i=1, 2, ... , n 。从而 X1,X2,...,XnX_1, X_2, ... , X_n是 nn 阶矩阵 AA的 nn 个线性无关的特征向量。 ◻\square
总结一下:
1. 若X1,X2,...,XnX_1, X_2, ... , X_n是 nn 阶矩阵 AA的 nn 个线性无关的特征向量,其对应的特征值分别为 λ1,λ2,...,λn\lambda_1, \lambda_2, ... , \lambda_n (可以相同),令 S=[X1,X2,...,Xn]S=[X_1, X_2, ... , X_n],即每一 XiX_i 是nn 阶矩阵 SS 的第 ii 列,对角矩阵 D=diag(λ1,λ2,...,λn) D=\mathrm{diag}( \lambda_1, \lambda_2, ... , \lambda_n),则 S−1AS=DS^{-1}AS=D 。这告诉我们如果如何去对角化一 nn 阶矩阵,如果你能找到 其 nn 个线性无关的特征向量(及其对应的特征值)的话。
2. 反过来, 若 S−1AS=DS^{-1}AS=D,其中对角矩阵 D=diag(λ1,λ2,...,λn) D=\mathrm{diag}( \lambda_1, \lambda_2, ... , \lambda_n)。设 S=[X1,X2,...,Xn]S=[X_1, X_2, ... , X_n], 即每一 XiX_i 是nn 阶矩阵 SS 的第 ii 列, 则
AXi=λiXi,i=1,2,...,nAX_i=\lambda_i X_i, i=1, 2, ... , n,即 SS 的所有列X1,X2,...,XnX_1, X_2, ... , X_n是 nn 阶矩阵 AA的 nn 个线性无关的特征向量。
这告诉我们如果一 nn 阶矩阵可以通过一非奇异矩阵(称之为:过渡矩阵)对角化,则此过渡矩阵的所有列构成此 nn 阶矩阵的 nn 个线性无关的特征向量。
由于上述定理,现在 nn 阶矩阵的对角化问题变成了:如何判断它是否有 nn 个线性无关的特征向量?如果有,如何找到一组nn 个线性无关的特征向量?我们在随后的文章将同时回答这两个问题,请看:
MirrorLake:矩阵的对角化(2)1 赞同 · 0 评论文章