Skip to main content

矩阵的相似对角化

定理 1 相似矩阵的特征值相同.

证 设 ABA \sim B, 则存在可逆矩阵 PP, 使

B=P1AP,B = P^{-1}AP, det(λIB)=det(λIP1AP)=det[P1(λIA)P]=detP1det(λIA)detP=det(λIA),\begin{aligned} \det(\lambda I - B) &= \det(\lambda I - P^{-1}AP) = \det[P^{-1}(\lambda I - A)P] \\ &= \det P^{-1} \det(\lambda I - A) \det P = \det(\lambda I - A), \end{aligned}

AABB 的特征多项式相同, 因此 AABB 的特征值相同.


定理 2nn 阶矩阵 AA 与对角矩阵 Λ=(λ1λ2λn)\Lambda = \begin{pmatrix} \lambda_1 & & \\ & \lambda_2 & \\ & & \ddots \\ & & & \lambda_n \end{pmatrix} 相似,则 λ1,λ2,,λn\lambda_1, \lambda_2, \cdots, \lambda_nAA 的全部特征值。

因为 AΛ=(λ1λ2λn)A \sim \Lambda = \begin{pmatrix} \lambda_1 & & \\ & \lambda_2 & \\ & & \ddots \\ & & & \lambda_n \end{pmatrix},所以 AAΛ\Lambda 的特征值相同。又

det(λIA)=(λλ1)(λλ2)(λλn),\det(\lambda I - A) = (\lambda - \lambda_1)(\lambda - \lambda_2)\cdots(\lambda - \lambda_n),

所以 λ1,λ2,,λn\lambda_1, \lambda_2, \cdots, \lambda_nΛ\Lambda 的全部特征值,也就是 AA 的全部特征值。

定理 2 指出,若 AA 与对角矩阵 Λ\Lambda 相似,则 Λ\Lambda 的主对角线上的元就是 AA 的全部特征值。那么,使 P1AP=ΛP^{-1}AP = \Lambda 的矩阵 PP 又是怎样构成的呢?

P=(p1,p2,,pn)P = (p_1, p_2, \cdots, p_n)p1,p2,,pnp_1, p_2, \cdots, p_nPP 的列向量组,则

P1AP=Λ,AP=PΛ,P^{-1}AP = \Lambda, \quad AP = P\Lambda,

A(p1,p2,,pn)=(p1,p2,,pn)(λ1λ2λn),A(p_1, p_2, \cdots, p_n) = (p_1, p_2, \cdots, p_n) \begin{pmatrix} \lambda_1 & & \\ & \lambda_2 & \\ & & \ddots \\ & & & \lambda_n \end{pmatrix}, (Ap1,Ap2,,Apn)=(λ1p1,λ2p2,,λnpn),(Ap_1, Ap_2, \cdots, Ap_n) = (\lambda_1 p_1, \lambda_2 p_2, \cdots, \lambda_n p_n), Api=λipi(i=1,2,,n).Ap_i = \lambda_i p_i \quad (i=1, 2, \cdots, n).

因为 PP 可逆,所以 pi0(i=1,2,,n)p_i \neq 0 (i=1, 2, \cdots, n),于是,p1,p2,,pnp_1, p_2, \cdots, p_nAAnn 个线性无关的特征向量。

反之,若 AAnn 个线性无关的特征向量 p1,p2,,pnp_1, p_2, \cdots, p_n,即 Api=λipi(i=1,2,,n)Ap_i = \lambda_i p_i \quad (i=1, 2, \cdots, n),设 P=(p1,p2,,pn)P = (p_1, p_2, \cdots, p_n),则 PP 可逆,且

AP=(Ap1,Ap2,,Apn)=(λ1p1,λ2p2,,λnpn)AP = (Ap_1, Ap_2, \cdots, Ap_n) = (\lambda_1 p_1, \lambda_2 p_2, \cdots, \lambda_n p_n) =(p1,p2,,pn)(λ1λ2λn)=PΛ,= (p_1, p_2, \cdots, p_n) \begin{pmatrix} \lambda_1 & & \\ & \lambda_2 & \\ & & \ddots \\ & & & \lambda_n \end{pmatrix} = P\Lambda,

所以 P1AP=ΛP^{-1}AP = \Lambda,即 AA 与对角矩阵 Λ\Lambda 相似。

由以上讨论可得


定理 3 nn 阶矩阵 AA 能与对角矩阵 Λ\Lambda 相似的充要条件是 AAnn 个线性无关的特征向量。

由此定理可知,若 nn 阶矩阵 AAnn 个线性无关的特征向量

Api=λipi(i=1,2,,n),Ap_i = \lambda_i p_i \quad (i=1,2,\cdots,n),

P=(p1,p2,,pn)P = (p_1, p_2, \cdots, p_n),则

P1AP=(λ1λ2λn),P^{-1}AP = \begin{pmatrix} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{pmatrix},

λ1,λ2,,λn\lambda_1, \lambda_2, \cdots, \lambda_nAA 的全部特征值。

值得注意的是,PP 中列向量 p1,p2,,pnp_1, p_2, \cdots, p_n 的排列顺序要与 λ1,λ2,,λn\lambda_1, \lambda_2, \cdots, \lambda_n 的排列顺序一致。

由于 pip_i(λiIA)X=0(\lambda_i I - A)X = 0 的基础解系中的解向量,故 pip_i 的取法不是唯一的,因此 PP 也不是唯一的。而 fA(λ)=det(λIA)=0f_A(\lambda) = \det(\lambda I - A) = 0 的根只有 nn 个(重根按重数计算),所以若不计 λi\lambda_i 的排列顺序,则 Λ\Lambda 是唯一确定的。


定理 3 给出了 nn 阶矩阵与对角矩阵相似的充要条件,但是对于一个具体的 nn 阶矩阵,要直接判断它是否有 nn 个线性无关的特征向量一般是很困难的,下面我们进一步讨论什么样的 nn 阶矩阵能与对角矩阵相似.


定理 4λ1,λ2,,λm\lambda_1, \lambda_2, \cdots, \lambda_m 是矩阵 AA 的互异特征值, α1,α2,,αm\alpha_1, \alpha_2, \cdots, \alpha_mAA 分别对应这些特征值的特征向量,则 α1,α2,,αm\alpha_1, \alpha_2, \cdots, \alpha_m 线性无关.

用数学归纳法证明.

m=1m=1 时,结论显然成立. 因为特征向量 α10\alpha_1 \neq 0, 所以一个非零向量是线性无关的.

假设对 m1m-1 个互异特征值结论成立.

AA 是一个线性变换(或矩阵),mm 个互异特征值为 λ1,λ2,,λm\lambda_1, \lambda_2, \cdots, \lambda_m,对应的特征向量分别为 α1,α2,,αm\alpha_1, \alpha_2, \cdots, \alpha_m

考虑如下线性组合:

k1α1+k2α2++kmαm=0.(5.9)k_1\alpha_1 + k_2\alpha_2 + \cdots + k_m\alpha_m = 0. \tag{5.9}

AA 左乘等式 (5.9) 两端,得:

k1(Aα1)+k2(Aα2)++km(Aαm)=0.k_1(A\alpha_1) + k_2(A\alpha_2) + \cdots + k_m(A\alpha_m) = 0.

由于 Aαi=λiαiA\alpha_i = \lambda_i \alpha_i,代入后得到:

k1(λ1α1)+k2(λ2α2)++km(λmαm)=0.(5.10)k_1(\lambda_1\alpha_1) + k_2(\lambda_2\alpha_2) + \cdots + k_m(\lambda_m\alpha_m) = 0. \tag{5.10}

再用 λm\lambda_m 乘以原式 (5.9) 两端,得:

k1(λmα1)+k2(λmα2)++km(λmαm)=0.(5.11)k_1(\lambda_m\alpha_1) + k_2(\lambda_m\alpha_2) + \cdots + k_m(\lambda_m\alpha_m) = 0. \tag{5.11}

将式 (5.10) 与式 (5.11) 相减,即:

k1(λ1λm)α1+k2(λ2λm)α2++km1(λm1λm)αm1=0.k_1(\lambda_1 - \lambda_m)\alpha_1 + k_2(\lambda_2 - \lambda_m)\alpha_2 + \cdots + k_{m-1}(\lambda_{m-1} - \lambda_m)\alpha_{m-1} = 0.

由归纳假设(即前 m1m-1 个特征向量线性无关),可得:

k1(λ1λm)=k2(λ2λm)==km1(λm1λm)=0.k_1(\lambda_1 - \lambda_m) = k_2(\lambda_2 - \lambda_m) = \cdots = k_{m-1}(\lambda_{m-1} - \lambda_m) = 0.

又因为特征值互异,所以 λiλm0\lambda_i - \lambda_m \neq 0(对于 i=1,2,,m1i = 1, 2, \ldots, m-1),故必须有:

k1=k2==km1=0.k_1 = k_2 = \cdots = k_{m-1} = 0.

将这些结果代入式 (5.9),得:

kmαm=0.k_m\alpha_m = 0.

由于特征向量 αm0\alpha_m \neq 0,所以 km=0k_m = 0

综上,所有系数均为零,因此:

α1,α2,,αm线性无关.\alpha_1, \alpha_2, \cdots, \alpha_m \quad \text{线性无关}.

推论 1nn 阶矩阵 AA 的特征值都是单重特征根, 则 AA 能与对角矩阵相似.

因为 AA 的特征值都是 det(λIA)=0\det(\lambda I - A)=0 的单根, 所以 AAnn 个互异特征值. 互异特征值对应的特征向量是线性无关的, 故 AAnn 个线性无关的特征向量, 因而 AA 能与对角矩阵相似.

与定理 4 的证明类似, 我们可以得到下面的推论:

推论 2λ1,λ2,,λk\lambda_1, \lambda_2, \cdots, \lambda_k 是矩阵 AA 的互异特征值, αi1,αi2,,αiri\alpha_{i1}, \alpha_{i2}, \cdots, \alpha_{ir_i} 是对应于特征值 λi\lambda_i 的线性无关的特征向量, 则 α11,,α1r1,,αk1,,αkrk\alpha_{11}, \cdots, \alpha_{1r_1}, \cdots, \alpha_{k1}, \cdots, \alpha_{kr_k} 也线性无关.

λ1,λ2,,λr\lambda_1, \lambda_2, \cdots, \lambda_rnn 阶矩阵 AA 的全部互异特征值, λi\lambda_iAAkik_i 重特征值 (ki1)(k_i \geq 1), 则 k1+k2++kr=nk_1+k_2+\cdots+k_r=n. 若对每一个特征值 λi(i=1,2,,r),(λiIA)X=0\lambda_i (i=1,2,\cdots,r), (\lambda_i I - A)X=0 的基础解系由 kik_i 个解向量组成, 即 λi\lambda_i 恰有 kik_i 个线性无关的特征向量, 则由推论 2 可知, AAnn 个线性无关的特征向量, 而 (λiIA)X=0(\lambda_i I - A)X=0 的基础解系所含解向量个数不大于 kik_i, 故可得下面的定理:


定理 5 nn 阶矩阵 AA 与对角矩阵相似的充要条件是对于 AA 的每一个 kik_i 重特征根 λi\lambda_i, 齐次线性方程组 (λiIA)X=0(\lambda_i I - A)X=0 的基础解系由 kik_i 个解向量组成.

λiIA\lambda_i I - A 是齐次线性方程组 (λiIA)X=0(\lambda_i I - A)X=0 的系数矩阵, 由系数矩阵的秩与基础解系所含解向量的个数的关系可以得到定理 5 的一个推论.

推论 3 nn 阶矩阵 AA 与对角矩阵相似的充要条件是对于每一个 kik_i 重特征根 λi\lambda_i, R(λiIA)=nkiR(\lambda_i I - A)=n-k_i.