§20 Cayley-Hamilton定理
§20.1 线性变换的矩阵
定义 20.1 设 M 是 F 上的向量空间,并确定 M 的一组基 v1,…,vk。(假设 M 是有限维的。)那么,给定任意线性变换
A 关于基 v1,…,vk 的矩阵(matrix) 是满足
Avi=j=1∑kAjivj.
的矩阵。
例 20.1
(A)=⎝⎛A11A21A31A12A22A32A13A23A33⎠⎞。 则Av1=A11v1+A21v2+A31v3。
练习 写出 t 在以下每个具有指定基的 F[t]-模上的乘法矩阵:
(1) M=F[t]/(t),v1=1。
(2) M=F[t]/(t−α),v1=1。
(3) M=F[t]/(t−α)2,v2=1,v1=t−α。
(4) M=F[t]/(t−α)3,v3=1,v2=t−α,v1=(t−α)2。
解:一般来说,F[t] 在 F[t]/I 上的作用是 f⋅g=fg。
(2) t⋅1=t⋅1=t−α+α=α1。
因此,t 将 1 映射为 α1,即
(A)=(α)。
(3) t⋅1=t⋅1=t−α+α=v1+αv2。所以 (A)=(?1α)。
计算:
t⋅(t−α)=(t−α)⋅(t−α)+α⋅(t−α)=(t−α)2+α(t−α)=0+αv1
因此,A=(α01α)。
命题 20.1 对于 M=F[t]/(t−α)n,在以下基下 (t−α)n−1,(t−α)n−2,…,(t−α)1,1,线性变换
Mv→M↦tv
的矩阵为
⎝⎛α00001α00001α00⋱000α00001α⎠⎞
其中对角线上为 α,每个 α 的正上方元素为 1,除了最上方的 α。
证明:
tvi=t(t−α)n−i=((t−α)+α)(t−α)n−i=(t−α)(t−α)n−i+α(t−α)n−i=(t−α)n−i+1+αvi={vi−1+αvi,αvn,i⩽n−1,i=n.
注
如果 M 和 N 是有限维的 F[t]-模,并且存在基 v1,…,vm 为 M 的基w1,…,wn 为 N 的基,使得“t 的乘法”分别由 矩阵 A 作用在 M矩阵 B 作用在 N 给出,那么在 M⊕N 上,t 的作用由矩阵
(A00B)
给出,即分块对角矩阵。
§20.2 Jordan标准形
由于任意 F[t]-模同构于 i⨁F[t]/(pini),我们有以下推论:
推论 20.2 设 T:Fn→Fn 是一个 F-线性变换,且 F 是代数闭域。那么,存在 Fn 的一组基,使得
⎝⎛A10⋮00A2⋯⋯⋯⋱000⋮Ae⎠⎞
其中
A1=⎝⎛α10⋮01⋱⋯⋯⋱00⋮1α1⎠⎞, A2=⎝⎛α20⋮01⋱⋯⋯⋱00⋮1α2⎠⎞,…, Ae=⎝⎛αe0⋮01⋱⋯⋯⋱00⋮1αe⎠⎞。
定义 20.2 这称为 T 的Jordan标准形(Jordan normal form)。
§20.3 特征多项式
定义 20.3 特征多项式
det(tI−A)∈F[t]
例 20.2 如果 A=(A11A21A12A22),则 tI−A=(t−A11A21A12t−A22)。因此
det(tI−A)=t2−(A11+A22)t+(A11A22−A12A21).
注 如果 A 是 k×k 的矩阵,则特征多项式的第 i 项系数是 A 的一个不变量,在共轭变换下保持不变。
det(B(tI−A)B−1)=detBB−1det(tI−A)=det(tI−A).
定义 20.4 任意 A∈Mk×k(F) 确定了一个映射
f:F[t]→Mk×k(F),
由于 F[t] 是一个主理想整环,ker(f)=(p),其中 p∈F[t]。
取唯一的 p,使得:
我们称 p 为 A 的最小多项式(minimal polynomial)。
§20.4 Cayley-Hamilton定理
定理 20.3 (Cayley-Hamilton)
任意矩阵 A 都满足它的特征多项式。
注 该定理在 F 不是代数闭域的情况下也成立!
证明:在上述给定的基下,
det(tI−A)=i=1∏e(t−αi)ni.
因此需要证明
i=1∏e(A−αiI)ni=0.
但 11,…,1e 作为模生成了 v,并且
(A−αiI)ni1j=0.
(因为 (A−αiI)ni−1(1i) 是特征向量。)
例 20.3 如果 A=(acbd),则它的特征多项式为 t2−t(a+d)+(ad−bc)。该定理表明
A2−A(a+d)+I(ad−bc)=0∈M2×2(F).
例 20.4 另一种形式,如果 A∈Mk×k(F),则其特征多项式的形式为
tk+bk−1tk−1+⋯+b1t+b0.
该定理表明,对于任意 v∈Fk,我们有
Akv+bk−1Ak−1v+⋯+b1Av+b0v=0.
推论 20.4 A 的最小多项式整除其特征多项式。
命题 20.5 设 A∈Mk×k(F)。当且仅当 A 的列构成一个基时,A 是可逆的。
证明:设 TA 为由 A 给出的线性变换 Fk→Fk。我们需要证明 TA 是可逆的,即 TA 是单射且满射。
TA(ei)=vi其中 vi 是 A 的列向量。
⎝⎛⋮v1⋮⋯⋮vk⋮⎠⎞⎝⎛0⋮1⋮0⎠⎞=⎝⎛ vi ⎠⎞
所以 TA(∑biei)=0⇔∑bivi=0⇔bi=0。
由于 kerTA={0} 且 TA 是 Fk 到 Fk 之间的线性映射(维数相同),所以 TA 是可逆的。
命题 20.6 设 A′ 是 TA 在某个基 v1,…,vk 下的矩阵。令 B=⎝⎛⋮v1⋮⋯⋮vk⋮⎠⎞。则
A′=BAB−1。
证明:
BAB−1(vi)=BAei=B(∑Ajiej)=∑Ajivj=A′(vi)。
命题 20.7 如果 B 是可逆的且 A′=BAB−1,则
det(tI−A′)=det(tI−A)∈F[t].
证明:一般来说,
det(BCB−1)=detBdetCdetB−1=detBdetB−1detC=detBB−1detC=detIdetC=detC.
因此
det(B(tI−A)B−1)=det(tI−A).
并且
det(B(tI−A)B−1)=det(BtIB−1−BAB−1)=det(tI−BAB−1)。
因此,为了计算任意 A∈Mk×k(F) 的特征多项式?如果 F 是代数闭域,那么
A=BA′B−1
其中
A′=⎝⎛A10⋮00A2⋯⋯⋯⋯⋱000⋮Ae⎠⎞
是一个分块对角矩阵,其中
Ai=⎝⎛αi00⋮01αi0⋯⋯01αi⋯⋯⋯⋯⋯⋱0000⋮αi⎠⎞,αi∈F.
其中 αi 位于对角线上,每个 αi 的右上方是 1。因此,我们只需计算
det(tI−A′)=det⎝⎛t−α10⋮00−1t−α1⋯⋯⋯⋯⋯⋱⋯⋯00⋮−1t−αe⎠⎞=(t−α1)n1⋅(t−α2)n2⋅⋯⋅(t−αe)ne.
因为 tI−A′ 是上三角矩阵,其行列式为对角线上元素的乘积。
为证明
(A−α1)n1⋅⋯⋅(A−αe)ne=0
我们只需证明对于任意 v,有
(A−α1)n1⋅⋯⋅(A−αe)nev=0.
现在选择一个基
v1,n1ve,ne=1,…,v1,1=(t−α1)n1−1∈F[t]/(t−α1)n1⋮=1,…,ve,1=(t−αe)ne−1∈F[t]/(t−αe)ne
则 {vi,nj} 构成 A 作用的向量空间的基。此外,
===(A−α1)n1⋅⋯⋅(A−αi)ni⋅⋯⋅(A−αe)nevi,j(A−α1)n1⋅⋯⋅(A−αe)ne(A−αi)nivi,j(A−α1)n1⋅⋯⋅(A−αe)ne00
第二和第三个等式成立的原因是我们知道(通过选择的基),
Avi,j=vi,j−1+αivi,j.
另一方面,
Avi,1=αivi,1.
因此
(A−αi)vi,j={vi,j−10j>1j=1
这样我们就证明了,如果 F 是代数闭域,那么任何 A∈Mk×k(F) 都满足其特征多项式 det(tI−A)。如果 F 不是代数闭域呢?令 F 是一个包含 F 的代数闭域,则我们有包含映射
Mk×k(F)↪Mk×k(F)
和
F[t]↪F[t]。
我们可以将任何以 F 为系数的矩阵视作以 F 为系数的矩阵。同样,任何以 F 为系数的多项式也可以视作以 F 为系数的多项式。将这些联系组合起来,
是交换的。因此,如果 $?\to 0$,则表明? 必然为零。简单来说,将矩阵代入其特征多项式的结果是相同的,无论我们将矩阵视作具有 $F$ 还是 $\overline{F}$ 系数。