2024-07-12
代数
00

目录

§20 Cayley-Hamilton定理
§20.1 线性变换的矩阵
§20.2 Jordan标准形
§20.3 特征多项式
§20.4 Cayley-Hamilton定理

§20 Cayley-Hamilton定理

§20.1 线性变换的矩阵

定义 20.1MMFF 上的向量空间,并确定 MM 的一组基 v1,,vk\vec{v}_{1}, \ldots, \vec{v}_{k}。(假设 MM 是有限维的。)那么,给定任意线性变换

A:MM,A: M\to M,

AA 关于基 v1,,vk\vec{v}_{1}, \ldots, \vec{v}_{k}矩阵(matrix) 是满足

Avi=j=1kAjivj.A\vec{v}_{i}=\sum\limits_{j=1}^{k}A_{ji}\vec{v}_{j}.

的矩阵。

例 20.1 (A)=(A11A12A13A21A22A23A31A32A33)(A)=\begin{pmatrix} A_{11}&A_{12}&A_{13}\\ A_{21}&A_{22}&A_{23}\\ A_{31}&A_{32}&A_{33} \end{pmatrix}。 则Av1=A11v1+A21v2+A31v3A\vec{v}_{1}=A_{11}\vec{v}_{1}+A_{21}\vec{v}_{2}+A_{31}\vec{v}_{3}

练习 写出 tt 在以下每个具有指定基的 F[t]F[t]-模上的乘法矩阵:

(1) M=F[t]/(t)M=F[t]/(t)v1=1\vec{v}_{1}=\overline{1}

(2) M=F[t]/(tα)M=F[t]/(t-\alpha)v1=1\vec{v}_{1}=\overline{1}

(3) M=F[t]/(tα)2M=F[t]/(t-\alpha)^{2}v2=1\vec{v}_{2}=\overline{1}v1=tα\vec{v}_{1}=\overline{t-\alpha}

(4) M=F[t]/(tα)3M=F[t]/(t-\alpha)^{3}v3=1\vec{v}_{3}=\overline{1}v2=tα\vec{v}_{2}=\overline{t-\alpha}v1=(tα)2\vec{v}_{1}=\overline{(t-\alpha)^{2}}

解:一般来说,F[t]F[t]F[t]/IF[t]/I 上的作用是 fg=fgf\cdot\overline{g}=\overline{fg}

(2) t1=t1=tα+α=α1t\cdot\overline{1}=\overline{t\cdot1}=\overline{t-\alpha}+\overline{\alpha}=\alpha\overline{1}

因此,tt1\overline{1} 映射为 α1\alpha\overline{1},即

(A)=(α)(A)=(\alpha)。

(3) t1=t1=tα+α=v1+αv2t\cdot\overline{1}=\overline{t\cdot1}=\overline{t-\alpha}+\overline{\alpha}=\vec{v}_{1}+\alpha\vec{v}_{2}。所以 (A)=(?1α)(A)=\begin{pmatrix} ? & 1\\ & \alpha \end{pmatrix}

计算:

t(tα)=(tα)(tα)+α(tα)=(tα)2+α(tα)=0+αv1\begin{aligned} t\cdot\overline{(t-\alpha)} &= (t-\alpha)\cdot\overline{(t-\alpha)} + \alpha\cdot\overline{(t-\alpha)} \\ &= \overline{(t-\alpha)^2} + \alpha\overline{(t-\alpha)} \\ &= 0 + \alpha\vec{v}_{1} \end{aligned}

因此,A=(α10α)A=\begin{pmatrix} \alpha & 1\\ 0 & \alpha \end{pmatrix}

命题 20.1 对于 M=F[t]/(tα)nM=F[t]/(t-\alpha)^{n},在以下基下 (tα)n1\overline{(t-\alpha)}^{n-1}(tα)n2\overline{(t-\alpha)}^{n-2}\ldots(tα)1\overline{(t-\alpha)}^{1}1\overline{1},线性变换

MMvtv\begin{aligned} M&\to M\\ \vec{v}&\mapsto t\vec{v} \end{aligned}

的矩阵为

(α10000α10000α00000α10000α)\begin{pmatrix} \alpha & 1 & 0 & & 0 & 0\\ 0 & \alpha & 1 & & 0 & 0\\ 0 & 0 & \alpha & & 0 & 0\\ & & & \ddots & & \\ 0 & 0 & 0 & & \alpha & 1\\ 0 & 0 & 0 & & 0 & \alpha \end{pmatrix}

其中对角线上为 α\alpha,每个 α\alpha 的正上方元素为 11,除了最上方的 α\alpha

证明:

tvi=t(tα)ni=((tα)+α)(tα)ni=(tα)(tα)ni+α(tα)ni=(tα)ni+1+αvi={vi1+αvi,in1,αvn,i=n.\begin{aligned} tv_{i}=t\overline{(t-\alpha)^{n-i}}&=((t-\alpha)+\alpha)\overline{(t-\alpha)}^{n-i}\\ &=(t-\alpha)\overline{(t-\alpha)}^{n-i}+\alpha\overline{(t-\alpha)}^{n-i}\\ &=\overline{(t-\alpha)}^{n-i+1}+\alpha\vec{v}_{i}\\ &=\begin{cases} \vec{v}_{i-1}+\alpha\vec{v}_{i}, & i\leqslant n-1,\\ \alpha\vec{v}_{n}, & i=n. \end{cases} \end{aligned}
 ~\tag*{$\square$}

如果 MMNN 是有限维的 F[t]F[t]-模,并且存在基 v1,,vm 为 M 的基w1,,wn 为 N 的基\begin{aligned} v_{1}, \ldots, v_{m}~\text{为}~M~\text{的基}\\ w_{1}, \ldots, w_{n}~\text{为}~N~\text{的基} \end{aligned},使得“tt 的乘法”分别由 矩阵 A 作用在 M矩阵 B 作用在 N\begin{aligned} \text{矩阵}~A~\text{作用在}~M\\ \text{矩阵}~B~\text{作用在}~N \end{aligned} 给出,那么在 MNM \oplus N 上,tt 的作用由矩阵

(A00B)\begin{pmatrix} A & 0\\ 0 & B \end{pmatrix}

给出,即分块对角矩阵。

§20.2 Jordan标准形

由于任意 F[t]F[t]-模同构于 iF[t]/(pini)\bigoplus\limits_{i}F[t]/(p_{i}n_{i}),我们有以下推论:

推论 20.2T:FnFnT: F^{n}\to F^{n} 是一个 FF-线性变换,且 FF 是代数闭域。那么,存在 FnF^{n} 的一组基,使得

(A1000A2000Ae)\begin{pmatrix} A_{1} & 0 & \cdots & 0\\ 0 & A_{2} & \cdots & 0\\ \vdots & & \ddots & \vdots\\ 0 & \cdots & 0 & A_{e} \end{pmatrix}

其中 A1=(α1100100α1)A_{1}=\begin{pmatrix} \alpha_{1} & 1 & \cdots & 0\\ 0 & \ddots & & \vdots\\ \vdots & & \ddots & 1\\ 0 & \cdots & 0 & \alpha_{1} \end{pmatrix}, A2=(α2100100α2),,A_{2}=\begin{pmatrix} \alpha_{2} & 1 & \cdots & 0\\ 0 & \ddots & & \vdots\\ \vdots & & \ddots & 1\\ 0 & \cdots & 0 & \alpha_{2} \end{pmatrix}, \ldots, Ae=(αe100100αe)A_{e}=\begin{pmatrix} \alpha_{e} & 1 & \cdots & 0\\ 0 & \ddots & & \vdots\\ \vdots & & \ddots & 1\\ 0 & \cdots & 0 & \alpha_{e} \end{pmatrix}

定义 20.2 这称为 TTJordan标准形(Jordan normal form)

§20.3 特征多项式

定义 20.3 特征多项式

det(tIA)F[t]\det(tI - A) \in F[t]

例 20.2 如果 A=(A11A12A21A22)A = \begin{pmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \end{pmatrix},则 tIA=(tA11A12A21tA22)tI - A = \begin{pmatrix} t - A_{11} & A_{12} \\ A_{21} & t - A_{22} \end{pmatrix}。因此

det(tIA)=t2(A11+A22)t+(A11A22A12A21).\det(tI - A) = t^{2} - (A_{11} + A_{22})t + (A_{11}A_{22} - A_{12}A_{21}).

如果 AAk×kk \times k 的矩阵,则特征多项式的第 ii 项系数是 AA 的一个不变量,在共轭变换下保持不变。

det(B(tIA)B1)=detBB1det(tIA)=det(tIA).\det(B(tI - A)B^{-1}) = \det BB^{-1} \det(tI - A) = \det(tI - A).

定义 20.4 任意 AMk×k(F)A \in M_{k \times k}(F) 确定了一个映射

f:F[t]Mk×k(F),f: F[t] \to M_{k \times k}(F),

由于 F[t]F[t] 是一个主理想整环,ker(f)=(p)\ker(f) = (p),其中 pF[t]p \in F[t]

取唯一的 pp,使得:

  • p=td+adtd1+p = t^{d} + a_{d}t^{d-1} + \cdots

  • ker(f)=(p)\ker(f) = (p)

我们称 ppAA最小多项式(minimal polynomial)

§20.4 Cayley-Hamilton定理

定理 20.3 (Cayley-Hamilton) 任意矩阵 AA 都满足它的特征多项式。

该定理在 FF 不是代数闭域的情况下也成立!

证明:在上述给定的基下,

det(tIA)=i=1e(tαi)ni.\det(tI - A) = \prod\limits_{i=1}^{e}(t - \alpha_{i})^{n_{i}}.

因此需要证明

i=1e(AαiI)ni=0.\prod\limits_{i=1}^{e}(A - \alpha_{i}I)^{n_{i}} = 0.

11,,1e\overline{1}_{1}, \ldots, \overline{1}_{e} 作为模生成了 vv,并且

(AαiI)ni1j=0.(A - \alpha_{i}I)^{n_{i}}\overline{1}_{j} = 0.

(因为 (AαiI)ni1(1i)(A - \alpha_{i}I)^{n_{i} - 1}(\overline{1}_{i}) 是特征向量。)

 ~\tag*{$\square$}

例 20.3 如果 A=(abcd)A = \begin{pmatrix} a & b \\ c & d \end{pmatrix},则它的特征多项式为 t2t(a+d)+(adbc)t^{2} - t(a + d) + (ad - bc)。该定理表明

A2A(a+d)+I(adbc)=0M2×2(F).A^{2} - A(a + d) + I(ad - bc) = 0 \in M_{2 \times 2}(F).

例 20.4 另一种形式,如果 AMk×k(F)A \in M_{k \times k}(F),则其特征多项式的形式为

tk+bk1tk1++b1t+b0.t^{k} + b_{k-1}t^{k-1} + \cdots + b_{1}t + b_{0}.

该定理表明,对于任意 vFk\vec{v} \in F^{k},我们有

Akv+bk1Ak1v++b1Av+b0v=0.A^{k}\vec{v} + b_{k-1}A^{k-1}\vec{v} + \cdots + b_{1}A\vec{v} + b_{0}\vec{v} = 0.

推论 20.4 AA 的最小多项式整除其特征多项式。

命题 20.5AMk×k(F)A \in M_{k \times k}(F)。当且仅当 AA 的列构成一个基时,AA 是可逆的。

证明:设 TAT_{A} 为由 AA 给出的线性变换 FkFkF^{k} \to F^{k}。我们需要证明 TAT_{A} 是可逆的,即 TAT_{A} 是单射且满射。

TA(ei)=vi其中 vi 是 A 的列向量。T_{A}(\vec{e}_{i}) = \vec{v}_{i} \quad \text{其中}~\vec{v}_{i}~\text{是}~A~\text{的列向量。}
(v1vk)(010)=(  vi  )\begin{pmatrix} \vdots & & \vdots\\ \vec{v}_{1} & \cdots & \vec{v}_{k}\\ \vdots & & \vdots \end{pmatrix} \begin{pmatrix} 0\\ \vdots \\ 1 \\ \vdots \\ 0 \end{pmatrix} = \begin{pmatrix} ~ \\ ~ \\ \vec{v}_{i} \\ ~ \\ ~ \end{pmatrix}

所以 TA(biei)=0bivi=0bi=0T_{A}(\sum b_{i}\vec{e}_{i}) = \vec{0} \Leftrightarrow \sum b_{i}\vec{v}_{i} = 0 \Leftrightarrow b_{i} = 0

由于 kerTA={0}\ker T_{A} = \{0\}TAT_{A}FkF^{k}FkF^{k} 之间的线性映射(维数相同),所以 TAT_{A} 是可逆的。

 ~\tag*{$\square$}

命题 20.6AA^{\prime}TAT_{A} 在某个基 v1,,vkv_{1}, \ldots, v_{k} 下的矩阵。令 B=(v1vk)B = \begin{pmatrix} \vdots & & \vdots \\ \vec{v}_{1} & \cdots & \vec{v}_{k} \\ \vdots & & \vdots \end{pmatrix}。则

A=BAB1A^{\prime} = BAB^{-1}。

证明:

BAB1(vi)=BAei=B(Ajiej)=Ajivj=A(vi)\begin{aligned} BAB^{-1}(\vec{v}_{i}) &= BA\vec{e}_{i} \\ &= B\left(\sum A_{ji}\vec{e}_{j}\right) \\ &= \sum A_{ji}\vec{v}_{j} \\ &= A^{\prime}(\vec{v}_{i})。 \end{aligned}
 ~\tag*{$\square$}

命题 20.7 如果 BB 是可逆的且 A=BAB1A^{\prime} = BAB^{-1},则

det(tIA)=det(tIA)F[t].\det(tI - A^{\prime}) = \det(tI - A) \in F[t].

证明:一般来说,

det(BCB1)=detBdetCdetB1=detBdetB1detC=detBB1detC=detIdetC=detC.\begin{aligned} \det(BCB^{-1}) &= \det B \det C \det B^{-1} \\ &= \det B \det B^{-1} \det C \\ &= \det BB^{-1} \det C \\ &= \det I \det C \\ &= \det C. \end{aligned}

因此

det(B(tIA)B1)=det(tIA).\det (B(tI - A)B^{-1}) = \det(tI - A).

并且

det(B(tIA)B1)=det(BtIB1BAB1)=det(tIBAB1)\begin{aligned} \det(B(tI - A)B^{-1}) &= \det(BtIB^{-1} - BAB^{-1}) \\ &= \det(tI - BAB^{-1})。 \end{aligned}
 ~\tag*{$\square$}

因此,为了计算任意 AMk×k(F)A \in M_{k \times k}(F) 的特征多项式?如果 FF 是代数闭域,那么

A=BAB1A = B A^{\prime} B^{-1}

其中

A=(A1000A2000Ae)A^{\prime} = \begin{pmatrix} A_{1} & 0 & \cdots & 0\\ 0 & A_{2} & \cdots & 0\\ \vdots & \cdots & \ddots & \vdots\\ 0 & \cdots & 0 & A_{e} \end{pmatrix}

是一个分块对角矩阵,其中

Ai=(αi1000αi1000αi000αi),αiF.A_{i} = \begin{pmatrix} \alpha_{i} & 1 & 0 & \cdots & 0\\ 0 & \alpha_{i} & 1 & \cdots & 0\\ 0 & 0 & \alpha_{i} & \cdots & 0\\ \vdots & \cdots & \cdots & \ddots & \vdots\\ 0 & \cdots & \cdots & 0 & \alpha_{i} \end{pmatrix}, \quad \alpha_{i} \in F.

其中 αi\alpha_{i} 位于对角线上,每个 αi\alpha_{i} 的右上方是 11。因此,我们只需计算

det(tIA)=det(tα1100tα10010tαe)=(tα1)n1(tα2)n2(tαe)ne.\begin{aligned} \det(tI - A^{\prime}) &= \det\begin{pmatrix} t - \alpha_{1} & -1 & \cdots & 0\\ 0 & t - \alpha_{1} & \cdots & 0\\ \vdots & \cdots & \ddots & \vdots\\ 0 & \cdots & \cdots & -1\\ 0 & \cdots & \cdots & t - \alpha_{e} \end{pmatrix}\\ &= (t - \alpha_{1})^{n_{1}} \cdot (t - \alpha_{2})^{n_{2}} \cdot \cdots \cdot (t - \alpha_{e})^{n_{e}}. \end{aligned}

因为 tIAtI - A^{\prime} 是上三角矩阵,其行列式为对角线上元素的乘积。

为证明

(Aα1)n1(Aαe)ne=0(A-\alpha_{1})^{n_{1}}\cdot\cdots\cdot(A-\alpha_{e})^{n_{e}}=0

我们只需证明对于任意 v\vec{v},有

(Aα1)n1(Aαe)nev=0.(A-\alpha_{1})^{n_{1}}\cdot \cdots\cdot(A-\alpha_{e})^{n_{e}}\vec{v}=0.

现在选择一个基

v1,n1=1,,v1,1=(tα1)n11F[t]/(tα1)n1ve,ne=1,,ve,1=(tαe)ne1F[t]/(tαe)ne\begin{aligned} \vec{v}_{1,n_{1}} &= \overline{1}, \ldots, \vec{v}_{1,1} = \overline{(t - \alpha_{1})}^{n_{1} - 1} \in F[t]/(t - \alpha_{1})^{n_{1}} \\ &\vdots \\ \vec{v}_{e,n_{e}} &= \overline{1}, \ldots, \vec{v}_{e,1} = \overline{(t - \alpha_{e})}^{n_{e} - 1} \in F[t]/(t - \alpha_{e})^{n_{e}} \end{aligned}

{vi,nj}\{\vec{v}_{i, n_{j}}\} 构成 AA 作用的向量空间的基。此外,

(Aα1)n1(Aαi)ni(Aαe)nevi,j=(Aα1)n1(Aαe)ne(Aαi)nivi,j=(Aα1)n1(Aαe)ne0=0\begin{aligned} &(A - \alpha_{1})^{n_{1}} \cdot \cdots \cdot (A - \alpha_{i})^{n_{i}} \cdot \cdots \cdot (A - \alpha_{e})^{n_{e}} \vec{v}_{i,j} \\ =& (A - \alpha_{1})^{n_{1}} \cdot \cdots \cdot (A - \alpha_{e})^{n_{e}} (A - \alpha_{i})^{n_{i}} \vec{v}_{i,j} \\ =& (A - \alpha_{1})^{n_{1}} \cdot \cdots \cdot (A - \alpha_{e})^{n_{e}} \vec{0} \\ =& \vec{0} \end{aligned}

第二和第三个等式成立的原因是我们知道(通过选择的基),

Avi,j=vi,j1+αivi,j.A\vec{v}_{i,j} = \vec{v}_{i,j-1} + \alpha_{i} \vec{v}_{i,j}.

另一方面,

Avi,1=αivi,1.A\vec{v}_{i,1} = \alpha_{i}\vec{v}_{i,1}.

因此

(Aαi)vi,j={vi,j1j>10j=1(A - \alpha_{i}) \vec{v}_{i,j} = \begin{cases} \vec{v}_{i,j-1} & j > 1 \\ 0 & j = 1 \end{cases}

这样我们就证明了,如果 FF 是代数闭域,那么任何 AMk×k(F)A \in M_{k \times k}(F) 都满足其特征多项式 det(tIA)\det(tI - A)。如果 FF 不是代数闭域呢?令 F\overline{F} 是一个包含 FF 的代数闭域,则我们有包含映射

Mk×k(F)Mk×k(F)M_{k \times k}(F) \hookrightarrow M_{k \times k}(\overline{F})

F[t]F[t]F[t] \hookrightarrow \overline{F}[t]。

我们可以将任何以 FF 为系数的矩阵视作以 F\overline{F} 为系数的矩阵。同样,任何以 FF 为系数的多项式也可以视作以 F\overline{F} 为系数的多项式。将这些联系组合起来,

是交换的。因此,如果 $?\to 0$,则表明? 必然为零。简单来说,将矩阵代入其特征多项式的结果是相同的,无论我们将矩阵视作具有 $F$ 还是 $\overline{F}$ 系数。