幂零变换的Fitting分解
幂零变换的Fitting分解是一个将线性空间分解为两个特殊子空间的直和的方法,这两个子空间分别由变换的幂零部分和可逆部分作用所控制。理解这个分解需要从线性变换的基本概念出发,逐步深入到幂零变换的性质,最后综合得到分解定理本身。
步骤一:回顾核心概念——线性变换与不变子空间
- 线性变换:设 \(V\) 是一个域 \(F\) 上的有限维向量空间。一个线性变换 \(T: V \to V\) 是一个满足 \(T(u+v)=T(u)+T(v)\) 和 \(T(\lambda v)=\lambda T(v)\) 的映射。
- 不变子空间:子空间 \(W \subseteq V\) 称为 \(T\)-不变的,如果 \(T(W) \subseteq W\),即 \(T\) 把 \(W\) 中的向量仍然映射到 \(W\) 中。研究一个变换,常常通过研究其不变子空间来分解问题。
- 核与像:对于线性变换 \(T\),我们关注两个重要的不变子空间:
- 核:\(\ker(T) = \{ v \in V \mid T(v) = 0 \}\)。
- 像:\(\operatorname{im}(T) = \{ T(v) \mid v \in V \}\)。
随着迭代应用 \(T\),这些空间会形成链。
步骤二:引入关键概念——幂零变换与升链/降链
- 幂零变换:线性变换 \(N: V \to V\) 称为幂零的,如果存在某个正整数 \(m\) 使得 \(N^m = 0\)(零变换)。满足 \(N^m=0\) 的最小正整数 \(m\) 称为 \(N\) 的指数或幂零指数。
- 幂零变换的链:对于幂零变换 \(N\)(指数为 \(m\)),考虑其核与像的迭代序列:
- 升链:\(\{0\} = \ker(N^0) \subseteq \ker(N) \subseteq \ker(N^2) \subseteq \cdots \subseteq \ker(N^m) = V\)。
- 降链:\(V = \operatorname{im}(N^0) \supseteq \operatorname{im}(N) \supseteq \operatorname{im}(N^2) \supseteq \cdots \supseteq \operatorname{im}(N^m) = \{0\}\)。
这两个链都是严格递增/递减的,直到达到稳定(\(V\) 和 \(\{0\}\))。
- 关键观察:对于幂零变换,空间 \(V\) 最终会被其足够高阶幂的核“填满”,并被其足够高阶幂的像“耗尽”。对于一般的线性变换 \(T\),这两个链也会稳定,但终点不同。
步骤三:一般线性变换的Fitting引理
对于任意线性变换 \(T: V \to V\)(\(V\) 有限维),考虑其核与像的链:
- 升链:\(\ker(T) \subseteq \ker(T^2) \subseteq \ker(T^3) \subseteq \cdots\)
- 降链:\(\operatorname{im}(T) \supseteq \operatorname{im}(T^2) \supseteq \operatorname{im}(T^3) \supseteq \cdots\)
由于 \(V\) 是有限维的,这两个链必然在有限步后稳定。存在一个最小的正整数 \(r\)(称为 \(T\) 的Fitting指数),使得:
\[\ker(T^r) = \ker(T^{r+1}) = \ker(T^{r+2}) = \cdots \quad \text{记作} \quad \mathcal{N}(T) \]
\[ \operatorname{im}(T^r) = \operatorname{im}(T^{r+1}) = \operatorname{im}(T^{r+2}) = \cdots \quad \text{记作} \quad \mathcal{I}(T) \]
Fitting引理断言:
- \(V = \mathcal{N}(T) \oplus \mathcal{I}(T)\)(直和)。
- 子空间 \(\mathcal{N}(T)\) 和 \(\mathcal{I}(T)\) 都是 \(T\)-不变的。
- 限制 \(T|_{\mathcal{N}(T)} : \mathcal{N}(T) \to \mathcal{N}(T)\) 是一个幂零变换(其幂零指数不超过 \(r\))。
- 限制 \(T|_{\mathcal{I}(T)} : \mathcal{I}(T) \to \mathcal{I}(T)\) 是一个可逆变换(即同构)。
步骤四:理解Fitting分解的几何与代数意义
- 空间分解:Fitting分解 \(V = \mathcal{N}(T) \oplus \mathcal{I}(T)\) 将原空间 \(V\) 拆解为两部分:
- \(\mathcal{N}(T)\):称为 \(T\) 的幂零分支(或幂零部分)。所有向量在经过足够多次 \(T\) 作用后都会变成零。它是变换所有“最终会消失”的向量的家园。
- \(\mathcal{I}(T)\):称为 \(T\) 的可逆分支(或可逆部分)。变换在其上的限制是可逆的,意味着作用不会损失信息,没有非零向量会被映射到零(在该子空间内)。
- 矩阵表示:如果我们选取分别适配于 \(\mathcal{N}(T)\) 和 \(\mathcal{I}(T)\) 的基,那么变换 \(T\) 的矩阵可以写成分块对角形式:
\[ \begin{pmatrix} N & 0 \\ 0 & I \end{pmatrix} \]
其中 \(N\) 是一个幂零矩阵(代表 \(T|_{\mathcal{N}(T)}\)),\(I\) 是一个可逆矩阵(代表 \(T|_{\mathcal{I}(T)}\))。
3. 与若尔当标准型的关系:Fitting分解是若尔当标准型理论的前置步骤。在代数闭域上,幂零分支 \(\mathcal{N}(T)\) 可以进一步分解为循环子空间的直和,从而得到若尔当块;而可逆分支 \(\mathcal{I}(T)\) 的特征值均非零,其若尔当块对角线元素也非零。
步骤五:总结与思考
幂零变换的Fitting分解(更准确地说,是任意线性变换的Fitting分解)提供了一个强大而清晰的框架:
- 结构层面:它将任意线性变换分解为一个幂零部分和一个可逆部分的直和。这揭示了变换的“破坏性”(幂零)和“保持性”(可逆)两种成分的分离。
- 计算层面:指数 \(r\) 给出了幂零部分“需要多少次作用归零”以及可逆部分“从多少次迭代开始像保持稳定”的明确界限。
- 理论价值:它是理解线性变换结构、推导若尔当标准型、以及研究模论中相关概念(如模的Fitting引理)的重要工具。
因此,从幂零变换的链性质出发,推广到一般变换的稳定链,最终得到Fitting分解,是一个从特殊到一般、从具体性质到抽象结构的经典范例,深刻体现了线性代数中“分解与分类”的核心思想。