特征值
特征值是线性代数中与线性变换密切相关的一个核心概念。它帮助我们理解变换的“固有行为”。以下将从基础概念出发,逐步深入讲解特征值的定义、计算方法、几何意义及重要性质。
1. 背景与动机
考虑一个线性变换 \(T: V \to V\)(其中 \(V\) 是向量空间)。我们希望找到非零向量 \(\mathbf{v} \in V\),使得 \(T\) 作用在 \(\mathbf{v}\) 上时,仅对 \(\mathbf{v}\) 进行缩放而不改变其方向。即:
\[T(\mathbf{v}) = \lambda \mathbf{v}, \quad \lambda \in \mathbb{R} \text{(或 } \mathbb{C}\text{)} \]
这样的 \(\lambda\) 称为特征值,对应的非零向量 \(\mathbf{v}\) 称为特征向量。
2. 严格定义
设 \(A\) 是 \(n \times n\) 矩阵(表示线性变换 \(T\)),若存在标量 \(\lambda\) 和非零向量 \(\mathbf{v}\),满足:
\[A\mathbf{v} = \lambda \mathbf{v}, \]
则 \(\lambda\) 是 \(A\) 的特征值,\(\mathbf{v}\) 是对应于 \(\lambda\) 的特征向量。
3. 特征方程与特征多项式
将等式改写为:
\[A\mathbf{v} - \lambda \mathbf{v} = 0 \implies (A - \lambda I)\mathbf{v} = 0, \]
其中 \(I\) 是单位矩阵。由于 \(\mathbf{v} \neq 0\),矩阵 \((A - \lambda I)\) 必须是奇异的(不可逆),因此其行列式为零:
\[\det(A - \lambda I) = 0. \]
这个方程称为特征方程。展开行列式会得到一个关于 \(\lambda\) 的 \(n\) 次多项式,称为特征多项式。
示例:
设 \(A = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}\),则
\[\det(A - \lambda I) = \det \begin{pmatrix} 2-\lambda & 1 \\ 1 & 2-\lambda \end{pmatrix} = (2-\lambda)^2 - 1 = \lambda^2 - 4\lambda + 3. \]
解方程 \(\lambda^2 - 4\lambda + 3 = 0\) 得特征值 \(\lambda_1 = 1, \lambda_2 = 3\)。
4. 特征空间与几何重数
对于每个特征值 \(\lambda\),所有满足 \((A - \lambda I)\mathbf{v} = 0\) 的向量 \(\mathbf{v}\) 构成一个子空间,称为特征空间 \(E_\lambda\)。其特征空间的维度称为 \(\lambda\) 的几何重数,即解空间的维数。
续上例:
- 对 \(\lambda_1 = 1\):解 \((A - I)\mathbf{v} = 0\),即
\[\begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix} \mathbf{v} = 0 \implies \mathbf{v} = k \begin{pmatrix} 1 \\ -1 \end{pmatrix}. \]
特征空间由 \(\begin{pmatrix} 1 \\ -1 \end{pmatrix}\) 张成,几何重数为 1。
5. 代数重数与谱定理
特征值 \(\lambda\) 在特征多项式中作为根的重数称为代数重数。若代数重数大于几何重数,则矩阵不可对角化。
重要定理(谱定理):
若 \(A\) 是实对称矩阵(或更一般的厄米特矩阵),则:
- 所有特征值均为实数。
- 特征向量可构成正交基,即 \(A\) 可被正交对角化。
6. 应用与推广
- 对角化:若 \(A\) 有 \(n\) 个线性无关的特征向量,可写为 \(A = PDP^{-1}\),其中 \(D\) 是对角矩阵,对角线为特征值。
- 动力系统:特征值决定线性微分方程解的稳定性(正部大于零则发散)。
- 量子力学:算子的特征值对应物理量的观测值。
7. 数值计算与注意事项
- 对于大型矩阵,特征值通常通过数值方法(如 QR 算法)计算。
- 特征值对矩阵扰动敏感(病态问题),需谨慎处理。
通过以上步骤,特征值从直观的缩放概念逐步发展为矩阵分析的核心工具,广泛应用于工程、物理和数据科学等领域。