特征多项式
特征多项式是线性代数中与方阵紧密相关的一个重要概念。它建立了一个连接矩阵、其特征值和特征向量的桥梁。为了更好地理解它,我们从最基础的概念开始。
-
回顾:线性变换与特征值
首先,回忆一下,一个线性变换 T 作用于一个向量空间 V。如果一个非零向量 v 在经过变换 T 后,只是被简单地缩放(拉伸或压缩),而没有改变方向(或恰好反向),即满足 T(v) = λv,那么标量 λ 就被称为这个线性变换 T 的一个特征值,而向量 v 则被称为对应于特征值 λ 的特征向量。 -
从等式到方程
现在,我们将这个定义从抽象的线性变换具体到矩阵上。考虑一个 n×n 的方阵 A。寻找其特征值和特征向量,就是寻找满足方程 Av = λv 的标量 λ 和非零向量 v。
我们可以将这个方程重写:Av = λIv,其中 I 是 n 阶单位矩阵。然后,将所有项移到一边:Av - λIv = 0。利用矩阵乘法的分配律,我们得到:(A - λI)v = 0。 -
核心:齐次线性方程组的非零解
方程 (A - λI)v = 0 是一个齐次线性方程组。我们关心的是这个方程组何时存在非零解向量 v。根据线性代数的基本定理,一个齐次线性方程组有非零解的充要条件是其系数矩阵的行列式为零。
因此,为了找到特征值 λ,我们必须要求:det(A - λI) = 0。 -
特征多项式的定义
这个关键的表达式 det(A - λI) 就是我们要讲的特征多项式。- 具体来说,我们构造一个新矩阵 (A - λI),它是由矩阵 A 的每个主对角线上的元素都减去 λ 得到的。
- 然后,计算这个新矩阵的行列式。由于矩阵中包含变量 λ,这个行列式的结果将是一个关于变量 λ 的多项式。
因此,对于一个 n×n 矩阵 A,其特征多项式 p(λ) 定义为:p(λ) = det(A - λI)。
-
特征多项式的性质与求解步骤
- 次数:特征多项式 p(λ) 是一个关于 λ 的 n 次多项式。这是因为行列式的定义中包含 n! 项,每项是 n 个元素的乘积,而这 n 个元素恰好来自矩阵的不同行和不同列。当我们从主对角线上选取元素时,会得到 (a₁₁ - λ)(a₂₂ - λ)...(aₙₙ - λ) 这一项,它展开后的最高次项是 (-λ)ⁿ,所以多项式是 n 次的。
- 首一多项式:通常,我们会将特征多项式写成首一多项式(即最高次项系数为 1 的形式)。这可以通过将整个行列式结果乘以 (-1)ⁿ 来实现,即 p(λ) = det(λI - A)。这两种定义(det(A - λI) 或 det(λI - A))只相差一个符号 (-1)ⁿ,但它们的根(即特征值)是完全相同的。在理论推导中常用前者,在手工计算时后者有时更方便。
- 求特征值的步骤:
- 构造矩阵 (A - λI) 或 (λI - A)。
- 计算该矩阵的行列式,得到特征多项式 p(λ)。
- 解特征方程 p(λ) = 0。这个 n 次代数方程的 n 个根(包括实根和复根,重根按重数计算)就是矩阵 A 的全部特征值。
-
例子
考虑一个 2×2 矩阵 A = [4, 1; 2, 3]。- 步骤1:构造矩阵 A - λI = [4-λ, 1; 2, 3-λ]。
- 步骤2:计算特征多项式 p(λ) = det([4-λ, 1; 2, 3-λ]) = (4-λ)(3-λ) - (1)(2) = λ² - 7λ + 10。
- 步骤3:解特征方程 λ² - 7λ + 10 = 0。因式分解得 (λ-2)(λ-5)=0。所以特征值为 λ₁=2 和 λ₂=5。
-
特征多项式的意义与应用
- 特征值的载体:特征多项式的根就是矩阵的特征值。这是它最直接和最重要的作用。
- 矩阵的相似不变量:如果两个矩阵 A 和 B 是相似的(即存在可逆矩阵 P 使得 B = P⁻¹AP),那么它们有相同的特征多项式。因此,特征多项式是矩阵的一个相似不变量。
- 凯莱-哈密顿定理:一个非常重要的定理指出,每个矩阵都满足它自己的特征方程。也就是说,如果将特征多项式 p(λ) = λⁿ + cₙ₋₁λⁿ⁻¹ + ... + c₁λ + c₀ 中的变量 λ 替换为矩阵 A 本身,会得到零矩阵:p(A) = Aⁿ + cₙ₋₁Aⁿ⁻¹ + ... + c₁A + c₀I = 0。这个定理在线性代数和矩阵理论中有深远的影响。
- 对角化的判断:特征多项式可以帮助判断一个矩阵是否可对角化。虽然特征多项式本身不能完全决定对角化性质(还需要考虑特征子空间的维数),但它是分析过程中的第一步。例如,如果特征多项式有 n 个互不相同的根,那么矩阵一定可对角化。
总结来说,特征多项式通过一个简洁的行列式公式,将寻找矩阵特征值的问题转化为求解多项式方程的问题。它不仅是计算特征值的工具,其本身作为矩阵的一个核心不变量,在理解矩阵的深层结构和性质方面发挥着基础性作用。