特征值
字数 2067 2025-10-28 00:05:11

特征值

特征值是线性代数中与线性变换密切相关的一个核心概念。它帮助我们理解变换的“固有行为”。以下将从基础概念出发,逐步深入讲解特征值的定义、计算方法、几何意义及重要性质。


1. 背景与动机

考虑一个线性变换 \(T: V \to V\)(其中 \(V\) 是向量空间)。我们希望找到非零向量 \(\mathbf{v} \in V\),使得 \(T\) 作用在 \(\mathbf{v}\) 上时,仅对 \(\mathbf{v}\) 进行缩放而不改变其方向。即:

\[T(\mathbf{v}) = \lambda \mathbf{v}, \quad \lambda \in \mathbb{R} \text{(或 } \mathbb{C}\text{)} \]

这样的 \(\lambda\) 称为特征值,对应的非零向量 \(\mathbf{v}\) 称为特征向量


2. 严格定义

\(A\)\(n \times n\) 矩阵(表示线性变换 \(T\)),若存在标量 \(\lambda\) 和非零向量 \(\mathbf{v}\),满足:

\[A\mathbf{v} = \lambda \mathbf{v}, \]

\(\lambda\)\(A\) 的特征值,\(\mathbf{v}\) 是对应于 \(\lambda\) 的特征向量。


3. 特征方程与特征多项式

将等式改写为:

\[A\mathbf{v} - \lambda \mathbf{v} = 0 \implies (A - \lambda I)\mathbf{v} = 0, \]

其中 \(I\) 是单位矩阵。由于 \(\mathbf{v} \neq 0\),矩阵 \((A - \lambda I)\) 必须是奇异的(不可逆),因此其行列式为零:

\[\det(A - \lambda I) = 0. \]

这个方程称为特征方程。展开行列式会得到一个关于 \(\lambda\)\(n\) 次多项式,称为特征多项式

示例
\(A = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}\),则

\[\det(A - \lambda I) = \det \begin{pmatrix} 2-\lambda & 1 \\ 1 & 2-\lambda \end{pmatrix} = (2-\lambda)^2 - 1 = \lambda^2 - 4\lambda + 3. \]

解方程 \(\lambda^2 - 4\lambda + 3 = 0\) 得特征值 \(\lambda_1 = 1, \lambda_2 = 3\)


4. 特征空间与几何重数

对于每个特征值 \(\lambda\),所有满足 \((A - \lambda I)\mathbf{v} = 0\) 的向量 \(\mathbf{v}\) 构成一个子空间,称为特征空间 \(E_\lambda\)。其特征空间的维度称为 \(\lambda\)几何重数,即解空间的维数。

续上例

  • \(\lambda_1 = 1\):解 \((A - I)\mathbf{v} = 0\),即

\[\begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix} \mathbf{v} = 0 \implies \mathbf{v} = k \begin{pmatrix} 1 \\ -1 \end{pmatrix}. \]

特征空间由 \(\begin{pmatrix} 1 \\ -1 \end{pmatrix}\) 张成,几何重数为 1。


5. 代数重数与谱定理

特征值 \(\lambda\) 在特征多项式中作为根的重数称为代数重数。若代数重数大于几何重数,则矩阵不可对角化。

重要定理(谱定理):
\(A\) 是实对称矩阵(或更一般的厄米特矩阵),则:

  • 所有特征值均为实数。
  • 特征向量可构成正交基,即 \(A\) 可被正交对角化。

6. 应用与推广

  • 对角化:若 \(A\)\(n\) 个线性无关的特征向量,可写为 \(A = PDP^{-1}\),其中 \(D\) 是对角矩阵,对角线为特征值。
  • 动力系统:特征值决定线性微分方程解的稳定性(正部大于零则发散)。
  • 量子力学:算子的特征值对应物理量的观测值。

7. 数值计算与注意事项

  • 对于大型矩阵,特征值通常通过数值方法(如 QR 算法)计算。
  • 特征值对矩阵扰动敏感(病态问题),需谨慎处理。

通过以上步骤,特征值从直观的缩放概念逐步发展为矩阵分析的核心工具,广泛应用于工程、物理和数据科学等领域。

特征值 特征值是线性代数中与线性变换密切相关的一个核心概念。它帮助我们理解变换的“固有行为”。以下将从基础概念出发,逐步深入讲解特征值的定义、计算方法、几何意义及重要性质。 1. 背景与动机 考虑一个线性变换 \( T: V \to V \)(其中 \( V \) 是向量空间)。我们希望找到非零向量 \( \mathbf{v} \in V \),使得 \( T \) 作用在 \( \mathbf{v} \) 上时,仅对 \( \mathbf{v} \) 进行缩放而不改变其方向。即: \[ T(\mathbf{v}) = \lambda \mathbf{v}, \quad \lambda \in \mathbb{R} \text{(或 } \mathbb{C}\text{)} \] 这样的 \( \lambda \) 称为 特征值 ,对应的非零向量 \( \mathbf{v} \) 称为 特征向量 。 2. 严格定义 设 \( A \) 是 \( n \times n \) 矩阵(表示线性变换 \( T \)),若存在标量 \( \lambda \) 和非零向量 \( \mathbf{v} \),满足: \[ A\mathbf{v} = \lambda \mathbf{v}, \] 则 \( \lambda \) 是 \( A \) 的特征值,\( \mathbf{v} \) 是对应于 \( \lambda \) 的特征向量。 3. 特征方程与特征多项式 将等式改写为: \[ A\mathbf{v} - \lambda \mathbf{v} = 0 \implies (A - \lambda I)\mathbf{v} = 0, \] 其中 \( I \) 是单位矩阵。由于 \( \mathbf{v} \neq 0 \),矩阵 \( (A - \lambda I) \) 必须是奇异的(不可逆),因此其行列式为零: \[ \det(A - \lambda I) = 0. \] 这个方程称为 特征方程 。展开行列式会得到一个关于 \( \lambda \) 的 \( n \) 次多项式,称为 特征多项式 。 示例 : 设 \( A = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix} \),则 \[ \det(A - \lambda I) = \det \begin{pmatrix} 2-\lambda & 1 \\ 1 & 2-\lambda \end{pmatrix} = (2-\lambda)^2 - 1 = \lambda^2 - 4\lambda + 3. \] 解方程 \( \lambda^2 - 4\lambda + 3 = 0 \) 得特征值 \( \lambda_ 1 = 1, \lambda_ 2 = 3 \)。 4. 特征空间与几何重数 对于每个特征值 \( \lambda \),所有满足 \( (A - \lambda I)\mathbf{v} = 0 \) 的向量 \( \mathbf{v} \) 构成一个子空间,称为 特征空间 \( E_ \lambda \)。其特征空间的维度称为 \( \lambda \) 的 几何重数 ,即解空间的维数。 续上例 : 对 \( \lambda_ 1 = 1 \):解 \( (A - I)\mathbf{v} = 0 \),即 \[ \begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix} \mathbf{v} = 0 \implies \mathbf{v} = k \begin{pmatrix} 1 \\ -1 \end{pmatrix}. \] 特征空间由 \( \begin{pmatrix} 1 \\ -1 \end{pmatrix} \) 张成,几何重数为 1。 5. 代数重数与谱定理 特征值 \( \lambda \) 在特征多项式中作为根的重数称为 代数重数 。若代数重数大于几何重数,则矩阵不可对角化。 重要定理 (谱定理): 若 \( A \) 是实对称矩阵(或更一般的厄米特矩阵),则: 所有特征值均为实数。 特征向量可构成正交基,即 \( A \) 可被正交对角化。 6. 应用与推广 对角化 :若 \( A \) 有 \( n \) 个线性无关的特征向量,可写为 \( A = PDP^{-1} \),其中 \( D \) 是对角矩阵,对角线为特征值。 动力系统 :特征值决定线性微分方程解的稳定性(正部大于零则发散)。 量子力学 :算子的特征值对应物理量的观测值。 7. 数值计算与注意事项 对于大型矩阵,特征值通常通过数值方法(如 QR 算法)计算。 特征值对矩阵扰动敏感(病态问题),需谨慎处理。 通过以上步骤,特征值从直观的缩放概念逐步发展为矩阵分析的核心工具,广泛应用于工程、物理和数据科学等领域。