二次型的正交相似对角化
字数 3003 2025-12-09 14:54:37

二次型的正交相似对角化

好的,我们来讲一个新词条。这个概念是线性代数中连接二次型、对称矩阵和坐标变换的核心工具。我会从最基本的概念开始,循序渐进地构建起完整的知识体系。

第一步:从二次型到对称矩阵

  1. 二次型的定义:一个关于n个变量 \(x_1, x_2, \dots, x_n\)二次型,是一个所有项都是二次的齐次多项式。其一般形式为:
    \(Q(x_1, \dots, x_n) = \sum_{i=1}^{n} \sum_{j=1}^{n} a_{ij} x_i x_j\),其中 \(a_{ij}\) 是系数(通常为实数),并且我们通常约定 \(a_{ij} = a_{ji}\)(对称约定)。
    例如\(Q(x, y) = 2x^2 + 4xy + 5y^2\)

  2. 矩阵表示:任何一个二次型 \(Q\) 都可以唯一地表示为一个对称矩阵 \(A\) 的二次形式。具体方法是:

  • 将矩阵 \(A\) 的元素 \(a_{ij}\) 设为二次型中 \(x_i x_j\) 项系数的一半(当 \(i \neq j\) 时),主对角线元素 \(a_{ii}\) 设为 \(x_i^2\) 项的系数。
  • 用列向量 \(\mathbf{x} = (x_1, \dots, x_n)^T\) 表示变量。
  • 那么,二次型可写为:\(Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x}\)
    对于上例\(A = \begin{bmatrix} 2 & 2 \\ 2 & 5 \end{bmatrix}\),则 \(Q(x, y) = [x, y] \begin{bmatrix} 2 & 2 \\ 2 & 5 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix}\)

第二步:坐标变换与矩阵合同

  1. 坐标变换的动机:我们希望找到一个新坐标系(新变量),使得在这个新坐标系下,二次型的表达式尽可能简单,即只包含平方项,没有交叉项。这种形式称为标准形
    设新变量为 \(\mathbf{y} = (y_1, \dots, y_n)^T\)。新旧坐标之间的变换是线性的,可表示为 \(\mathbf{x} = P\mathbf{y}\),其中 \(P\) 是一个可逆的 \(n \times n\) 矩阵。

  2. 矩阵的合同关系:将变换 \(\mathbf{x} = P\mathbf{y}\) 代入 \(Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x}\),得到:
    \(Q(\mathbf{x}) = (P\mathbf{y})^T A (P\mathbf{y}) = \mathbf{y}^T (P^T A P) \mathbf{y}\)
    这个新表达式 \(\mathbf{y}^T (P^T A P) \mathbf{y}\) 仍然是关于 \(\mathbf{y}\) 的二次型,其对应的矩阵是 \(B = P^T A P\)
    关键点:我们称矩阵 \(B\) 与矩阵 \(A\)合同的。合同关系保持了矩阵的对称性和许多重要的惯性性质(如正负特征值的个数)。

第三步:引入正交相似

  1. 正交矩阵的优势:如果我们对变换矩阵 \(P\) 不加限制,通过合同变换(也称为“配方法”或“Lagrange法”)总可以将 \(A\) 化为对角矩阵 \(D = \operatorname{diag}(\lambda_1, \dots, \lambda_n)\),其中 \(D = P^T A P\)。但这通常不保持向量的长度和夹角。
    核心提升:如果我们要求 \(P\) 是一个正交矩阵(即满足 \(P^T = P^{-1}\)),那么坐标变换 \(\mathbf{x} = P\mathbf{y}\) 不仅简化二次型,而且是一个旋转/反射变换,它严格保持向量的内积、长度和夹角。这种保持几何结构的变换至关重要。

  2. 正交相似的定义:当 \(P\) 是正交矩阵时,合同关系 \(D = P^T A P\) 变为 \(D = P^{-1} A P\)。这不仅是合同,更是矩阵的相似变换。因此,我们称之为正交相似变换。通过正交相似变换将一个对称矩阵化为对角形,就叫做正交相似对角化

第四步:实现的工具——实对称矩阵的谱定理

  1. 理论基石实对称矩阵的谱定理 保证了正交相似对角化的可行性。该定理的核心结论是:
  • 任何实对称矩阵 \(A\) 的所有特征值都是实数
    • 对应于不同特征值的特征向量自动正交
    • 即使有重特征值,也一定能找到一组单位正交的特征向量基
  1. 对角化的具体步骤
    a. 求特征值:解特征方程 \(\det(A - \lambda I) = 0\),得到所有实特征值 \(\lambda_1, \lambda_2, \dots, \lambda_n\)
    b. 求正交特征向量:对每个特征值 \(\lambda_i\),解方程组 \((A - \lambda_i I)\mathbf{v} = 0\),求其特征子空间的一组基,并利用施密特正交化方法将其化为单位正交基。
    c. 构造正交矩阵:将所有求得的单位正交特征向量作为列向量,按顺序排列成一个矩阵 \(P = [\mathbf{p}_1, \mathbf{p}_2, \dots, \mathbf{p}_n]\)。由于这些向量两两正交且为单位长,\(P\) 必为正交矩阵 (\(P^T = P^{-1}\))。
    d. 得到对角形:必有 \(P^{-1} A P = P^T A P = D\),其中 \(D = \operatorname{diag}(\lambda_1, \lambda_2, \dots, \lambda_n)\)

第五步:几何与代数意义总结

  1. 几何解释:正交相似对角化 \(\mathbf{x} = P\mathbf{y}, \quad Q(\mathbf{x}) = \mathbf{y}^T D \mathbf{y} = \lambda_1 y_1^2 + \lambda_2 y_2^2 + \dots + \lambda_n y_n^2\) 意味着:
  • 我们找到了一个新的直角坐标系(由 \(P\) 的列向量,即 \(A\) 的单位特征向量张成)。
  • 在这个新坐标系下,二次型 \(Q\) 的表达式简化为纯粹的平方和,其“主轴”方向就是新坐标轴的方向。这就是“主轴定理”的核心。
  1. 代数意义:这完成了二次型化简的最高目标——在保持几何结构(正交性)的前提下,将其化为标准形。特征值 \(\lambda_i\) 的符号决定了二次曲面的类型(椭圆、双曲等),而其绝对值大小则反映了沿主轴的拉伸/压缩程度。

最终整合二次型的正交相似对角化,就是利用实对称矩阵必可正交相似于对角矩阵的谱定理,通过一个正交变换(旋转/反射)将二次型化为标准形的过程。它完美融合了二次型的代数表达、对称矩阵的谱理论和几何坐标变换,是处理二次型、二次曲面分类及优化问题的基础。

二次型的正交相似对角化 好的,我们来讲一个新词条。这个概念是线性代数中连接二次型、对称矩阵和坐标变换的核心工具。我会从最基本的概念开始,循序渐进地构建起完整的知识体系。 第一步:从二次型到对称矩阵 二次型的定义 :一个关于n个变量 \(x_ 1, x_ 2, \dots, x_ n\) 的 二次型 ,是一个所有项都是二次的齐次多项式。其一般形式为: \(Q(x_ 1, \dots, x_ n) = \sum_ {i=1}^{n} \sum_ {j=1}^{n} a_ {ij} x_ i x_ j\),其中 \(a_ {ij}\) 是系数(通常为实数),并且我们通常约定 \(a_ {ij} = a_ {ji}\)(对称约定)。 例如 :\(Q(x, y) = 2x^2 + 4xy + 5y^2\)。 矩阵表示 :任何一个二次型 \(Q\) 都可以唯一地表示为一个 对称矩阵 \(A\) 的二次形式。具体方法是: 将矩阵 \(A\) 的元素 \(a_ {ij}\) 设为二次型中 \(x_ i x_ j\) 项系数的一半(当 \(i \neq j\) 时),主对角线元素 \(a_ {ii}\) 设为 \(x_ i^2\) 项的系数。 用列向量 \(\mathbf{x} = (x_ 1, \dots, x_ n)^T\) 表示变量。 那么,二次型可写为:\(Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x}\)。 对于上例 :\(A = \begin{bmatrix} 2 & 2 \\ 2 & 5 \end{bmatrix}\),则 \(Q(x, y) = [ x, y ] \begin{bmatrix} 2 & 2 \\ 2 & 5 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix}\)。 第二步:坐标变换与矩阵合同 坐标变换的动机 :我们希望找到一个新坐标系(新变量),使得在这个新坐标系下,二次型的表达式尽可能简单,即 只包含平方项,没有交叉项 。这种形式称为 标准形 。 设新变量为 \(\mathbf{y} = (y_ 1, \dots, y_ n)^T\)。新旧坐标之间的变换是线性的,可表示为 \(\mathbf{x} = P\mathbf{y}\),其中 \(P\) 是一个可逆的 \(n \times n\) 矩阵。 矩阵的合同关系 :将变换 \(\mathbf{x} = P\mathbf{y}\) 代入 \(Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x}\),得到: \(Q(\mathbf{x}) = (P\mathbf{y})^T A (P\mathbf{y}) = \mathbf{y}^T (P^T A P) \mathbf{y}\)。 这个新表达式 \(\mathbf{y}^T (P^T A P) \mathbf{y}\) 仍然是关于 \(\mathbf{y}\) 的二次型,其对应的矩阵是 \(B = P^T A P\)。 关键点 :我们称矩阵 \(B\) 与矩阵 \(A\) 是 合同的 。合同关系保持了矩阵的对称性和许多重要的惯性性质(如正负特征值的个数)。 第三步:引入正交相似 正交矩阵的优势 :如果我们对变换矩阵 \(P\) 不加限制,通过合同变换(也称为“配方法”或“Lagrange法”)总可以将 \(A\) 化为对角矩阵 \(D = \operatorname{diag}(\lambda_ 1, \dots, \lambda_ n)\),其中 \(D = P^T A P\)。但这通常不保持向量的长度和夹角。 核心提升 :如果我们要求 \(P\) 是一个 正交矩阵 (即满足 \(P^T = P^{-1}\)),那么坐标变换 \(\mathbf{x} = P\mathbf{y}\) 不仅简化二次型,而且是一个 旋转/反射 变换,它严格保持向量的内积、长度和夹角。这种保持几何结构的变换至关重要。 正交相似的定义 :当 \(P\) 是正交矩阵时,合同关系 \(D = P^T A P\) 变为 \(D = P^{-1} A P\)。这不仅是合同,更是 矩阵的相似变换 。因此,我们称之为 正交相似变换 。通过正交相似变换将一个对称矩阵化为对角形,就叫做 正交相似对角化 。 第四步:实现的工具——实对称矩阵的谱定理 理论基石 : 实对称矩阵的谱定理 保证了正交相似对角化的可行性。该定理的核心结论是: 任何实对称矩阵 \(A\) 的所有特征值都是 实数 。 对应于不同特征值的特征向量自动 正交 。 即使有重特征值,也一定能找到一组 单位正交的特征向量基 。 对角化的具体步骤 : a. 求特征值 :解特征方程 \(\det(A - \lambda I) = 0\),得到所有实特征值 \(\lambda_ 1, \lambda_ 2, \dots, \lambda_ n\)。 b. 求正交特征向量 :对每个特征值 \(\lambda_ i\),解方程组 \((A - \lambda_ i I)\mathbf{v} = 0\),求其特征子空间的一组基,并利用 施密特正交化 方法将其化为单位正交基。 c. 构造正交矩阵 :将所有求得的单位正交特征向量作为列向量,按顺序排列成一个矩阵 \(P = [ \mathbf{p}_ 1, \mathbf{p}_ 2, \dots, \mathbf{p}_ n ]\)。由于这些向量两两正交且为单位长,\(P\) 必为正交矩阵 (\(P^T = P^{-1}\))。 d. 得到对角形 :必有 \(P^{-1} A P = P^T A P = D\),其中 \(D = \operatorname{diag}(\lambda_ 1, \lambda_ 2, \dots, \lambda_ n)\)。 第五步:几何与代数意义总结 几何解释 :正交相似对角化 \(\mathbf{x} = P\mathbf{y}, \quad Q(\mathbf{x}) = \mathbf{y}^T D \mathbf{y} = \lambda_ 1 y_ 1^2 + \lambda_ 2 y_ 2^2 + \dots + \lambda_ n y_ n^2\) 意味着: 我们找到了一个新的直角坐标系(由 \(P\) 的列向量,即 \(A\) 的单位特征向量张成)。 在这个新坐标系下,二次型 \(Q\) 的表达式简化为纯粹的平方和,其“主轴”方向就是新坐标轴的方向。这就是“主轴定理”的核心。 代数意义 :这完成了二次型化简的最高目标——在保持几何结构(正交性)的前提下,将其化为标准形。特征值 \(\lambda_ i\) 的符号决定了二次曲面的类型(椭圆、双曲等),而其绝对值大小则反映了沿主轴的拉伸/压缩程度。 最终整合 : 二次型的正交相似对角化 ,就是利用实对称矩阵必可正交相似于对角矩阵的谱定理,通过一个正交变换(旋转/反射)将二次型化为标准形的过程。它完美融合了二次型的代数表达、对称矩阵的谱理论和几何坐标变换,是处理二次型、二次曲面分类及优化问题的基础。