二次型的正交变换

字数 2030 2025-12-02 06:39:25

二次型的正交变换

我们先从线性代数中最基础的概念开始。一个二次型是变量的二次齐次多项式。在线性代数中，我们通常将其写为矩阵形式。对于一个实二次型 \(Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x}\)，其中 \(A\) 是一个实对称矩阵，\(\mathbf{x}\) 是变量向量。

第一步：理解合同变换与标准型
在研究二次型时，一个核心问题是通过变量替换来简化它。我们引入一个可逆的线性变换 \(\mathbf{x} = P\mathbf{y}\)。将这个变换代入二次型：

\[Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} = (P\mathbf{y})^T A (P\mathbf{y}) = \mathbf{y}^T (P^T A P) \mathbf{y} \]

新的二次型对应的矩阵是 \(B = P^T A P\)。这种关系称为矩阵的合同。我们的目标是找到一个可逆矩阵 \(P\)，使得 \(B = P^T A P\) 是一个尽可能简单的矩阵，通常是对角矩阵。这个过程称为二次型的对角化。对角化后的二次型只包含平方项，没有交叉项，这极大地简化了其性质的研究。

第二步：从简化到标准化——正交变换的引入
虽然通过合同变换总能将实对称矩阵对角化，但所使用的变换矩阵 \(P\) 通常不是正交矩阵。这意味着变换后的新坐标系可能不是标准正交的，这会使得讨论长度、角度等度量性质变得复杂。如果我们希望变换不仅简化二次型，还能保持几何结构（如向量的长度和夹角），我们就需要一种更特殊的变换。

这就是正交变换登场的原因。一个正交矩阵 \(Q\) 满足 \(Q^T Q = I\)，即 \(Q^{-1} = Q^T\)。正交变换 \(\mathbf{x} = Q\mathbf{y}\) 的一个关键性质是它保持向量的内积和长度不变（即保持欧几里得几何结构）。

第三步：谱定理——正交对角化的理论基础
对于实对称矩阵 \(A\)，存在一个极其优美的结论，称为实对称矩阵的谱定理。这个定理指出：
任何实对称矩阵 \(A\) 都可以被一个正交矩阵 \(Q\) 对角化。即存在正交矩阵 \(Q\)，使得

\[Q^T A Q = Q^{-1} A Q = \Lambda \]

其中 \(\Lambda\) 是一个实对角矩阵，其对角线上的元素正是 \(A\) 的全部特征值。

这个定理是二次型理论的核心。它告诉我们，对于实二次型，我们总可以找到一个正交变换 \(\mathbf{x} = Q\mathbf{y}\)，将其化为标准型：

\[Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} = \mathbf{y}^T (Q^T A Q) \mathbf{y} = \mathbf{y}^T \Lambda \mathbf{y} = \lambda_1 y_1^2 + \lambda_2 y_2^2 + \dots + \lambda_n y_n^2 \]

这里，\(\lambda_1, \lambda_2, \dots, \lambda_n\) 是矩阵 \(A\) 的特征值。这个化简过程就是二次型的正交变换，或者更具体地说，是通过正交变换将二次型化为标准型。

第四步：正交变换的几何与代数意义
从几何角度看，正交变换（如旋转和反射）不会改变二次型所对应的二次曲面（如椭圆、双曲面）的形状和取向，只是将其旋转到一个“主轴”位置。在新的坐标系下，这些主轴正好对齐于坐标轴。因此，特征值决定了曲面的类型（例如，所有特征值为正，则是椭球面），而特征向量指示了主轴的方向。

从代数角度看，正交变换将合同变换 (\(P^T A P\)) 和相似变换 (\(P^{-1} A P\)) 统一了起来。因为对于正交矩阵 \(Q\)，有 \(Q^T = Q^{-1}\)，所以合同变换 \(Q^T A Q\) 就等于相似变换 \(Q^{-1} A Q\)。这意味着，通过正交变换化简二次型，等价于将矩阵 \(A\) 相似对角化，其相似标准型就是由特征值构成的对角矩阵。

第五步：应用与推广
正交变换在二次型的分类中至关重要，特别是在判断二次型的正定性时。一个二次型是正定的（即对所有非零向量 \(\mathbf{x}\)，有 \(Q(\mathbf{x}) > 0\)），当且仅当它的所有特征值都是正数。通过正交变换得到标准型后，这个判定变得一目了然。

这个概念可以推广到更一般的内积空间，而不仅限于标准的欧几里得空间。在任何内积空间上，都可以定义自伴算子的正交对角化问题，这构成了泛函分析中谱理论的基础。

二次型的正交变换我们先从线性代数中最基础的概念开始。一个二次型是变量的二次齐次多项式。在线性代数中，我们通常将其写为矩阵形式。对于一个实二次型 \( Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} \)，其中 \( A \) 是一个实对称矩阵，\( \mathbf{x} \) 是变量向量。第一步：理解合同变换与标准型在研究二次型时，一个核心问题是通过变量替换来简化它。我们引入一个可逆的线性变换 \( \mathbf{x} = P\mathbf{y} \)。将这个变换代入二次型： \[ Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} = (P\mathbf{y})^T A (P\mathbf{y}) = \mathbf{y}^T (P^T A P) \mathbf{y} \] 新的二次型对应的矩阵是 \( B = P^T A P \)。这种关系称为矩阵的合同。我们的目标是找到一个可逆矩阵 \( P \)，使得 \( B = P^T A P \) 是一个尽可能简单的矩阵，通常是对角矩阵。这个过程称为二次型的对角化。对角化后的二次型只包含平方项，没有交叉项，这极大地简化了其性质的研究。第二步：从简化到标准化——正交变换的引入虽然通过合同变换总能将实对称矩阵对角化，但所使用的变换矩阵 \( P \) 通常不是正交矩阵。这意味着变换后的新坐标系可能不是标准正交的，这会使得讨论长度、角度等度量性质变得复杂。如果我们希望变换不仅简化二次型，还能保持几何结构（如向量的长度和夹角），我们就需要一种更特殊的变换。这就是正交变换登场的原因。一个正交矩阵 \( Q \) 满足 \( Q^T Q = I \)，即 \( Q^{-1} = Q^T \)。正交变换 \( \mathbf{x} = Q\mathbf{y} \) 的一个关键性质是它保持向量的内积和长度不变（即保持欧几里得几何结构）。第三步：谱定理——正交对角化的理论基础对于实对称矩阵 \( A \)，存在一个极其优美的结论，称为实对称矩阵的谱定理。这个定理指出：任何实对称矩阵 \( A \) 都可以被一个正交矩阵 \( Q \) 对角化。即存在正交矩阵 \( Q \)，使得 \[ Q^T A Q = Q^{-1} A Q = \Lambda \] 其中 \( \Lambda \) 是一个实对角矩阵，其对角线上的元素正是 \( A \) 的全部特征值。这个定理是二次型理论的核心。它告诉我们，对于实二次型，我们总可以找到一个正交变换 \( \mathbf{x} = Q\mathbf{y} \)，将其化为标准型： \[ Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} = \mathbf{y}^T (Q^T A Q) \mathbf{y} = \mathbf{y}^T \Lambda \mathbf{y} = \lambda_ 1 y_ 1^2 + \lambda_ 2 y_ 2^2 + \dots + \lambda_ n y_ n^2 \] 这里，\( \lambda_ 1, \lambda_ 2, \dots, \lambda_ n \) 是矩阵 \( A \) 的特征值。这个化简过程就是二次型的正交变换，或者更具体地说，是通过正交变换将二次型化为标准型。第四步：正交变换的几何与代数意义从几何角度看，正交变换（如旋转和反射）不会改变二次型所对应的二次曲面（如椭圆、双曲面）的形状和取向，只是将其旋转到一个“主轴”位置。在新的坐标系下，这些主轴正好对齐于坐标轴。因此，特征值决定了曲面的类型（例如，所有特征值为正，则是椭球面），而特征向量指示了主轴的方向。从代数角度看，正交变换将合同变换 (\(P^T A P\)) 和相似变换 (\(P^{-1} A P\)) 统一了起来。因为对于正交矩阵 \( Q \)，有 \( Q^T = Q^{-1} \)，所以合同变换 \( Q^T A Q \) 就等于相似变换 \( Q^{-1} A Q \)。这意味着，通过正交变换化简二次型，等价于将矩阵 \( A \) 相似对角化，其相似标准型就是由特征值构成的对角矩阵。第五步：应用与推广正交变换在二次型的分类中至关重要，特别是在判断二次型的正定性时。一个二次型是正定的（即对所有非零向量 \( \mathbf{x} \)，有 \( Q(\mathbf{x}) > 0 \)），当且仅当它的所有特征值都是正数。通过正交变换得到标准型后，这个判定变得一目了然。这个概念可以推广到更一般的内积空间，而不仅限于标准的欧几里得空间。在任何内积空间上，都可以定义自伴算子的正交对角化问题，这构成了泛函分析中谱理论的基础。