二次型的正交变换
字数 2030 2025-12-02 06:39:25

二次型的正交变换

我们先从线性代数中最基础的概念开始。一个二次型是变量的二次齐次多项式。在线性代数中,我们通常将其写为矩阵形式。对于一个实二次型 \(Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x}\),其中 \(A\) 是一个实对称矩阵,\(\mathbf{x}\) 是变量向量。

第一步:理解合同变换与标准型
在研究二次型时,一个核心问题是通过变量替换来简化它。我们引入一个可逆的线性变换 \(\mathbf{x} = P\mathbf{y}\)。将这个变换代入二次型:

\[Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} = (P\mathbf{y})^T A (P\mathbf{y}) = \mathbf{y}^T (P^T A P) \mathbf{y} \]

新的二次型对应的矩阵是 \(B = P^T A P\)。这种关系称为矩阵的合同。我们的目标是找到一个可逆矩阵 \(P\),使得 \(B = P^T A P\) 是一个尽可能简单的矩阵,通常是对角矩阵。这个过程称为二次型的对角化。对角化后的二次型只包含平方项,没有交叉项,这极大地简化了其性质的研究。

第二步:从简化到标准化——正交变换的引入
虽然通过合同变换总能将实对称矩阵对角化,但所使用的变换矩阵 \(P\) 通常不是正交矩阵。这意味着变换后的新坐标系可能不是标准正交的,这会使得讨论长度、角度等度量性质变得复杂。如果我们希望变换不仅简化二次型,还能保持几何结构(如向量的长度和夹角),我们就需要一种更特殊的变换。

这就是正交变换登场的原因。一个正交矩阵 \(Q\) 满足 \(Q^T Q = I\),即 \(Q^{-1} = Q^T\)。正交变换 \(\mathbf{x} = Q\mathbf{y}\) 的一个关键性质是它保持向量的内积和长度不变(即保持欧几里得几何结构)。

第三步:谱定理——正交对角化的理论基础
对于实对称矩阵 \(A\),存在一个极其优美的结论,称为实对称矩阵的谱定理。这个定理指出:
任何实对称矩阵 \(A\) 都可以被一个正交矩阵 \(Q\) 对角化。即存在正交矩阵 \(Q\),使得

\[Q^T A Q = Q^{-1} A Q = \Lambda \]

其中 \(\Lambda\) 是一个实对角矩阵,其对角线上的元素正是 \(A\) 的全部特征值。

这个定理是二次型理论的核心。它告诉我们,对于实二次型,我们总可以找到一个正交变换 \(\mathbf{x} = Q\mathbf{y}\),将其化为标准型:

\[Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} = \mathbf{y}^T (Q^T A Q) \mathbf{y} = \mathbf{y}^T \Lambda \mathbf{y} = \lambda_1 y_1^2 + \lambda_2 y_2^2 + \dots + \lambda_n y_n^2 \]

这里,\(\lambda_1, \lambda_2, \dots, \lambda_n\) 是矩阵 \(A\) 的特征值。这个化简过程就是二次型的正交变换,或者更具体地说,是通过正交变换将二次型化为标准型。

第四步:正交变换的几何与代数意义
从几何角度看,正交变换(如旋转和反射)不会改变二次型所对应的二次曲面(如椭圆、双曲面)的形状和取向,只是将其旋转到一个“主轴”位置。在新的坐标系下,这些主轴正好对齐于坐标轴。因此,特征值决定了曲面的类型(例如,所有特征值为正,则是椭球面),而特征向量指示了主轴的方向。

从代数角度看,正交变换将合同变换 (\(P^T A P\)) 和相似变换 (\(P^{-1} A P\)) 统一了起来。因为对于正交矩阵 \(Q\),有 \(Q^T = Q^{-1}\),所以合同变换 \(Q^T A Q\) 就等于相似变换 \(Q^{-1} A Q\)。这意味着,通过正交变换化简二次型,等价于将矩阵 \(A\) 相似对角化,其相似标准型就是由特征值构成的对角矩阵。

第五步:应用与推广
正交变换在二次型的分类中至关重要,特别是在判断二次型的正定性时。一个二次型是正定的(即对所有非零向量 \(\mathbf{x}\),有 \(Q(\mathbf{x}) > 0\)),当且仅当它的所有特征值都是正数。通过正交变换得到标准型后,这个判定变得一目了然。

这个概念可以推广到更一般的内积空间,而不仅限于标准的欧几里得空间。在任何内积空间上,都可以定义自伴算子的正交对角化问题,这构成了泛函分析中谱理论的基础。

二次型的正交变换 我们先从线性代数中最基础的概念开始。一个二次型是变量的二次齐次多项式。在线性代数中,我们通常将其写为矩阵形式。对于一个实二次型 \( Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} \),其中 \( A \) 是一个实对称矩阵,\( \mathbf{x} \) 是变量向量。 第一步:理解合同变换与标准型 在研究二次型时,一个核心问题是通过变量替换来简化它。我们引入一个可逆的线性变换 \( \mathbf{x} = P\mathbf{y} \)。将这个变换代入二次型: \[ Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} = (P\mathbf{y})^T A (P\mathbf{y}) = \mathbf{y}^T (P^T A P) \mathbf{y} \] 新的二次型对应的矩阵是 \( B = P^T A P \)。这种关系称为矩阵的 合同 。我们的目标是找到一个可逆矩阵 \( P \),使得 \( B = P^T A P \) 是一个尽可能简单的矩阵,通常是对角矩阵。这个过程称为二次型的 对角化 。对角化后的二次型只包含平方项,没有交叉项,这极大地简化了其性质的研究。 第二步:从简化到标准化——正交变换的引入 虽然通过合同变换总能将实对称矩阵对角化,但所使用的变换矩阵 \( P \) 通常不是正交矩阵。这意味着变换后的新坐标系可能不是标准正交的,这会使得讨论长度、角度等度量性质变得复杂。如果我们希望变换不仅简化二次型,还能保持几何结构(如向量的长度和夹角),我们就需要一种更特殊的变换。 这就是 正交变换 登场的原因。一个正交矩阵 \( Q \) 满足 \( Q^T Q = I \),即 \( Q^{-1} = Q^T \)。正交变换 \( \mathbf{x} = Q\mathbf{y} \) 的一个关键性质是它保持向量的内积和长度不变(即保持欧几里得几何结构)。 第三步:谱定理——正交对角化的理论基础 对于实对称矩阵 \( A \),存在一个极其优美的结论,称为 实对称矩阵的谱定理 。这个定理指出: 任何实对称矩阵 \( A \) 都可以被一个正交矩阵 \( Q \) 对角化。即存在正交矩阵 \( Q \),使得 \[ Q^T A Q = Q^{-1} A Q = \Lambda \] 其中 \( \Lambda \) 是一个实对角矩阵,其对角线上的元素正是 \( A \) 的全部特征值。 这个定理是二次型理论的核心。它告诉我们,对于实二次型,我们总可以找到一个 正交变换 \( \mathbf{x} = Q\mathbf{y} \),将其化为标准型: \[ Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} = \mathbf{y}^T (Q^T A Q) \mathbf{y} = \mathbf{y}^T \Lambda \mathbf{y} = \lambda_ 1 y_ 1^2 + \lambda_ 2 y_ 2^2 + \dots + \lambda_ n y_ n^2 \] 这里,\( \lambda_ 1, \lambda_ 2, \dots, \lambda_ n \) 是矩阵 \( A \) 的特征值。这个化简过程就是 二次型的正交变换 ,或者更具体地说,是通过正交变换将二次型化为标准型。 第四步:正交变换的几何与代数意义 从几何角度看,正交变换(如旋转和反射)不会改变二次型所对应的二次曲面(如椭圆、双曲面)的形状和取向,只是将其旋转到一个“主轴”位置。在新的坐标系下,这些主轴正好对齐于坐标轴。因此,特征值决定了曲面的类型(例如,所有特征值为正,则是椭球面),而特征向量指示了主轴的方向。 从代数角度看,正交变换将合同变换 (\(P^T A P\)) 和相似变换 (\(P^{-1} A P\)) 统一了起来。因为对于正交矩阵 \( Q \),有 \( Q^T = Q^{-1} \),所以合同变换 \( Q^T A Q \) 就等于相似变换 \( Q^{-1} A Q \)。这意味着,通过正交变换化简二次型,等价于将矩阵 \( A \) 相似对角化,其相似标准型就是由特征值构成的对角矩阵。 第五步:应用与推广 正交变换在二次型的分类中至关重要,特别是在判断二次型的 正定性 时。一个二次型是正定的(即对所有非零向量 \( \mathbf{x} \),有 \( Q(\mathbf{x}) > 0 \)),当且仅当它的所有特征值都是正数。通过正交变换得到标准型后,这个判定变得一目了然。 这个概念可以推广到更一般的内积空间,而不仅限于标准的欧几里得空间。在任何内积空间上,都可以定义自伴算子的正交对角化问题,这构成了泛函分析中谱理论的基础。