二次型的正交变换
我们先从线性代数中最基础的概念开始。一个二次型是变量的二次齐次多项式。在线性代数中,我们通常将其写为矩阵形式。对于一个实二次型 \(Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x}\),其中 \(A\) 是一个实对称矩阵,\(\mathbf{x}\) 是变量向量。
第一步:理解合同变换与标准型
在研究二次型时,一个核心问题是通过变量替换来简化它。我们引入一个可逆的线性变换 \(\mathbf{x} = P\mathbf{y}\)。将这个变换代入二次型:
\[Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} = (P\mathbf{y})^T A (P\mathbf{y}) = \mathbf{y}^T (P^T A P) \mathbf{y} \]
新的二次型对应的矩阵是 \(B = P^T A P\)。这种关系称为矩阵的合同。我们的目标是找到一个可逆矩阵 \(P\),使得 \(B = P^T A P\) 是一个尽可能简单的矩阵,通常是对角矩阵。这个过程称为二次型的对角化。对角化后的二次型只包含平方项,没有交叉项,这极大地简化了其性质的研究。
第二步:从简化到标准化——正交变换的引入
虽然通过合同变换总能将实对称矩阵对角化,但所使用的变换矩阵 \(P\) 通常不是正交矩阵。这意味着变换后的新坐标系可能不是标准正交的,这会使得讨论长度、角度等度量性质变得复杂。如果我们希望变换不仅简化二次型,还能保持几何结构(如向量的长度和夹角),我们就需要一种更特殊的变换。
这就是正交变换登场的原因。一个正交矩阵 \(Q\) 满足 \(Q^T Q = I\),即 \(Q^{-1} = Q^T\)。正交变换 \(\mathbf{x} = Q\mathbf{y}\) 的一个关键性质是它保持向量的内积和长度不变(即保持欧几里得几何结构)。
第三步:谱定理——正交对角化的理论基础
对于实对称矩阵 \(A\),存在一个极其优美的结论,称为实对称矩阵的谱定理。这个定理指出:
任何实对称矩阵 \(A\) 都可以被一个正交矩阵 \(Q\) 对角化。即存在正交矩阵 \(Q\),使得
\[Q^T A Q = Q^{-1} A Q = \Lambda \]
其中 \(\Lambda\) 是一个实对角矩阵,其对角线上的元素正是 \(A\) 的全部特征值。
这个定理是二次型理论的核心。它告诉我们,对于实二次型,我们总可以找到一个正交变换 \(\mathbf{x} = Q\mathbf{y}\),将其化为标准型:
\[Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} = \mathbf{y}^T (Q^T A Q) \mathbf{y} = \mathbf{y}^T \Lambda \mathbf{y} = \lambda_1 y_1^2 + \lambda_2 y_2^2 + \dots + \lambda_n y_n^2 \]
这里,\(\lambda_1, \lambda_2, \dots, \lambda_n\) 是矩阵 \(A\) 的特征值。这个化简过程就是二次型的正交变换,或者更具体地说,是通过正交变换将二次型化为标准型。
第四步:正交变换的几何与代数意义
从几何角度看,正交变换(如旋转和反射)不会改变二次型所对应的二次曲面(如椭圆、双曲面)的形状和取向,只是将其旋转到一个“主轴”位置。在新的坐标系下,这些主轴正好对齐于坐标轴。因此,特征值决定了曲面的类型(例如,所有特征值为正,则是椭球面),而特征向量指示了主轴的方向。
从代数角度看,正交变换将合同变换 (\(P^T A P\)) 和相似变换 (\(P^{-1} A P\)) 统一了起来。因为对于正交矩阵 \(Q\),有 \(Q^T = Q^{-1}\),所以合同变换 \(Q^T A Q\) 就等于相似变换 \(Q^{-1} A Q\)。这意味着,通过正交变换化简二次型,等价于将矩阵 \(A\) 相似对角化,其相似标准型就是由特征值构成的对角矩阵。
第五步:应用与推广
正交变换在二次型的分类中至关重要,特别是在判断二次型的正定性时。一个二次型是正定的(即对所有非零向量 \(\mathbf{x}\),有 \(Q(\mathbf{x}) > 0\)),当且仅当它的所有特征值都是正数。通过正交变换得到标准型后,这个判定变得一目了然。
这个概念可以推广到更一般的内积空间,而不仅限于标准的欧几里得空间。在任何内积空间上,都可以定义自伴算子的正交对角化问题,这构成了泛函分析中谱理论的基础。