二次型的正交相似
我们先从线性代数中的矩阵相似概念开始。设 \(A, B\) 是 \(n \times n\) 矩阵。如果存在可逆矩阵 \(P\) 使得 \(B = P^{-1} A P\),则称 \(A\) 与 \(B\) 相似。相似矩阵代表同一个线性变换在不同基下的矩阵,它们具有相同的特征值、迹、行列式等许多不变量。
现在考虑一个与内积或度量相关的概念。假设我们在实数域 \(\mathbb{R}\) 上考虑问题,并且向量空间配备了标准内积。如果我们希望变换矩阵时,同时保持内积结构(即保持向量的长度和夹角),那么我们应该要求基变换矩阵 \(P\) 是正交矩阵,即满足 \(P^T P = I\)(其中 \(P^T\) 是 \(P\) 的转置)。
将相似关系中的可逆矩阵 \(P\) 替换为正交矩阵 \(Q\),我们得到一种更强的相似关系:如果存在正交矩阵 \(Q\) 使得 \(B = Q^T A Q\),则称 \(A\) 与 \(B\) 正交相似。由于对于正交矩阵有 \(Q^{-1} = Q^T\),所以这个关系是相似关系的一种特殊情况。正交相似意味着矩阵不仅在代数上是等价的,在几何度量意义上也是等价的。
现在,我们将这个概念与二次型联系起来。一个 \(n\) 元实二次型可以写成 \(f(x) = x^T A x\) 的形式,其中 \(x = (x_1, \dots, x_n)^T\) 是变元向量,\(A\) 是一个实对称矩阵。对称矩阵是研究二次型的自然对象。
对二次型进行变元替换(即坐标变换)是化简和研究它的重要方法。设我们进行一个可逆线性替换 \(x = P y\),其中 \(P\) 是可逆矩阵。那么新的二次型为:
\(f(x) = (P y)^T A (P y) = y^T (P^T A P) y\)。
新二次型对应的矩阵是 \(B = P^T A P\)。如果 \(P\) 是正交矩阵,那么这个变换就是正交变换(即保持内积不变的线性变换),此时得到的矩阵 \(B = Q^T A Q\) 就是 \(A\) 的正交相似矩阵。
对于实对称矩阵,有一个极其重要的定理:实对称矩阵必可正交相似于对角矩阵。也就是说,存在一个正交矩阵 \(Q\),使得 \(Q^T A Q = \Lambda\),其中 \(\Lambda\) 是一个对角矩阵,其对角线上的元素正是 \(A\) 的特征值。
这个定理对二次型意味着:任何一个实二次型 \(f(x) = x^T A x\) 都可以通过一个正交变换 \(x = Q y\)(这对应于旋转或反射坐标轴)化为标准形 \(f(x) = \lambda_1 y_1^2 + \lambda_2 y_2^2 + \dots + \lambda_n y_n^2\),其中 \(\lambda_1, \dots, \lambda_n\) 是矩阵 \(A\) 的特征值。这个化简过程同时对角化了二次型和其所关联的对称双线性形式。
正交相似比一般的相似或合同(即 \(B = P^T A P\))更强,因为它要求变换矩阵是正交的。对于实对称矩阵,正交相似分类完全由特征值决定:两个实对称矩阵正交相似当且仅当它们有相同的特征值(计入重数)。这是因为正交相似标准形(特征值对角矩阵)在特征值的排列意义下是唯一的。
正交相似理论在线性代数、物理、工程等领域有广泛应用。例如,在力学中,它用于求惯性张量的主轴;在振动理论中,用于解耦多自由度系统的运动方程。它揭示了二次型或对称变换在保持几何度量性质的前提下最简化的形式。