二次型的配方法
我们从二次型的最基本形式开始。一个二次型是指一个齐二次多项式。例如,在变量 \(x_1, x_2, \dots, x_n\) 上的二次型可以写成:
\[Q(x_1, \dots, x_n) = \sum_{i=1}^n \sum_{j=1}^n a_{ij} x_i x_j \]
其中系数 \(a_{ij}\) 来自某个域(如有理数域、实数域等),并且通常要求 \(a_{ij} = a_{ji}\)(对称性)。我们可以将其与一个对称矩阵 \(A\) 联系起来,使得 \(Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x}\),其中 \(\mathbf{x} = (x_1, \dots, x_n)^T\)。
配方法的核心目标是通过一系列变量替换(坐标变换),将二次型化简为仅包含平方项的形式,即:
\[Q = c_1 y_1^2 + c_2 y_2^2 + \dots + c_r y_r^2 \]
其中 \(c_i\) 是常数,\(r\) 是二次型的秩(即矩阵 \(A\) 的秩)。这种形式称为标准形。
步骤一:单个变量的配方
考虑一个简单的例子:\(Q(x, y) = x^2 + 4xy + 3y^2\)。
- 首先,关注包含 \(x\) 的项:\(x^2 + 4xy\)。
- 我们的目标是将其写成一个完全平方。注意到 \((x + 2y)^2 = x^2 + 4xy + 4y^2\)。
- 因此,我们可以将原二次型改写为:
\[ Q(x, y) = (x^2 + 4xy + 4y^2) + 3y^2 - 4y^2 = (x + 2y)^2 - y^2 \]
- 现在,我们引入新变量 \(y_1 = x + 2y\) 和 \(y_2 = y\)。那么二次型就化为了标准形:\(Q = y_1^2 - y_2^2\)。
这个过程就是“配方”:我们通过添加和减去一个合适的常数(这里是 \(4y^2 - 4y^2\)),将混合项 \(4xy\) “吸收”进一个平方项里。
步骤二:多个变量的系统化配方
对于更一般的二次型,我们需要一个系统化的步骤。考虑 \(Q(x, y, z) = x^2 + 2y^2 + 3z^2 + 4xy + 6xz + 8yz\)。
- 集中一个变量:首先,将所有包含 \(x\) 的项集中起来:
\(x^2 + 4xy + 6xz\) - 配方:将其视为 \(x\) 的二次三项式,对 \(x\) 进行配方。
\[ x^2 + 4xy + 6xz = x^2 + 2x(2y + 3z) \]
配方后得到:\([x + (2y+3z)]^2 - (2y+3z)^2\)
3. 代入并展开:将配方结果代回原二次型:
\[ Q = [x + 2y + 3z]^2 - (4y^2 + 12yz + 9z^2) + 2y^2 + 3z^2 + 8yz \]
\[ Q = [x + 2y + 3z]^2 - 2y^2 - 4yz - 6z^2 \]
现在,二次型中不再有包含 \(x\) 的混合项了。
4. 重复过程:对剩下的变量 \(y\) 和 \(z\) 构成的二次型 \(Q‘ = -2y^2 - 4yz - 6z^2\) 重复上述过程。
a. 集中包含 \(y\) 的项:\(-2y^2 - 4yz = -2(y^2 + 2yz)\)
b. 对 \(y\) 配方:\(y^2 + 2yz = (y+z)^2 - z^2\)
c. 代入:\(Q’ = -2[(y+z)^2 - z^2] - 6z^2 = -2(y+z)^2 + 2z^2 - 6z^2 = -2(y+z)^2 - 4z^2\)
5. 得到标准形:将第二步的结果代回第一步的 \(Q\) 中:
\[ Q = [x + 2y + 3z]^2 - 2(y+z)^2 - 4z^2 \]
- 变量替换:令 \(u = x + 2y + 3z\), \(v = y + z\), \(w = z\)。这是一个可逆的线性变换(因为其系数矩阵是满秩的)。最终得到标准形:
\[ Q(u, v, w) = u^2 - 2v^2 - 4w^2 \]
步骤三:与矩阵合同变换的联系
上述代数过程对应于矩阵论中的“合同变换”。二次型 \(Q = \mathbf{x}^T A \mathbf{x}\) 的配方过程,等价于寻找一个可逆矩阵 \(P\),使得 \(P^T A P\) 是一个对角矩阵 \(D\)。新的变量 \(\mathbf{y}\) 由 \(\mathbf{x} = P\mathbf{y}\) 定义,那么 \(Q = \mathbf{x}^T A \mathbf{x} = (P\mathbf{y})^T A (P\mathbf{y}) = \mathbf{y}^T (P^T A P) \mathbf{y} = \mathbf{y}^T D \mathbf{y}\),这就是标准形。
我们例子中的变量替换 \(\mathbf{x} = P\mathbf{y}\) 为:
\[\begin{bmatrix} x \\ y \\ z \end{bmatrix} = \begin{bmatrix} 1 & -2 & 1 \\ 0 & 1 & -1 \\ 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} u \\ v \\ w \end{bmatrix} \]
可以验证,\(P^T A P\) 确实是对角矩阵 \(\operatorname{diag}(1, -2, -4)\)。
步骤四:惯性定理与实二次型的分类
在实数域上,配方法可以进一步简化。通过另一个缩放性的变量替换(例如,令 \(u‘ = u, v’ = \sqrt{2}v, w‘ = 2w\)),我们可以将标准形中的系数化为 \(1\) 或 \(-1\)。这就是“规范形”。西尔维斯特惯性定理指出,在实二次型的规范形 \(y_1^2 + \dots + y_p^2 - y_{p+1}^2 - \dots - y_r^2\) 中,正平方项的个数 \(p\) 和负平方项的个数 \(r-p\) 是固定不变的,由二次型本身决定,与配方过程无关。这对二次型的定性分析(如正定、负定)至关重要。