二次型的秩与符号差(Rank and Signature of a Quadratic Form)
好的,我们开始讲解“二次型的秩与符号差”。我会从最基本的概念出发,循序渐进地解释,确保每个步骤都清晰易懂。
1. 预备知识:二次型是什么?
首先,我们需要明确“二次型”在数论和代数中的基本定义。
- 直观理解:你可以把二次型想象成一个“齐二次多项式”。所谓“齐”,是指每一项的总次数(所有变量的指数和)都相同,且是2。
- 正式定义:设 \(x_1, x_2, ..., x_n\) 是变量。一个二次型 \(Q\) 是一个形如
\[ Q(x_1, ..., x_n) = \sum_{1 \le i \le j \le n} a_{ij} x_i x_j \]
的表达式,其中系数 \(a_{ij}\) 通常取自某个域(如实数域 ℝ、有理数域 ℚ 等)。注意,交叉项 \(x_i x_j (i \neq j)\) 的系数有时会写成 \(2a_{ij}\) 以使矩阵对称,但上述是更通用的写法。
例子:
- \(Q(x, y) = x^2 + 3xy + 2y^2\) 是一个二元二次型。
- \(Q(x, y, z) = x^2 + y^2 - z^2\) 是一个三元二次型。
2. 矩阵表示:从多项式到线性代数
为了更有效地研究二次型,我们将其与矩阵联系起来。这是理解秩和符号差的关键一步。
- 对称矩阵:任何一个二次型 \(Q\) 都可以唯一地表示为一个对称矩阵 \(A\) 的二次型形式:
\[ Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} \]
其中 \(\mathbf{x} = (x_1, ..., x_n)^T\) 是列向量,\(\mathbf{x}^T\) 是其转置(行向量)。
- 构造方法:矩阵 \(A = (a_{ij})\) 的对角元 \(a_{ii}\) 就是 \(x_i^2\) 的系数。而非对角元 \(a_{ij} (i \neq j)\) 是 \(x_i x_j\) 项系数的一半(因为 \(x_i x_j\) 和 \(x_j x_i\) 是同一项,在矩阵乘法中会出现两次)。
例子:
- 对于 \(Q(x, y) = x^2 + 3xy + 2y^2\),我们可以写成:
\[ (x, y) \begin{pmatrix} 1 & 1.5 \\ 1.5 & 2 \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix} \]
这里 \(3xy\) 的系数 3 被平分到矩阵的两个非对角位置(1.5 和 1.5)。
3. 核心概念一:秩 (Rank)
现在,我们有了二次型对应的对称矩阵 \(A\)。线性代数告诉我们,矩阵有一个非常重要的不变量——秩。
- 定义:二次型 \(Q\) 的秩,就是其对应矩阵 \(A\) 的秩。矩阵的秩定义为矩阵中线性无关的行(或列)的最大数目。
- 几何/代数意义:
- 满秩 vs 退化:如果秩等于变量个数 \(n\),我们称 \(Q\) 是非退化的。如果秩 \(r < n\),则称 \(Q\) 是退化的。
- 变量替换下的不变性:当我们对变量做可逆的线性变换(比如 \(\mathbf{x} = P \mathbf{y}\),其中 \(P\) 是一个可逆矩阵)时,二次型会变成另一个二次型,但其秩保持不变。因此,秩是二次型的一个本质的、不依赖于具体坐标选取的不变量。
- 有效变量:一个秩为 \(r\) 的二次型,本质上只依赖于 \(r\) 个“真正起作用”的线性独立变量的组合。我们可以通过坐标变换,将它化为一个只包含 \(r\) 个平方项的和的形式(标准形),其余 \(n-r\) 个变量消失。
例子:
- \(Q(x, y) = x^2 + 2xy + y^2 = (x+y)^2\) 的矩阵是 \(\begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix}\),其秩为 1(因为两行相同)。它是一个退化二次型,实际上只依赖于一个组合 \((x+y)\)。
- \(Q(x, y) = x^2 + y^2\) 的矩阵是单位矩阵,秩为 2,是非退化的。
4. 核心概念二:符号差 (Signature) – 在实数域上的故事
符号差是一个比秩更精细的不变量,但它通常只在实数域 ℝ 上有良好定义(因为涉及到正负)。我们考虑实数域上的二次型 \(Q\)。
- 西尔维斯特惯性定律:这是符号差的理论基础。该定律指出,任何一个实二次型,都可以通过一个实的、可逆的线性变换,化为如下简单的“对角平方和”形式:
\[ Q(y_1, ..., y_n) = y_1^2 + ... + y_p^2 - y_{p+1}^2 - ... - y_{p+q}^2 \]
其中 \(p\) 是正平方项的个数,\(q\) 是负平方项的个数,而 \(r = p+q\) 就是二次型的秩。剩余的 \(n - (p+q)\) 个变量在变换后的表达式中不出现(系数为0)。
- 符号差的定义:由惯性定律,数对 \((p, q)\) 在线性变换下是唯一确定的。我们称 \((p, q)\) 为该实二次型的符号差。有时也用一个数 \(p - q\)(正惯性指数减负惯性指数)来记作符号差,但数对 \((p, q)\) 包含更完整的信息。
- 几何意义:
- \(p\) 衡量了二次型“正定”的程度。如果 \(p = n\)(即 \(q=0\)),则对任意非零向量,\(Q > 0\),称为正定二次型。
- \(q\) 衡量了“负定”的程度。如果 \(q = n\)(即 \(p=0\)),则对任意非零向量,\(Q < 0\),称为负定二次型。
- 如果 \(p > 0\) 且 \(q > 0\),则称为不定二次型,它在某些方向取正值,某些方向取负值。
- 符号差完全决定了二次型的“正负性”几何。
例子:
- \(Q(x, y, z) = x^2 + y^2 + z^2\) 的符号差是 (3, 0),它是正定的。
- \(Q(x, y, z) = x^2 + y^2 - z^2\) 的符号差是 (2, 1)。它是不定的,例如点(1,0,0)给出正值1,点(0,0,1)给出负值-1。
- \(Q(x, y) = x^2 - y^2\) 的符号差是 (1, 1)。
- \(Q(x, y) = x^2 + 2xy + y^2 = (x+y)^2\) 的秩为1,通过变换 \(u=x+y, v=x-y\) 可化为 \(u^2\),这对应于符号差 (1, 0)。
5. 秩与符号差的关系与重要性
- 关系:显然,秩 \(r = p + q\)。符号差在秩的基础上,进一步区分了正负方向。
- 作为完全不变量:对于实数域上的二次型,秩和符号差一起构成了它的完全分类不变量。也就是说,两个实二次型可以通过可逆的实线性变换相互转换,当且仅当它们具有相同的秩和相同的符号差 \((p, q)\)。
- 在数论中的应用:在数论的许多领域,如:
- 二次型的算术理论:研究一个二次型能表示哪些整数。符号差限制了它能表示的数的正负。
- 局部-整体原理(Hasse-Minkowski定理):一个有理数域上的二次型有有理数解,当且仅当它在所有“局部域”(如实数域 ℝ 和 p-adic 域 ℚₚ)上有解。在实数域上,有解的条件就由符号差决定(非退化不定型总有非平凡实解)。
- 格(Lattice)理论:在定义正定格时,其关联的二次型必须是正定的(符号差为 (n, 0))。
- 微分几何:黎曼度量的符号差是 (n, 0),而洛伦兹度量的符号差是 (n-1, 1) 或 (1, n-1)。
总结
让我们用一张图来梳理核心思路:
二次型 \(Q(x_1, ..., x_n)\) → 对应一个对称矩阵 \(A\) → 研究矩阵的不变量
-
第一个不变量:秩 (Rank)
-
来源:矩阵 \(A\) 的秩。
- 意义:二次型中“独立变量”的本质个数,是其在任何域(ℚ, ℝ, ℂ等)上都有的基本不变量。
- 性质:在线性变换下不变。
-
第二个不变量:符号差 (Signature)
- 适用范围:主要在实数域 ℝ 上。
-
来源:西尔维斯特惯性定律。通过线性变换化为 \(y_1^2+...+y_p^2 - y_{p+1}^2-...-y_{p+q}^2\) 后,唯一确定的数对 \((p, q)\)。
-
意义:\(p\) 是正平方项数,\(q\) 是负平方项数,描述了二次型的“正负定”性质。
-
性质:在线性变换下不变。秩 \(r = p+q\)。
-
关键结论:对于实二次型,秩和符号差 \((p, q)\) 一起完全决定了它的等价类,是理解和分类二次型最核心的两个数值不变量。