二次型的秩与符号差(Rank and Signature of a Quadratic Form)
字数 3824 2025-12-22 19:01:40

二次型的秩与符号差(Rank and Signature of a Quadratic Form)

好的,我们开始讲解“二次型的秩与符号差”。我会从最基本的概念出发,循序渐进地解释,确保每个步骤都清晰易懂。

1. 预备知识:二次型是什么?

首先,我们需要明确“二次型”在数论和代数中的基本定义。

  • 直观理解:你可以把二次型想象成一个“齐二次多项式”。所谓“齐”,是指每一项的总次数(所有变量的指数和)都相同,且是2。
  • 正式定义:设 \(x_1, x_2, ..., x_n\) 是变量。一个二次型 \(Q\) 是一个形如

\[ Q(x_1, ..., x_n) = \sum_{1 \le i \le j \le n} a_{ij} x_i x_j \]

的表达式,其中系数 \(a_{ij}\) 通常取自某个域(如实数域 ℝ、有理数域 ℚ 等)。注意,交叉项 \(x_i x_j (i \neq j)\) 的系数有时会写成 \(2a_{ij}\) 以使矩阵对称,但上述是更通用的写法。

例子

  • \(Q(x, y) = x^2 + 3xy + 2y^2\) 是一个二元二次型。
  • \(Q(x, y, z) = x^2 + y^2 - z^2\) 是一个三元二次型。

2. 矩阵表示:从多项式到线性代数

为了更有效地研究二次型,我们将其与矩阵联系起来。这是理解秩和符号差的关键一步。

  • 对称矩阵:任何一个二次型 \(Q\) 都可以唯一地表示为一个对称矩阵 \(A\) 的二次型形式:

\[ Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} \]

其中 \(\mathbf{x} = (x_1, ..., x_n)^T\) 是列向量,\(\mathbf{x}^T\) 是其转置(行向量)。

  • 构造方法:矩阵 \(A = (a_{ij})\) 的对角元 \(a_{ii}\) 就是 \(x_i^2\) 的系数。而非对角元 \(a_{ij} (i \neq j)\)\(x_i x_j\) 项系数的一半(因为 \(x_i x_j\)\(x_j x_i\) 是同一项,在矩阵乘法中会出现两次)。

例子

  • 对于 \(Q(x, y) = x^2 + 3xy + 2y^2\),我们可以写成:

\[ (x, y) \begin{pmatrix} 1 & 1.5 \\ 1.5 & 2 \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix} \]

这里 \(3xy\) 的系数 3 被平分到矩阵的两个非对角位置(1.5 和 1.5)。

3. 核心概念一:秩 (Rank)

现在,我们有了二次型对应的对称矩阵 \(A\)。线性代数告诉我们,矩阵有一个非常重要的不变量——

  • 定义:二次型 \(Q\),就是其对应矩阵 \(A\) 的秩。矩阵的秩定义为矩阵中线性无关的行(或列)的最大数目。
  • 几何/代数意义
  1. 满秩 vs 退化:如果秩等于变量个数 \(n\),我们称 \(Q\)非退化的。如果秩 \(r < n\),则称 \(Q\)退化的。
  2. 变量替换下的不变性:当我们对变量做可逆的线性变换(比如 \(\mathbf{x} = P \mathbf{y}\),其中 \(P\) 是一个可逆矩阵)时,二次型会变成另一个二次型,但其秩保持不变。因此,秩是二次型的一个本质的、不依赖于具体坐标选取的不变量
  3. 有效变量:一个秩为 \(r\) 的二次型,本质上只依赖于 \(r\) 个“真正起作用”的线性独立变量的组合。我们可以通过坐标变换,将它化为一个只包含 \(r\) 个平方项的和的形式(标准形),其余 \(n-r\) 个变量消失。

例子

  • \(Q(x, y) = x^2 + 2xy + y^2 = (x+y)^2\) 的矩阵是 \(\begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix}\),其秩为 1(因为两行相同)。它是一个退化二次型,实际上只依赖于一个组合 \((x+y)\)
  • \(Q(x, y) = x^2 + y^2\) 的矩阵是单位矩阵,秩为 2,是非退化的。

4. 核心概念二:符号差 (Signature) – 在实数域上的故事

符号差是一个比秩更精细的不变量,但它通常只在实数域 ℝ 上有良好定义(因为涉及到正负)。我们考虑实数域上的二次型 \(Q\)

  • 西尔维斯特惯性定律:这是符号差的理论基础。该定律指出,任何一个实二次型,都可以通过一个实的、可逆的线性变换,化为如下简单的“对角平方和”形式:

\[ Q(y_1, ..., y_n) = y_1^2 + ... + y_p^2 - y_{p+1}^2 - ... - y_{p+q}^2 \]

其中 \(p\) 是正平方项的个数,\(q\) 是负平方项的个数,而 \(r = p+q\) 就是二次型的秩。剩余的 \(n - (p+q)\) 个变量在变换后的表达式中不出现(系数为0)。

  • 符号差的定义:由惯性定律,数对 \((p, q)\) 在线性变换下是唯一确定的。我们称 \((p, q)\) 为该实二次型的符号差。有时也用一个数 \(p - q\)(正惯性指数减负惯性指数)来记作符号差,但数对 \((p, q)\) 包含更完整的信息。
  • 几何意义
  • \(p\) 衡量了二次型“正定”的程度。如果 \(p = n\)(即 \(q=0\)),则对任意非零向量,\(Q > 0\),称为正定二次型
  • \(q\) 衡量了“负定”的程度。如果 \(q = n\)(即 \(p=0\)),则对任意非零向量,\(Q < 0\),称为负定二次型
  • 如果 \(p > 0\)\(q > 0\),则称为不定二次型,它在某些方向取正值,某些方向取负值。
    • 符号差完全决定了二次型的“正负性”几何。

例子

  • \(Q(x, y, z) = x^2 + y^2 + z^2\) 的符号差是 (3, 0),它是正定的。
  • \(Q(x, y, z) = x^2 + y^2 - z^2\) 的符号差是 (2, 1)。它是不定的,例如点(1,0,0)给出正值1,点(0,0,1)给出负值-1。
  • \(Q(x, y) = x^2 - y^2\) 的符号差是 (1, 1)。
  • \(Q(x, y) = x^2 + 2xy + y^2 = (x+y)^2\) 的秩为1,通过变换 \(u=x+y, v=x-y\) 可化为 \(u^2\),这对应于符号差 (1, 0)。

5. 秩与符号差的关系与重要性

  • 关系:显然,秩 \(r = p + q\)。符号差在秩的基础上,进一步区分了正负方向。
  • 作为完全不变量:对于实数域上的二次型,秩和符号差一起构成了它的完全分类不变量。也就是说,两个实二次型可以通过可逆的实线性变换相互转换,当且仅当它们具有相同的秩和相同的符号差 \((p, q)\)
  • 在数论中的应用:在数论的许多领域,如:
    1. 二次型的算术理论:研究一个二次型能表示哪些整数。符号差限制了它能表示的数的正负。
    2. 局部-整体原理(Hasse-Minkowski定理):一个有理数域上的二次型有有理数解,当且仅当它在所有“局部域”(如实数域 ℝ 和 p-adic 域 ℚₚ)上有解。在实数域上,有解的条件就由符号差决定(非退化不定型总有非平凡实解)。
    3. 格(Lattice)理论:在定义正定格时,其关联的二次型必须是正定的(符号差为 (n, 0))。
    4. 微分几何:黎曼度量的符号差是 (n, 0),而洛伦兹度量的符号差是 (n-1, 1) 或 (1, n-1)。

总结

让我们用一张图来梳理核心思路:

二次型 \(Q(x_1, ..., x_n)\)对应一个对称矩阵 \(A\)研究矩阵的不变量

  • 第一个不变量:秩 (Rank)

  • 来源:矩阵 \(A\) 的秩。

    • 意义:二次型中“独立变量”的本质个数,是其在任何域(ℚ, ℝ, ℂ等)上都有的基本不变量。
    • 性质:在线性变换下不变。
  • 第二个不变量:符号差 (Signature)

    • 适用范围:主要在实数域 ℝ 上。
  • 来源:西尔维斯特惯性定律。通过线性变换化为 \(y_1^2+...+y_p^2 - y_{p+1}^2-...-y_{p+q}^2\) 后,唯一确定的数对 \((p, q)\)

  • 意义:\(p\) 是正平方项数,\(q\) 是负平方项数,描述了二次型的“正负定”性质。

  • 性质:在线性变换下不变。\(r = p+q\)

  • 关键结论:对于实二次型,秩和符号差 \((p, q)\) 一起完全决定了它的等价类,是理解和分类二次型最核心的两个数值不变量。

二次型的秩与符号差(Rank and Signature of a Quadratic Form) 好的,我们开始讲解“二次型的秩与符号差”。我会从最基本的概念出发,循序渐进地解释,确保每个步骤都清晰易懂。 1. 预备知识:二次型是什么? 首先,我们需要明确“二次型”在数论和代数中的基本定义。 直观理解 :你可以把二次型想象成一个“齐二次多项式”。所谓“齐”,是指每一项的总次数(所有变量的指数和)都相同,且是2。 正式定义 :设 \( x_ 1, x_ 2, ..., x_ n \) 是变量。一个 二次型 \( Q \) 是一个形如 \[ Q(x_ 1, ..., x_ n) = \sum_ {1 \le i \le j \le n} a_ {ij} x_ i x_ j \] 的表达式,其中系数 \( a_ {ij} \) 通常取自某个域(如实数域 ℝ、有理数域 ℚ 等)。注意,交叉项 \( x_ i x_ j (i \neq j) \) 的系数有时会写成 \( 2a_ {ij} \) 以使矩阵对称,但上述是更通用的写法。 例子 : \( Q(x, y) = x^2 + 3xy + 2y^2 \) 是一个二元二次型。 \( Q(x, y, z) = x^2 + y^2 - z^2 \) 是一个三元二次型。 2. 矩阵表示:从多项式到线性代数 为了更有效地研究二次型,我们将其与矩阵联系起来。这是理解秩和符号差的关键一步。 对称矩阵 :任何一个二次型 \( Q \) 都可以唯一地表示为一个 对称矩阵 \( A \) 的二次型形式: \[ Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} \] 其中 \( \mathbf{x} = (x_ 1, ..., x_ n)^T \) 是列向量,\( \mathbf{x}^T \) 是其转置(行向量)。 构造方法 :矩阵 \( A = (a_ {ij}) \) 的对角元 \( a_ {ii} \) 就是 \( x_ i^2 \) 的系数。而非对角元 \( a_ {ij} (i \neq j) \) 是 \( x_ i x_ j \) 项系数的一半(因为 \( x_ i x_ j \) 和 \( x_ j x_ i \) 是同一项,在矩阵乘法中会出现两次)。 例子 : 对于 \( Q(x, y) = x^2 + 3xy + 2y^2 \),我们可以写成: \[ (x, y) \begin{pmatrix} 1 & 1.5 \\ 1.5 & 2 \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix} \] 这里 \( 3xy \) 的系数 3 被平分到矩阵的两个非对角位置(1.5 和 1.5)。 3. 核心概念一:秩 (Rank) 现在,我们有了二次型对应的对称矩阵 \( A \)。线性代数告诉我们,矩阵有一个非常重要的不变量—— 秩 。 定义 :二次型 \( Q \) 的 秩 ,就是其对应矩阵 \( A \) 的秩。矩阵的秩定义为矩阵中线性无关的行(或列)的最大数目。 几何/代数意义 : 满秩 vs 退化 :如果秩等于变量个数 \( n \),我们称 \( Q \) 是 非退化 的。如果秩 \( r < n \),则称 \( Q \) 是 退化 的。 变量替换下的不变性 :当我们对变量做可逆的线性变换(比如 \( \mathbf{x} = P \mathbf{y} \),其中 \( P \) 是一个可逆矩阵)时,二次型会变成另一个二次型,但其 秩保持不变 。因此,秩是二次型的一个本质的、不依赖于具体坐标选取的 不变量 。 有效变量 :一个秩为 \( r \) 的二次型,本质上只依赖于 \( r \) 个“真正起作用”的线性独立变量的组合。我们可以通过坐标变换,将它化为一个只包含 \( r \) 个平方项的和的形式(标准形),其余 \( n-r \) 个变量消失。 例子 : \( Q(x, y) = x^2 + 2xy + y^2 = (x+y)^2 \) 的矩阵是 \( \begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix} \),其秩为 1(因为两行相同)。它是一个退化二次型,实际上只依赖于一个组合 \( (x+y) \)。 \( Q(x, y) = x^2 + y^2 \) 的矩阵是单位矩阵,秩为 2,是非退化的。 4. 核心概念二:符号差 (Signature) – 在实数域上的故事 符号差是一个比秩更精细的不变量,但它通常只在实数域 ℝ 上有良好定义(因为涉及到正负)。我们考虑实数域上的二次型 \( Q \)。 西尔维斯特惯性定律 :这是符号差的理论基础。该定律指出,任何一个实二次型,都可以通过一个实的、可逆的线性变换,化为如下简单的“对角平方和”形式: \[ Q(y_ 1, ..., y_ n) = y_ 1^2 + ... + y_ p^2 - y_ {p+1}^2 - ... - y_ {p+q}^2 \] 其中 \( p \) 是正平方项的个数,\( q \) 是负平方项的个数,而 \( r = p+q \) 就是二次型的秩。剩余的 \( n - (p+q) \) 个变量在变换后的表达式中不出现(系数为0)。 符号差的定义 :由惯性定律,数对 \( (p, q) \) 在线性变换下是 唯一确定 的。我们称 \( (p, q) \) 为该实二次型的 符号差 。有时也用一个数 \( p - q \)(正惯性指数减负惯性指数)来记作符号差,但数对 \( (p, q) \) 包含更完整的信息。 几何意义 : \( p \) 衡量了二次型“正定”的程度。如果 \( p = n \)(即 \( q=0 \)),则对任意非零向量,\( Q > 0 \),称为 正定二次型 。 \( q \) 衡量了“负定”的程度。如果 \( q = n \)(即 \( p=0 \)),则对任意非零向量,\( Q < 0 \),称为 负定二次型 。 如果 \( p > 0 \) 且 \( q > 0 \),则称为 不定二次型 ,它在某些方向取正值,某些方向取负值。 符号差完全决定了二次型的“正负性”几何。 例子 : \( Q(x, y, z) = x^2 + y^2 + z^2 \) 的符号差是 (3, 0),它是正定的。 \( Q(x, y, z) = x^2 + y^2 - z^2 \) 的符号差是 (2, 1)。它是不定的,例如点(1,0,0)给出正值1,点(0,0,1)给出负值-1。 \( Q(x, y) = x^2 - y^2 \) 的符号差是 (1, 1)。 \( Q(x, y) = x^2 + 2xy + y^2 = (x+y)^2 \) 的秩为1,通过变换 \( u=x+y, v=x-y \) 可化为 \( u^2 \),这对应于符号差 (1, 0)。 5. 秩与符号差的关系与重要性 关系 :显然,秩 \( r = p + q \)。符号差在秩的基础上,进一步区分了正负方向。 作为完全不变量 :对于实数域上的二次型, 秩和符号差一起构成了它的完全分类不变量 。也就是说,两个实二次型可以通过可逆的实线性变换相互转换, 当且仅当 它们具有相同的秩和相同的符号差 \( (p, q) \)。 在数论中的应用 :在数论的许多领域,如: 二次型的算术理论 :研究一个二次型能表示哪些整数。符号差限制了它能表示的数的正负。 局部-整体原理(Hasse-Minkowski定理) :一个有理数域上的二次型有有理数解,当且仅当它在所有“局部域”(如实数域 ℝ 和 p-adic 域 ℚₚ)上有解。在实数域上,有解的条件就由符号差决定(非退化不定型总有非平凡实解)。 格(Lattice)理论 :在定义正定格时,其关联的二次型必须是正定的(符号差为 (n, 0))。 微分几何 :黎曼度量的符号差是 (n, 0),而洛伦兹度量的符号差是 (n-1, 1) 或 (1, n-1)。 总结 让我们用一张图来梳理核心思路: 二次型 \( Q(x_ 1, ..., x_ n) \) → 对应一个对称矩阵 \( A \) → 研究矩阵的不变量 第一个不变量:秩 (Rank) 来源:矩阵 \( A \) 的秩。 意义:二次型中“独立变量”的本质个数,是其在任何域(ℚ, ℝ, ℂ等)上都有的基本不变量。 性质:在线性变换下不变。 第二个不变量:符号差 (Signature) 适用范围:主要在实数域 ℝ 上。 来源:西尔维斯特惯性定律。通过线性变换化为 \( y_ 1^2+...+y_ p^2 - y_ {p+1}^2-...-y_ {p+q}^2 \) 后,唯一确定的数对 \( (p, q) \)。 意义:\( p \) 是正平方项数,\( q \) 是负平方项数,描述了二次型的“正负定”性质。 性质:在线性变换下不变。 秩 \( r = p+q \) 。 关键结论 :对于实二次型, 秩和符号差 \( (p, q) \) 一起完全决定了它的等价类 ,是理解和分类二次型最核心的两个数值不变量。