二次型的极小与表示数上界
字数 3653 2025-11-02 10:10:41

二次型的极小与表示数上界

我们从一个具体的例子开始:考虑整数 \(n = 28\)。它可以用二次型 \(x^2 + y^2\) 表示吗?即,是否存在整数 \(x, y\) 使得 \(x^2 + y^2 = 28\)?通过尝试小的整数,\(28 = 5^2 + (\sqrt{3})^2\) 不是整数解,\(4^2 + 2^2 = 16+4=20\)\(4^2 + 3^2 = 16+9=25\)\(5^2 + 2^2 = 25+4=29\)。我们发现不存在这样的整数 \(x, y\)。但是,二次型 \(x^2 + 2y^2\) 呢?\(4^2 + 2*2^2 = 16+8=24\)\(4^2 + 2*3^2 = 16+18=34\)\(5^2 + 2*1^2 = 25+2=27\)\(5^2 + 2*2^2 = 25+8=33\)。似乎也不行。那么 \(x^2 + 3y^2\) 呢?\(5^2 + 3*1^2 = 25+3=28\)!所以 \(28\) 可以被二次型 \(x^2 + 3y^2\) 表示。这个简单的例子引出一个深刻的问题:对于一个给定的正整数 \(n\),和一个给定的正定二元二次型 \(f(x, y) = ax^2 + bxy + cy^2\)(其中 \(a, b, c\) 为整数,且判别式 \(D = b^2 - 4ac < 0\)),我们如何判断 \(n\) 是否能被 \(f\) 表示?更进一步,如果能被表示,有多少种表示方法?今天我们不讨论具体的判断准则,而是探讨一个相关但更基础的问题:如果我们知道 \(n\) 能被某个二次型表示,那么表示方法的个数,即方程 \(f(x, y) = n\) 的整数解 \((x, y)\) 的个数,大概有多少?这个“大概有多少”就是表示数的上界问题。

第一步:从具体例子到一般问题

让我们形式化问题。考虑一个正定的二元整系数二次型 \(f(x, y) = ax^2 + bxy + cy^2\)。其判别式 \(D = b^2 - 4ac < 0\)。对于给定的正整数 \(n\),我们关心的是方程 \(f(x, y) = n\) 的整数解 \((x, y)\) 的个数。我们记这个解数为 \(r_f(n)\)

一个自然的想法是:这个解数会不会随着 \(n\) 的增大而无限增多?直觉上,因为 \(f(x, y) = n\) 定义了一个椭圆(当 \(D<0\)),其周长大致正比于 \(\sqrt{n}\)。椭圆曲线上的整点个数应该不会太多。事实上,我们可以证明 \(r_f(n)\) 是有上界的,并且这个上界只依赖于二次型 \(f\) 本身,而与 \(n\) 无关!这个上界就是我们要讲的“表示数上界”。更精确地说,存在一个只依赖于 \(f\) 的常数 \(c_f\),使得对于所有正整数 \(n\),都有 \(r_f(n) \le c_f\)

第二步:理解“与n无关”的深刻含义

“上界与 \(n\) 无关”是一个非常强的结论。它意味着,无论 \(n\) 变得多大,能被 \(f\) 表示成 \(n = f(x, y)\) 的整数对 \((x, y)\) 的个数,永远不会超过一个固定的数值 \(c_f\)。例如,对于二次型 \(f(x, y) = x^2 + y^2\),虽然有很多数可以被表示为两个平方数之和,但对于每个特定的 \(n\),表示法是有限的,并且所有 \(n\) 的表示法个数都不会超过某个固定的数。这个结论并非显然,因为椭圆周长在增长,但整点的“密度”实际上在降低。

第三步:证明的关键思想——二次型的极小(Minimum)

为了证明这个上界的存在,我们需要引入一个核心概念:二次型的极小(Minimum)
一个正定二次型 \(f(x, y)\) 的极小,记作 \(m(f)\),定义为该二次型在所有非零整数对 \((x, y) \neq (0, 0)\) 上所取的最小正值:
\(m(f) = \min \{ f(x, y) > 0 : (x, y) \in \mathbb{Z}^2 \setminus \{(0,0)\} \}\)
由于 \(f\) 是正定的,并且只在 \((0,0)\) 处为零,所以这个最小值是存在且为正数的。例如,对于 \(f(x, y) = x^2 + y^2\),其极小 \(m(f) = 1\)(在 (1,0) 或 (0,1) 处取得)。对于 \(f(x, y) = x^2 + xy + y^2\),其极小也是 \(1\)(在 (1,0) 或 (0,1) 处取得,值为1)。

第四步:利用极小来分离不同的表示

现在,假设我们有两个不同的整数对 \((x_1, y_1)\)\((x_2, y_2)\),它们都表示同一个数 \(n\),即 \(f(x_1, y_1) = f(x_2, y_2) = n\)。我们考虑它们的差 \((u, v) = (x_1 - x_2, y_1 - y_2)\)。关键点在于,由于 \(f\) 是二次型,我们可以利用其性质来估计 \(f(u, v)\) 的值。

一个重要的不等式是:对于正定二次型,存在一个与 \(f\) 相关的常数 \(K_f\)(通常与 \(f\) 的判别式 \(D\) 和系数有关),使得对于任意两个整数对 \((x_1, y_1), (x_2, y_2)\),如果它们对应的点在一定意义下“足够接近”,那么 \(f(x_1 - x_2, y_1 - y_2)\) 会小于 \(m(f)\)

更具体的一个经典方法是考虑 \(f\) 对应的几何。二次型 \(f(x, y)\) 可以看作是在一个二维格点(由 \(f\) 的系数矩阵决定)上定义的一个“距离”的平方。这个格点有一个基本区域(平行四边形)。任何两个代表同一个数 \(n\) 的格点,如果它们在同一个基本区域的平移类中,那么它们的差向量 \((u, v)\) 的长度(由 \(f\) 度量)会有一个上界,这个上界由基本区域的大小决定。通过仔细分析这个格点的几何性质,我们可以证明:如果两个不同的表示 \((x_1, y_1)\)\((x_2, y_2)\) 都满足 \(f(x_i, y_i) = n\),那么它们对应的点之间的距离(用 \(f\) 度量)不能太大,实际上被一个只依赖于 \(f\) 的常数所控制。

第五步:推导出上界

基于第四步的几何分析,我们可以得出以下核心论断:
所有满足 \(f(x, y) = n\) 的整数对 \((x, y)\) 所对应的点,都落在以原点为中心的某个椭圆环内,并且任意两个不同的表示点之间的距离(由 \(f\) 度量)至少是 \(\sqrt{m(f)}\)(因为如果距离小于 \(\sqrt{m(f)}\),那么差向量对应的 \(f\) 值就会小于 \(m(f)\),这与 \(m(f)\) 的定义矛盾,除非差向量为零)。

现在,考虑一个足够大的圆(由 \(f(x, y) \le n + \delta\) 定义,\(\delta\) 是一个小常数)来包围所有这些表示点。这个圆的“面积”(用 \(f\) 对应的度量)是与 \(n\) 成正比的。而每个表示点周围都有一个“禁区”,这个禁区的面积是一个固定的正值(由 \(m(f)\) 决定)。因为这些禁区互不相交(如果相交,则两点距离过近,与最小性矛盾),所以表示点的个数不能超过(大圆的面积)/(每个禁区的面积)。这个比值是一个与 \(n\) 无关的常数!因此,表示数 \(r_f(n)\) 有一个只依赖于 \(f\) 的上界 \(c_f\)

总结

我们通过引入二次型的极小 \(m(f)\) 这一概念,并利用二次型对应的几何(格点理论),证明了对于任意正定二元二次型 \(f\),其表示数 \(r_f(n)\)(即方程 \(f(x, y)=n\) 的整数解个数)有一个上界 \(c_f\),而这个上界是一个只依赖于 \(f\) 本身(具体来说,依赖于其判别式 \(D\) 和极小 \(m(f)\))的常数,与 \(n\) 无关。这个结论是数论中研究二次型表示问题的一个基础而重要的工具。

二次型的极小与表示数上界 我们从一个具体的例子开始:考虑整数 \( n = 28 \)。它可以用二次型 \( x^2 + y^2 \) 表示吗?即,是否存在整数 \( x, y \) 使得 \( x^2 + y^2 = 28 \)?通过尝试小的整数,\( 28 = 5^2 + (\sqrt{3})^2 \) 不是整数解,\( 4^2 + 2^2 = 16+4=20 \),\( 4^2 + 3^2 = 16+9=25 \),\( 5^2 + 2^2 = 25+4=29 \)。我们发现不存在这样的整数 \( x, y \)。但是,二次型 \( x^2 + 2y^2 \) 呢?\( 4^2 + 2 2^2 = 16+8=24 \),\( 4^2 + 2 3^2 = 16+18=34 \),\( 5^2 + 2 1^2 = 25+2=27 \),\( 5^2 + 2 2^2 = 25+8=33 \)。似乎也不行。那么 \( x^2 + 3y^2 \) 呢?\( 5^2 + 3* 1^2 = 25+3=28 \)!所以 \( 28 \) 可以被二次型 \( x^2 + 3y^2 \) 表示。这个简单的例子引出一个深刻的问题:对于一个给定的正整数 \( n \),和一个给定的正定二元二次型 \( f(x, y) = ax^2 + bxy + cy^2 \)(其中 \( a, b, c \) 为整数,且判别式 \( D = b^2 - 4ac < 0 \)),我们如何判断 \( n \) 是否能被 \( f \) 表示?更进一步,如果能被表示,有多少种表示方法?今天我们不讨论具体的判断准则,而是探讨一个相关但更基础的问题:如果我们知道 \( n \) 能被某个二次型表示,那么表示方法的个数,即方程 \( f(x, y) = n \) 的整数解 \( (x, y) \) 的个数,大概有多少?这个“大概有多少”就是表示数的上界问题。 第一步:从具体例子到一般问题 让我们形式化问题。考虑一个正定的二元整系数二次型 \( f(x, y) = ax^2 + bxy + cy^2 \)。其判别式 \( D = b^2 - 4ac < 0 \)。对于给定的正整数 \( n \),我们关心的是方程 \( f(x, y) = n \) 的整数解 \( (x, y) \) 的个数。我们记这个解数为 \( r_ f(n) \)。 一个自然的想法是:这个解数会不会随着 \( n \) 的增大而无限增多?直觉上,因为 \( f(x, y) = n \) 定义了一个椭圆(当 \( D<0 \)),其周长大致正比于 \( \sqrt{n} \)。椭圆曲线上的整点个数应该不会太多。事实上,我们可以证明 \( r_ f(n) \) 是有上界的,并且这个上界只依赖于二次型 \( f \) 本身,而与 \( n \) 无关!这个上界就是我们要讲的“表示数上界”。更精确地说,存在一个只依赖于 \( f \) 的常数 \( c_ f \),使得对于所有正整数 \( n \),都有 \( r_ f(n) \le c_ f \)。 第二步:理解“与n无关”的深刻含义 “上界与 \( n \) 无关”是一个非常强的结论。它意味着,无论 \( n \) 变得多大,能被 \( f \) 表示成 \( n = f(x, y) \) 的整数对 \( (x, y) \) 的个数,永远不会超过一个固定的数值 \( c_ f \)。例如,对于二次型 \( f(x, y) = x^2 + y^2 \),虽然有很多数可以被表示为两个平方数之和,但对于每个特定的 \( n \),表示法是有限的,并且所有 \( n \) 的表示法个数都不会超过某个固定的数。这个结论并非显然,因为椭圆周长在增长,但整点的“密度”实际上在降低。 第三步:证明的关键思想——二次型的极小(Minimum) 为了证明这个上界的存在,我们需要引入一个核心概念:二次型的 极小(Minimum) 。 一个正定二次型 \( f(x, y) \) 的极小,记作 \( m(f) \),定义为该二次型在所有非零整数对 \( (x, y) \neq (0, 0) \) 上所取的最小正值: \( m(f) = \min \{ f(x, y) > 0 : (x, y) \in \mathbb{Z}^2 \setminus \{(0,0)\} \} \)。 由于 \( f \) 是正定的,并且只在 \( (0,0) \) 处为零,所以这个最小值是存在且为正数的。例如,对于 \( f(x, y) = x^2 + y^2 \),其极小 \( m(f) = 1 \)(在 (1,0) 或 (0,1) 处取得)。对于 \( f(x, y) = x^2 + xy + y^2 \),其极小也是 \( 1 \)(在 (1,0) 或 (0,1) 处取得,值为1)。 第四步:利用极小来分离不同的表示 现在,假设我们有两个不同的整数对 \( (x_ 1, y_ 1) \) 和 \( (x_ 2, y_ 2) \),它们都表示同一个数 \( n \),即 \( f(x_ 1, y_ 1) = f(x_ 2, y_ 2) = n \)。我们考虑它们的差 \( (u, v) = (x_ 1 - x_ 2, y_ 1 - y_ 2) \)。关键点在于,由于 \( f \) 是二次型,我们可以利用其性质来估计 \( f(u, v) \) 的值。 一个重要的不等式是:对于正定二次型,存在一个与 \( f \) 相关的常数 \( K_ f \)(通常与 \( f \) 的判别式 \( D \) 和系数有关),使得对于任意两个整数对 \( (x_ 1, y_ 1), (x_ 2, y_ 2) \),如果它们对应的点在一定意义下“足够接近”,那么 \( f(x_ 1 - x_ 2, y_ 1 - y_ 2) \) 会小于 \( m(f) \)。 更具体的一个经典方法是考虑 \( f \) 对应的几何。二次型 \( f(x, y) \) 可以看作是在一个二维格点(由 \( f \) 的系数矩阵决定)上定义的一个“距离”的平方。这个格点有一个基本区域(平行四边形)。任何两个代表同一个数 \( n \) 的格点,如果它们在同一个基本区域的平移类中,那么它们的差向量 \( (u, v) \) 的长度(由 \( f \) 度量)会有一个上界,这个上界由基本区域的大小决定。通过仔细分析这个格点的几何性质,我们可以证明:如果两个不同的表示 \( (x_ 1, y_ 1) \) 和 \( (x_ 2, y_ 2) \) 都满足 \( f(x_ i, y_ i) = n \),那么它们对应的点之间的距离(用 \( f \) 度量)不能太大,实际上被一个只依赖于 \( f \) 的常数所控制。 第五步:推导出上界 基于第四步的几何分析,我们可以得出以下核心论断: 所有满足 \( f(x, y) = n \) 的整数对 \( (x, y) \) 所对应的点,都落在以原点为中心的某个椭圆环内,并且任意两个不同的表示点之间的距离(由 \( f \) 度量)至少是 \( \sqrt{m(f)} \)(因为如果距离小于 \( \sqrt{m(f)} \),那么差向量对应的 \( f \) 值就会小于 \( m(f) \),这与 \( m(f) \) 的定义矛盾,除非差向量为零)。 现在,考虑一个足够大的圆(由 \( f(x, y) \le n + \delta \) 定义,\( \delta \) 是一个小常数)来包围所有这些表示点。这个圆的“面积”(用 \( f \) 对应的度量)是与 \( n \) 成正比的。而每个表示点周围都有一个“禁区”,这个禁区的面积是一个固定的正值(由 \( m(f) \) 决定)。因为这些禁区互不相交(如果相交,则两点距离过近,与最小性矛盾),所以表示点的个数不能超过(大圆的面积)/(每个禁区的面积)。这个比值是一个与 \( n \) 无关的常数!因此,表示数 \( r_ f(n) \) 有一个只依赖于 \( f \) 的上界 \( c_ f \)。 总结 我们通过引入二次型的 极小 \( m(f) \) 这一概念,并利用二次型对应的几何(格点理论),证明了对于任意正定二元二次型 \( f \),其表示数 \( r_ f(n) \)(即方程 \( f(x, y)=n \) 的整数解个数)有一个上界 \( c_ f \),而这个上界是一个只依赖于 \( f \) 本身(具体来说,依赖于其判别式 \( D \) 和极小 \( m(f) \))的常数,与 \( n \) 无关。这个结论是数论中研究二次型表示问题的一个基础而重要的工具。