好的,我们这次来讲解数论中一个经典且直观的概念。
佩尔方程
我们来循序渐进地讲解这个主题。
第一步:基本定义与历史起源
佩尔方程(Pell Equation),通常指形如
\[ x^2 - dy^2 = 1 \]
的二元二次不定方程(也叫丢番图方程)。
其中:
- \(x\) 和 \(y\) 是我们要找的未知整数解。
- \(d\) 是一个给定的正整数,并且不是完全平方数(即 \(\sqrt{d}\) 是无理数)。如果 \(d\) 是完全平方数,比如 \(d = k^2\),那么方程变为 \(x^2 - k^2 y^2 = (x - ky)(x + ky) = 1\),只有平凡的整数解 \(x = \pm 1, y = 0\)。
为什么叫“佩尔方程”?
这个命名是个历史误会。17世纪英国数学家约翰·佩尔(John Pell)其实并未深入研究它。欧拉在阅读沃利斯等人的著作时产生了混淆,将此方程归于佩尔名下,并流传至今。其实,更早的数学家如阿基米德、印度数学家婆罗摩笈多(Brahmagupta)和婆什迦罗二世(Bhāskara II)都对这类方程有深入研究。
最简单的例子:
对于 \(d = 2\),方程是 \(x^2 - 2y^2 = 1\)。
你可以验证,\(x = 3, y = 2\) 是一个解,因为 \(3^2 - 2 \times 2^2 = 9 - 8 = 1\)。
第二步:解的初步观察与平凡解
首先,我们总能找到一个“平凡解”:
\[ (x, y) = (\pm 1, 0) \]
对于任意非平方数 \(d\),这都满足 \((\pm1)^2 - d \times 0^2 = 1\)。
但佩尔方程有趣的地方在于,当 \(d\) 不是平方数时,它存在无穷多组非平凡的整数解 \((x, y)\),其中 \(y \neq 0\)。
以 \(d=2\) 为例,除了 \((3, 2)\),还有更大的解:
\( (17, 12): 17^2 - 2 \times 12^2 = 289 - 288 = 1\)
\( (99, 70): 99^2 - 2 \times 70^2 = 9801 - 9800 = 1\)
一个自然的问题是:这些解之间有规律吗?我们如何系统地找到它们?
第三步:将方程与代数数论联系起来
将方程 \(x^2 - dy^2 = 1\) 进行因式分解:
\[ (x - y\sqrt{d})(x + y\sqrt{d}) = 1 \]
这个形式启发我们考虑二次域 \(\mathbb{Q}(\sqrt{d})\) 中的元素 \(\alpha = x + y\sqrt{d}\)。这个方程说的正是:代数整数 \(\alpha\) 与其共轭 \(\bar{\alpha} = x - y\sqrt{d}\) 的乘积(即其范数 \(N(\alpha)\))等于 \(1\)。
在代数数论中,范数为1的代数整数被称为该数域的单位(unit)。因此,求解佩尔方程等价于在二次整数环 \(\mathbb{Z}[\sqrt{d}]\)(或当 \(d \equiv 1 \mod 4\) 时为 \(\mathbb{Z}[(1+\sqrt{d})/2]\))中,寻找范数为 \(+1\) 的单位元。
二次域的单位群结构由狄利克雷单位定理给出:对于实二次域(\(d > 0\) 非平方),其单位群是秩为1的阿贝尔群,即存在一个基本单位 \(\epsilon\),使得所有单位都可以写成 \(\pm \epsilon^k\),其中 \(k \in \mathbb{Z}\)。
第四步:基本解与解的生成
对于佩尔方程 \(x^2 - dy^2 = 1\):
- 基本解:我们定义所有正整数解 \((x, y)\)(即 \(x>0, y>0\))中,使得 \(x + y\sqrt{d}\) 最小的那个解,记为 \((x_1, y_1)\)。它对应的代数整数 \(\epsilon = x_1 + y_1\sqrt{d}\) 就是二次域单位群的基本单位(满足范数为 \(+1\) 的那个)。
- 所有解:一旦找到了基本解 \((x_1, y_1)\),那么方程的所有正整数解 \((x_n, y_n)\) 可以由以下公式生成:
\[ x_n + y_n\sqrt{d} = (x_1 + y_1\sqrt{d})^n, \quad n = 1, 2, 3, \dots \]
换句话说,将基本解对应的代数整数不断自乘,其“实部”和“虚部(\(\sqrt{d}\) 的系数)”就给出了佩尔方程的无穷多组解。
回到 \(d=2\) 的例子:
基本解是 \((3, 2)\),对应 \(\epsilon = 3 + 2\sqrt{2}\)。
- 当 \(n=2\) 时:\((3 + 2\sqrt{2})^2 = 9 + 12\sqrt{2} + 8 = 17 + 12\sqrt{2}\),得到解 \((17, 12)\)。
- 当 \(n=3\) 时:\((3 + 2\sqrt{2})^3 = (17+12\sqrt{2})(3+2\sqrt{2}) = 99 + 70\sqrt{2}\),得到解 \((99, 70)\)。
这与我们之前列举的完全一致。
第五步:如何求解?——连分数法
那么,关键问题是如何求出基本解 \((x_1, y_1)\)?最经典有效的方法是利用连分数。
定理:设 \(\sqrt{d}\) 的简单连分数展开的循环节长度为 \(l\)。
- 如果 \(l\) 是偶数,则基本解由 \(\sqrt{d}\) 的渐近分数 \(p_{l-1} / q_{l-1}\) 给出,即 \((x_1, y_1) = (p_{l-1}, q_{l-1})\)。
- 如果 \(l\) 是奇数,则基本解由 \(\sqrt{d}\) 的渐近分数 \(p_{2l-1} / q_{2l-1}\) 给出,即 \((x_1, y_1) = (p_{2l-1}, q_{2l-1})\)。
以 \(d=7\) 为例:
\(\sqrt{7} = [2; \overline{1, 1, 1, 4}]\),循环节为 \([1, 1, 1, 4]\),长度 \(l=4\)(偶数)。
计算到循环节前的渐近分数:
\([2] = 2\)
\([2;1] = 3\)
\([2;1,1] = 5/2\)
\([2;1,1,1] = 8/3\)
由于 \(l=4\) 为偶数,我们取 \(l-1=3\) 处的渐近分数 \(8/3\)。
验证:\(8^2 - 7 \times 3^2 = 64 - 63 = 1\)。因此基本解为 \((8, 3)\)。
这个方法之所以有效,是因为二次无理数的连分数展开是循环的,且其渐近分数给出了对 \(\sqrt{d}\) 的最佳有理逼近。佩尔方程的解正是这些优秀逼近的精确体现。
第六步:相关变体与意义
-
负佩尔方程:方程 \(x^2 - dy^2 = -1\)。此方程不一定有解。当且仅当 \(\sqrt{d}\) 的连分数展开的循环节长度 \(l\) 为奇数时,该方程有整数解。其基本解和生成方式与标准佩尔方程类似。
-
更一般的形式:方程 \(x^2 - dy^2 = N\)(\(N\) 为任意整数)。这被称为广义佩尔方程或佩尔型方程。它的解集更复杂,可能与多个解类(由 \(N\) 的理想类决定)相关联,求解通常需要利用对应标准佩尔方程的基本解。
-
理论意义:佩尔方程是连接古典丢番图分析、连分数、代数数论(单位理论)和二元二次型理论的完美桥梁。它的理论为解决更一般的二元二次丢番图方程奠定了基础。
总结:佩尔方程 \(x^2 - dy^2 = 1\) 是一个看似简单却内涵深刻的方程。它的所有正整数解由一个基本解通过幂次生成,而这个基本解可以通过计算 \(\sqrt{d}\) 的简单连分数展开来找到。该方程的解集结构清晰地揭示了实二次域单位群的无限循环特性。