同余子群
我们先从同余子群在数论中所处的“位置”说起。在数论中,模形式是一种在复上半平面上满足特定函数方程的全纯函数,它们是研究许多算术问题(如素数分布、二次型、椭圆曲线等)的核心工具。然而,一个模形式并不是孤立定义的,它总是相对于某个“对称群”来定义的。这个对称群通常是模群 \(SL_2(\mathbb{Z})\) 的某个子群。而同余子群,就是模群中一类最重要、最常用的子群。可以说,要理解模形式,就必须先理解同余子群。
第一步:基础——模群 \(SL_2(\mathbb{Z})\)
- 定义:模群 \(SL_2(\mathbb{Z})\) 是所有行列式为1的2×2整数矩阵构成的集合:
\[ SL_2(\mathbb{Z}) = \left\{ \begin{pmatrix} a & b \\ c & d \end{pmatrix} : a, b, c, d \in \mathbb{Z},\ ad - bc = 1 \right\}. \]
- 作用:这个群通过分式线性变换作用在复上半平面 \(\mathbb{H} = \{ \tau \in \mathbb{C} : \text{Im}(\tau) > 0 \}\) 上:
\[ \begin{pmatrix} a & b \\ c & d \end{pmatrix} \cdot \tau = \frac{a\tau + b}{c\tau + d}. \]
这个作用保持上半平面不变,且是“保向”的。
- 基本域:模群在 \(\mathbb{H}\) 上的作用不是单的,但我们可以选取一个基本区域,通常是 \(|\tau| \ge 1\) 和 \(|\text{Re}(\tau)| \le 1/2\) 的交集。这个区域内的每个点都代表一个轨道,除了边界上需要等价粘合。
第二步:同余子群的定义与标准例子
同余子群的核心特征是“模某个整数同余”。这是从 \(SL_2(\mathbb{Z})\) 到有限群的同态引出的。
- 约化同态:固定一个正整数 \(N\)。考虑从 \(SL_2(\mathbb{Z})\) 到 \(SL_2(\mathbb{Z}/N\mathbb{Z})\) 的“模N约化”映射:
\[ \pi_N: \begin{pmatrix} a & b \\ c & d \end{pmatrix} \mapsto \begin{pmatrix} a \mod N & b \mod N \\ c \mod N & d \mod N \end{pmatrix}. \]
因为行列式是1,模N后行列式在 \(\mathbb{Z}/N\mathbb{Z}\) 中仍为1,所以这个映射是良定义的群同态。
- 同余子群:模群 \(SL_2(\mathbb{Z})\) 的一个子群 \(\Gamma\) 如果包含某个主同余子群 \(\Gamma(N)\),则称 \(\Gamma\) 为一个同余子群。
- 主同余子群 \(\Gamma(N)\):是上述同态 \(\pi_N\) 的核。即所有模N后等于单位矩阵的矩阵组成的子群:
\[ \Gamma(N) = \left\{ \begin{pmatrix} a & b \\ c & d \end{pmatrix} \in SL_2(\mathbb{Z}) : a \equiv d \equiv 1 \ (\text{mod } N),\ b \equiv c \equiv 0 \ (\text{mod } N) \right\}. \]
它是最“小”的同余子群之一,由满足严格同余条件的矩阵构成。
- 几个最重要的标准同余子群:
- \(\Gamma_0(N)\):放宽条件,只要求矩阵的“左下角”元素是N的倍数。
\[ \Gamma_0(N) = \left\{ \begin{pmatrix} a & b \\ c & d \end{pmatrix} \in SL_2(\mathbb{Z}) : c \equiv 0 \ (\text{mod } N) \right\}. \]
它是数论中应用最广泛的同余子群,许多重要的模形式(如与椭圆曲线相关的模形式)都是相对于 \(\Gamma_0(N)\) 定义的。
- \(\Gamma_1(N)\):在 \(\Gamma_0(N)\) 基础上,进一步要求对角线元素模N同余于1。
\[ \Gamma_1(N) = \left\{ \begin{pmatrix} a & b \\ c & d \end{pmatrix} \in SL_2(\mathbb{Z}) : c \equiv 0,\ a \equiv d \equiv 1 \ (\text{mod } N) \right\}. \]
- 它们之间有包含关系:\(\Gamma(N) \subset \Gamma_1(N) \subset \Gamma_0(N) \subset SL_2(\mathbb{Z})\)。
第三步:同余子群的几何与算术意义
-
基本域:由于同余子群 \(\Gamma\) 比 \(SL_2(\mathbb{Z})\) 更大(元素更多,实际上 \(\Gamma\) 是 \(SL_2(\mathbb{Z})\) 的子群,所以 \(\Gamma\) 的元素更少,其作用更“精细”,基本域更大),它在 \(\mathbb{H}\) 上的基本域比模群的基本域更“大”,或者说是由许多个模群基本域的拷贝拼接而成。这个基本域代表了商空间 \(\Gamma \backslash \mathbb{H}\)。
-
尖点:上半平面 \(\mathbb{H}\) 的边界是实轴,但实轴上的点(包括无穷远点)在模群作用下可以被“拉到”基本域的边界上。这些点称为尖点。对于同余子群,尖点对应于有理数 \(\mathbb{Q} \cup \{\infty\}\) 在 \(\Gamma\) 作用下的轨道。理解尖点的数量和结构对于定义模形式至关重要,因为模形式需要在尖点处也有良好的行为(全纯或亚纯)。
-
级:正整数 \(N\) 称为同余子群 \(\Gamma\) 的级。如果 \(\Gamma \supset \Gamma(N)\),则 \(N\) 的倍数也是它的级,但我们通常取最小的那个 \(N\) 作为它的级。级 \(N\) 控制了许多算术性质。
第四步:同余子群与模形式
现在,我们可以给出基于同余子群的模形式定义。
- 权k,级N的模形式:设 \(k\) 为整数(权),\(\Gamma\) 是一个级为 \(N\) 的同余子群(例如 \(\Gamma_0(N)\))。一个函数 \(f: \mathbb{H} \to \mathbb{C}\) 称为权为k,关于\(\Gamma\)的模形式,如果满足:
a. 全纯性:\(f\) 在 \(\mathbb{H}\) 上是全纯的。
b. 模变换性:对任意 \(\gamma = \begin{pmatrix} a & b \\ c & d \end{pmatrix} \in \Gamma\) 和任意 \(\tau \in \mathbb{H}\),有
\[ f(\gamma \tau) = (c\tau + d)^k f(\tau). \]
这里的 \((c\tau + d)^k\) 称为自守因子,它补偿了分式线性变换对函数值的影响,使得定义在商空间 \(\Gamma \backslash \mathbb{H}\) 上的某种“微分形式”是良定义的。
c. 在尖点处全纯:\(f\) 在每个尖点处有傅里叶展开,且展开式没有负幂项。这意味着 \(f\) 在尖点处是“有界”的(更准确地说,是“全纯”的)。
如果进一步要求在每个尖点处的傅里叶展开常数项为0,则称 \(f\) 为尖点形式。尖点形式构成了模形式空间的核心,具有更深刻的性质。
- 为什么必须是同余子群? 这个条件保证了商空间 \(\Gamma \backslash \mathbb{H}\) 可以紧化成一张紧黎曼面(通过添加尖点)。在这个紧黎曼面上,全纯函数和微分形式有很好的理论。如果 \(\Gamma\) 不是同余子群(即不包含任何 \(\Gamma(N)\)),那么得到的商空间可能不是“代数”的,与算术的联系会变得非常薄弱。同余子群条件确保了模形式理论可以与伽罗瓦表示、椭圆曲线、代数几何等深刻算术对象产生联系。
第五步:同余子群的推广与总结
-
更高阶的推广:同余子群的概念可以推广到更一般的代数群上,例如 \(Sp_{2n}(\mathbb{Z})\)(辛群),此时对应的模形式是西格尔模形式。其定义依然依赖于一个“级”为 \(N\) 的主同余子群。
-
总结:同余子群是模群 \(SL_2(\mathbb{Z})\) 中由“模某个整数 \(N\) 同余”条件定义的一类子群(如 \(\Gamma(N), \Gamma_0(N), \Gamma_1(N)\))。它们是定义模形式的对称性基础。通过要求模形式相对于一个同余子群变换,我们确保了:
- 函数在商空间 \(\Gamma \backslash \mathbb{H}\) 上有良定义。
- 该商空间具有良好的几何结构(可紧化的黎曼面)。
- 模形式理论能与数论、算术几何中的核心问题(如素数、方程的解、L函数)产生丰富而可计算的深刻联系。
因此,同余子群是连接复分析、双曲几何与经典数论及现代算术几何的一座关键桥梁。