可测函数序列的几乎处处收敛与依概率收敛的关系

字数 4555 2025-12-08 18:56:35

可测函数序列的几乎处处收敛与依概率收敛的关系

首先，让我们明确这两个收敛概念的定义和语境。我们考虑一个测度空间$(X, \mathcal{F}, \mu)$，以及定义在其上的一列可测函数$f_n: X \to \mathbb{R}$（或$\mathbb{C}$）和一个可测函数$f: X \to \mathbb{R}$。我们假设所有函数都是有限值的（或几乎处处有限），以避免技术上的复杂表述。

第一步：定义几乎处处收敛
$f_n$ 几乎处处收敛于$f$，记作 $f_n \xrightarrow{a.e.} f$，是指存在一个零测集$N \in \mathcal{F}$（即$\mu(N)=0$），使得对于所有$x \in X \setminus N$，都有 $\lim_{n \to \infty} f_n(x) = f(x)$。用集合语言精确描述是：集合 $\{ x: \lim_{n \to \infty} f_n(x) = f(x) \}$ 的补集是一个零测集。这意味着除了一个“微不足道”的点集外，函数序列在每个点都逐点收敛。

第二步：定义依概率收敛（在测度论中也常称为“依测度收敛”）
$f_n$ 依概率收敛于$f$，记作 $f_n \xrightarrow{\mu} f$，是指对于任意给定的$\epsilon > 0$，有

\[\lim_{n \to \infty} \mu( \{ x: |f_n(x) - f(x)| \ge \epsilon \} ) = 0. \]

这里的集合 $\{ x: |f_n(x) - f(x)| \ge \epsilon \}$ 测量了第$n$项函数与极限函数“偏差”超过$\epsilon$的那些点。依概率收敛要求，随着$n$增大，这些“坏点”所构成的集合的测度趋向于零。注意，它不关心那些“坏点”具体在哪里，只关心它们的“总大小”是否趋于零。

第三步：直观比较两种收敛

几乎处处收敛是“逐点”性质的，它关心几乎每一个单独的点的收敛行为。序列在某个点$x$不收敛，即使这样的$x$非常少（零测集），也会破坏几乎处处收敛。
依概率收敛是“整体”性质的，它允许序列在某些点上永远不收敛，只要随着$n$增大，这些“顽固不化”的点变得越来越稀少（测度趋于零）。它甚至允许每个点$x$都有无穷多个$n$使得$|f_n(x)-f(x)| \ge \epsilon$，只要对每个固定的$n$，这种“坏”点的测度整体在缩小。

第四步：建立基本关系（几乎处处收敛蕴含依概率收敛）
在$\mu(X) < \infty$（即全空间测度有限）的条件下，几乎处处收敛蕴含依概率收敛。这是一个非常重要的结论。
我们来证明这一点：假设$f_n \xrightarrow{a.e.} f$。根据几乎处处收敛的定义，存在零测集$N$，使得对任意$x \notin N$，$\lim_{n} f_n(x) = f(x)$。固定一个$\epsilon > 0$。对于$x \notin N$，因为$f_n(x) \to f(x)$，所以存在一个指标$M(x, \epsilon)$，使得对所有$n \ge M(x, \epsilon)$，有$|f_n(x)-f(x)| < \epsilon$。这意味着$x$最终会（对充分大的$n$）离开集合$A_n(\epsilon) := \{ x: |f_n(x) - f(x)| \ge \epsilon \}$。更精确地说，对$x \notin N$，$x$不属于所有足够大的$A_n(\epsilon)$的交集的下极限，即$x \notin \limsup_{n \to \infty} A_n(\epsilon) := \bigcap_{m=1}^\infty \bigcup_{n=m}^\infty A_n(\epsilon)$。这个$\limsup A_n(\epsilon)$正是“使得$|f_n(x)-f(x)| \ge \epsilon$对无穷多个$n$成立”的那些$x$的集合。由于几乎所有的$x$都收敛，我们有$\mu( \limsup_{n} A_n(\epsilon) ) = 0$。现在，注意$A_n(\epsilon) \subseteq \bigcup_{k=n}^\infty A_k(\epsilon)$，所以$\mu(A_n(\epsilon)) \le \mu( \bigcup_{k=n}^\infty A_k(\epsilon) )$。由于$\mu(X) < \infty$，我们可以使用测度的上连续性（或直接从可数可加性推导）：因为集合列$\bigcup_{k=n}^\infty A_k(\epsilon)$是递减的（随着$n$增大），并且其交集正是$\limsup_{n} A_n(\epsilon)$，其测度为零，所以

\[\lim_{n \to \infty} \mu( \bigcup_{k=n}^\infty A_k(\epsilon) ) = \mu( \limsup_{n} A_n(\epsilon) ) = 0. \]

因此，$\lim_{n \to \infty} \mu(A_n(\epsilon)) = 0$，这正是依概率收敛的定义。这里全空间测度有限的条件用在了保证“递减集列的交的测度等于测度极限”这一步（测度的上连续性在测度无限时也成立，但我们需要$\mu( \bigcup_{k=1}^\infty A_k(\epsilon) )$有限来从可数可加性推出极限为零，而$\mu(X) < \infty$确保了这一点）。

第五步：全空间测度无限时的反例
如果$\mu(X) = \infty$，几乎处处收敛推不出依概率收敛。经典反例：取$X = \mathbb{R}$，$\mu$为勒贝格测度。定义$f_n = \chi_{[n, n+1]}$，即区间$[n, n+1]$上的示性函数。则对任意$x \in \mathbb{R}$，当$n > x$时，$f_n(x)=0$，所以$f_n(x) \to 0$处处成立（不仅是几乎处处）。但是，对$\epsilon = 1/2$，集合$\{ x: |f_n(x)-0| \ge 1/2 \} = [n, n+1]$，其测度恒为1，不趋于0。所以$f_n$处处收敛于0，但不依概率收敛于0。

第六步：依概率收敛推不出几乎处处收敛
依概率收敛比几乎处处收敛弱得多。一个序列可以依概率收敛，但在每一点都发散。典型例子是“滑动区间”：设$X=[0,1]$，$\mu$为勒贝格测度。将区间$[0,1]$等分，并让示性函数在这些小区间上“滑动”。具体地，定义一列区间$I_1 = [0,1], I_2 = [0, 1/2], I_3 = [1/2, 1], I_4 = [0, 1/3], I_5 = [1/3, 2/3], I_6 = [2/3, 1], \dots$。令$f_n = \chi_{I_n}$。则对任意固定的$\epsilon > 0$，$\mu( \{ x: |f_n(x)-0| \ge \epsilon \} ) = \mu(I_n) \to 0$，所以$f_n \xrightarrow{\mu} 0$。然而，对任意一点$x \in [0,1]$，数列$f_n(x)$在0和1之间无限次振荡，故不收敛。这说明依概率收敛不能保证哪怕存在一个收敛的点。

第七步：子序列原理（联系两种收敛的关键）
虽然依概率收敛不蕴含几乎处处收敛，但它蕴含存在一个几乎处处收敛的子序列。这是沟通两种收敛的最重要桥梁。
定理：如果$f_n \xrightarrow{\mu} f$，则存在子序列$\{f_{n_k}\}$使得$f_{n_k} \xrightarrow{a.e.} f$。
证明思路（构造性）：由依概率收敛定义，对每个$k$，可取$n_k$使得对$\epsilon = 1/k$，有$\mu( \{ x: |f_{n_k}(x) - f(x)| \ge 1/k \} ) < 1/2^k$。可以选取$n_k$严格递增。然后考虑集合$E_k = \{ x: |f_{n_k}(x) - f(x)| \ge 1/k \}$。我们有$\sum_{k=1}^\infty \mu(E_k) < \infty$。由博雷尔-坎泰利引理，几乎所有的$x$只属于有限个$E_k$。这意味着，对几乎所有的$x$，存在$K(x)$，使得对所有$k \ge K(x)$，有$|f_{n_k}(x) - f(x)| < 1/k$。这正好说明$f_{n_k}(x) \to f(x)$。因此该子序列几乎处处收敛。

第八步：等价刻画（在有限测度空间）
在$\mu(X) < \infty$的条件下，以下陈述等价：

$f_n \xrightarrow{\mu} f$。
对$\{f_n\}$的任一子序列，都存在其进一步的子序列几乎处处收敛于$f$。
我们证明(1) $\Rightarrow$ (2)：若$f_n \xrightarrow{\mu} f$，则其任一子序列也依概率收敛于$f$。由上述子序列原理，这个子序列又有子序列几乎处处收敛于$f$。(2) $\Rightarrow$ (1)：用反证法，假设$f_n$不依概率收敛于$f$，则存在某个$\epsilon>0$，使得$\mu(|f_n - f| \ge \epsilon)$不趋于0。那么可以找到一个子序列$\{f_{n_k}\}$和常数$\delta>0$，使得$\mu(|f_{n_k} - f| \ge \epsilon) \ge \delta$对所有$k$成立。但根据条件(2)，这个子序列又有子序列几乎处处收敛于$f$，根据“几乎处处收敛蕴含依概率收敛”（在有限测度下），这个子子序列应依概率收敛于$f$，这与$\mu(|f_{n_k} - f| \ge \epsilon) \ge \delta$矛盾。这个等价刻画表明，在有限测度下，依概率收敛是一种“按子序列检查”的几乎处处收敛。

第九步：在概率论中的重要性
在概率论中，随机变量序列$X_n$依概率收敛于$X$（记$X_n \xrightarrow{P} X$）对应着“当$n$很大时，$X_n$与$X$有显著差异的概率很小”。几乎处处收敛（也称“以概率1收敛”）则更强，意味着$P(\lim_{n} X_n = X)=1$。上述子序列原理是证明许多极限定理（如强大数定律）的关键工具。例如，弱大数定律（依概率收敛）结合子序列原理和唯一性，可用于帮助证明强大数定律（几乎处处收敛）的某些版本。两者都是研究随机现象极限行为的核心概念，依概率收敛更易验证，而几乎处处收敛给出了更强的路径性结论。

可测函数序列的几乎处处收敛与依概率收敛的关系首先，让我们明确这两个收敛概念的定义和语境。我们考虑一个测度空间$(X, \mathcal{F}, \mu)$，以及定义在其上的一列可测函数$f_ n: X \to \mathbb{R}$（或$\mathbb{C}$）和一个可测函数$f: X \to \mathbb{R}$。我们假设所有函数都是有限值的（或几乎处处有限），以避免技术上的复杂表述。第一步：定义几乎处处收敛 $f_ n$ 几乎处处收敛于$f$，记作 $f_ n \xrightarrow{a.e.} f$，是指存在一个零测集$N \in \mathcal{F}$（即$\mu(N)=0$），使得对于所有$x \in X \setminus N$，都有 $\lim_ {n \to \infty} f_ n(x) = f(x)$。用集合语言精确描述是：集合 $\{ x: \lim_ {n \to \infty} f_ n(x) = f(x) \}$ 的补集是一个零测集。这意味着除了一个“微不足道”的点集外，函数序列在每个点都逐点收敛。第二步：定义依概率收敛（在测度论中也常称为“依测度收敛”） $f_ n$ 依概率收敛于$f$，记作 $f_ n \xrightarrow{\mu} f$，是指对于任意给定的$\epsilon > 0$，有 $$\lim_ {n \to \infty} \mu( \{ x: |f_ n(x) - f(x)| \ge \epsilon \} ) = 0.$$ 这里的集合 $\{ x: |f_ n(x) - f(x)| \ge \epsilon \}$ 测量了第$n$项函数与极限函数“偏差”超过$\epsilon$的那些点。依概率收敛要求，随着$n$增大，这些“坏点”所构成的集合的测度趋向于零。注意，它不关心那些“坏点”具体在哪里，只关心它们的“总大小”是否趋于零。第三步：直观比较两种收敛几乎处处收敛是“逐点”性质的，它关心几乎每一个单独的点的收敛行为。序列在某个点$x$不收敛，即使这样的$x$非常少（零测集），也会破坏几乎处处收敛。依概率收敛是“整体”性质的，它允许序列在某些点上永远不收敛，只要随着$n$增大，这些“顽固不化”的点变得越来越稀少（测度趋于零）。它甚至允许每个点$x$都有无穷多个$n$使得$|f_ n(x)-f(x)| \ge \epsilon$，只要对每个固定的$n$，这种“坏”点的测度整体在缩小。第四步：建立基本关系（几乎处处收敛蕴含依概率收敛）在$\mu(X) < \infty$（即全空间测度有限）的条件下，几乎处处收敛蕴含依概率收敛。这是一个非常重要的结论。我们来证明这一点：假设$f_ n \xrightarrow{a.e.} f$。根据几乎处处收敛的定义，存在零测集$N$，使得对任意$x \notin N$，$\lim_ {n} f_ n(x) = f(x)$。固定一个$\epsilon > 0$。对于$x \notin N$，因为$f_ n(x) \to f(x)$，所以存在一个指标$M(x, \epsilon)$，使得对所有$n \ge M(x, \epsilon)$，有$|f_ n(x)-f(x)| < \epsilon$。这意味着$x$最终会（对充分大的$n$）离开集合$A_ n(\epsilon) := \{ x: |f_ n(x) - f(x)| \ge \epsilon \}$。更精确地说，对$x \notin N$，$x$不属于所有足够大的$A_ n(\epsilon)$的交集的下极限，即$x \notin \limsup_ {n \to \infty} A_ n(\epsilon) := \bigcap_ {m=1}^\infty \bigcup_ {n=m}^\infty A_ n(\epsilon)$。这个$\limsup A_ n(\epsilon)$正是“使得$|f_ n(x)-f(x)| \ge \epsilon$对无穷多个$n$成立”的那些$x$的集合。由于几乎所有的$x$都收敛，我们有$\mu( \limsup_ {n} A_ n(\epsilon) ) = 0$。现在，注意$A_ n(\epsilon) \subseteq \bigcup_ {k=n}^\infty A_ k(\epsilon)$，所以$\mu(A_ n(\epsilon)) \le \mu( \bigcup_ {k=n}^\infty A_ k(\epsilon) )$。由于$\mu(X) < \infty$，我们可以使用测度的上连续性（或直接从可数可加性推导）：因为集合列$\bigcup_ {k=n}^\infty A_ k(\epsilon)$是递减的（随着$n$增大），并且其交集正是$\limsup_ {n} A_ n(\epsilon)$，其测度为零，所以 $$\lim_ {n \to \infty} \mu( \bigcup_ {k=n}^\infty A_ k(\epsilon) ) = \mu( \limsup_ {n} A_ n(\epsilon) ) = 0.$$ 因此，$\lim_ {n \to \infty} \mu(A_ n(\epsilon)) = 0$，这正是依概率收敛的定义。这里全空间测度有限的条件用在了保证“递减集列的交的测度等于测度极限”这一步（测度的上连续性在测度无限时也成立，但我们需要$\mu( \bigcup_ {k=1}^\infty A_ k(\epsilon) )$有限来从可数可加性推出极限为零，而$\mu(X) < \infty$确保了这一点）。第五步：全空间测度无限时的反例如果$\mu(X) = \infty$，几乎处处收敛推不出依概率收敛。经典反例：取$X = \mathbb{R}$，$\mu$为勒贝格测度。定义$f_ n = \chi_ {[ n, n+1]}$，即区间$[ n, n+1]$上的示性函数。则对任意$x \in \mathbb{R}$，当$n > x$时，$f_ n(x)=0$，所以$f_ n(x) \to 0$处处成立（不仅是几乎处处）。但是，对$\epsilon = 1/2$，集合$\{ x: |f_ n(x)-0| \ge 1/2 \} = [ n, n+1]$，其测度恒为1，不趋于0。所以$f_ n$处处收敛于0，但不依概率收敛于0。第六步：依概率收敛推不出几乎处处收敛依概率收敛比几乎处处收敛弱得多。一个序列可以依概率收敛，但在每一点都发散。典型例子是“滑动区间”：设$X=[ 0,1]$，$\mu$为勒贝格测度。将区间$[ 0,1]$等分，并让示性函数在这些小区间上“滑动”。具体地，定义一列区间$I_ 1 = [ 0,1], I_ 2 = [ 0, 1/2], I_ 3 = [ 1/2, 1], I_ 4 = [ 0, 1/3], I_ 5 = [ 1/3, 2/3], I_ 6 = [ 2/3, 1], \dots$。令$f_ n = \chi_ {I_ n}$。则对任意固定的$\epsilon > 0$，$\mu( \{ x: |f_ n(x)-0| \ge \epsilon \} ) = \mu(I_ n) \to 0$，所以$f_ n \xrightarrow{\mu} 0$。然而，对任意一点$x \in [ 0,1]$，数列$f_ n(x)$在0和1之间无限次振荡，故不收敛。这说明依概率收敛不能保证哪怕存在一个收敛的点。第七步：子序列原理（联系两种收敛的关键）虽然依概率收敛不蕴含几乎处处收敛，但它蕴含存在一个几乎处处收敛的子序列。这是沟通两种收敛的最重要桥梁。定理：如果$f_ n \xrightarrow{\mu} f$，则存在子序列$\{f_ {n_ k}\}$使得$f_ {n_ k} \xrightarrow{a.e.} f$。证明思路（构造性）：由依概率收敛定义，对每个$k$，可取$n_ k$使得对$\epsilon = 1/k$，有$\mu( \{ x: |f_ {n_ k}(x) - f(x)| \ge 1/k \} ) < 1/2^k$。可以选取$n_ k$严格递增。然后考虑集合$E_ k = \{ x: |f_ {n_ k}(x) - f(x)| \ge 1/k \}$。我们有$\sum_ {k=1}^\infty \mu(E_ k) < \infty$。由博雷尔-坎泰利引理，几乎所有的$x$只属于有限个$E_ k$。这意味着，对几乎所有的$x$，存在$K(x)$，使得对所有$k \ge K(x)$，有$|f_ {n_ k}(x) - f(x)| < 1/k$。这正好说明$f_ {n_ k}(x) \to f(x)$。因此该子序列几乎处处收敛。第八步：等价刻画（在有限测度空间）在$\mu(X) < \infty$的条件下，以下陈述等价： $f_ n \xrightarrow{\mu} f$。对$\{f_ n\}$的任一子序列，都存在其进一步的子序列几乎处处收敛于$f$。我们证明(1) $\Rightarrow$ (2)：若$f_ n \xrightarrow{\mu} f$，则其任一子序列也依概率收敛于$f$。由上述子序列原理，这个子序列又有子序列几乎处处收敛于$f$。(2) $\Rightarrow$ (1)：用反证法，假设$f_ n$不依概率收敛于$f$，则存在某个$\epsilon>0$，使得$\mu(|f_ n - f| \ge \epsilon)$不趋于0。那么可以找到一个子序列$\{f_ {n_ k}\}$和常数$\delta>0$，使得$\mu(|f_ {n_ k} - f| \ge \epsilon) \ge \delta$对所有$k$成立。但根据条件(2)，这个子序列又有子序列几乎处处收敛于$f$，根据“几乎处处收敛蕴含依概率收敛”（在有限测度下），这个子子序列应依概率收敛于$f$，这与$\mu(|f_ {n_ k} - f| \ge \epsilon) \ge \delta$矛盾。这个等价刻画表明，在有限测度下，依概率收敛是一种“按子序列检查”的几乎处处收敛。第九步：在概率论中的重要性在概率论中，随机变量序列$X_ n$依概率收敛于$X$（记$X_ n \xrightarrow{P} X$）对应着“当$n$很大时，$X_ n$与$X$有显著差异的概率很小”。几乎处处收敛（也称“以概率1收敛”）则更强，意味着$P(\lim_ {n} X_ n = X)=1$。上述子序列原理是证明许多极限定理（如强大数定律）的关键工具。例如，弱大数定律（依概率收敛）结合子序列原理和唯一性，可用于帮助证明强大数定律（几乎处处收敛）的某些版本。两者都是研究随机现象极限行为的核心概念，依概率收敛更易验证，而几乎处处收敛给出了更强的路径性结论。