可测函数序列的几乎处处收敛与依概率收敛的关系
字数 4555 2025-12-08 18:56:35

可测函数序列的几乎处处收敛与依概率收敛的关系

首先,让我们明确这两个收敛概念的定义和语境。我们考虑一个测度空间\((X, \mathcal{F}, \mu)\),以及定义在其上的一列可测函数\(f_n: X \to \mathbb{R}\)(或\(\mathbb{C}\))和一个可测函数\(f: X \to \mathbb{R}\)。我们假设所有函数都是有限值的(或几乎处处有限),以避免技术上的复杂表述。

第一步:定义几乎处处收敛
\(f_n\) 几乎处处收敛于\(f\),记作 \(f_n \xrightarrow{a.e.} f\),是指存在一个零测集\(N \in \mathcal{F}\)(即\(\mu(N)=0\)),使得对于所有\(x \in X \setminus N\),都有 \(\lim_{n \to \infty} f_n(x) = f(x)\)。用集合语言精确描述是:集合 \(\{ x: \lim_{n \to \infty} f_n(x) = f(x) \}\) 的补集是一个零测集。这意味着除了一个“微不足道”的点集外,函数序列在每个点都逐点收敛。

第二步:定义依概率收敛(在测度论中也常称为“依测度收敛”)
\(f_n\) 依概率收敛于\(f\),记作 \(f_n \xrightarrow{\mu} f\),是指对于任意给定的\(\epsilon > 0\),有

\[\lim_{n \to \infty} \mu( \{ x: |f_n(x) - f(x)| \ge \epsilon \} ) = 0. \]

这里的集合 \(\{ x: |f_n(x) - f(x)| \ge \epsilon \}\) 测量了第\(n\)项函数与极限函数“偏差”超过\(\epsilon\)的那些点。依概率收敛要求,随着\(n\)增大,这些“坏点”所构成的集合的测度趋向于零。注意,它不关心那些“坏点”具体在哪里,只关心它们的“总大小”是否趋于零。

第三步:直观比较两种收敛

  • 几乎处处收敛是“逐点”性质的,它关心几乎每一个单独的点的收敛行为。序列在某个点\(x\)不收敛,即使这样的\(x\)非常少(零测集),也会破坏几乎处处收敛。
  • 依概率收敛是“整体”性质的,它允许序列在某些点上永远不收敛,只要随着\(n\)增大,这些“顽固不化”的点变得越来越稀少(测度趋于零)。它甚至允许每个点\(x\)都有无穷多个\(n\)使得\(|f_n(x)-f(x)| \ge \epsilon\),只要对每个固定的\(n\),这种“坏”点的测度整体在缩小。

第四步:建立基本关系(几乎处处收敛蕴含依概率收敛)
\(\mu(X) < \infty\)(即全空间测度有限)的条件下,几乎处处收敛蕴含依概率收敛。这是一个非常重要的结论。
我们来证明这一点:假设\(f_n \xrightarrow{a.e.} f\)。根据几乎处处收敛的定义,存在零测集\(N\),使得对任意\(x \notin N\)\(\lim_{n} f_n(x) = f(x)\)。固定一个\(\epsilon > 0\)。对于\(x \notin N\),因为\(f_n(x) \to f(x)\),所以存在一个指标\(M(x, \epsilon)\),使得对所有\(n \ge M(x, \epsilon)\),有\(|f_n(x)-f(x)| < \epsilon\)。这意味着\(x\)最终会(对充分大的\(n\))离开集合\(A_n(\epsilon) := \{ x: |f_n(x) - f(x)| \ge \epsilon \}\)。更精确地说,对\(x \notin N\)\(x\)不属于所有足够大的\(A_n(\epsilon)\)的交集的下极限,即\(x \notin \limsup_{n \to \infty} A_n(\epsilon) := \bigcap_{m=1}^\infty \bigcup_{n=m}^\infty A_n(\epsilon)\)。这个\(\limsup A_n(\epsilon)\)正是“使得\(|f_n(x)-f(x)| \ge \epsilon\)对无穷多个\(n\)成立”的那些\(x\)的集合。由于几乎所有的\(x\)都收敛,我们有\(\mu( \limsup_{n} A_n(\epsilon) ) = 0\)。现在,注意\(A_n(\epsilon) \subseteq \bigcup_{k=n}^\infty A_k(\epsilon)\),所以\(\mu(A_n(\epsilon)) \le \mu( \bigcup_{k=n}^\infty A_k(\epsilon) )\)。由于\(\mu(X) < \infty\),我们可以使用测度的上连续性(或直接从可数可加性推导):因为集合列\(\bigcup_{k=n}^\infty A_k(\epsilon)\)是递减的(随着\(n\)增大),并且其交集正是\(\limsup_{n} A_n(\epsilon)\),其测度为零,所以

\[\lim_{n \to \infty} \mu( \bigcup_{k=n}^\infty A_k(\epsilon) ) = \mu( \limsup_{n} A_n(\epsilon) ) = 0. \]

因此,\(\lim_{n \to \infty} \mu(A_n(\epsilon)) = 0\),这正是依概率收敛的定义。这里全空间测度有限的条件用在了保证“递减集列的交的测度等于测度极限”这一步(测度的上连续性在测度无限时也成立,但我们需要\(\mu( \bigcup_{k=1}^\infty A_k(\epsilon) )\)有限来从可数可加性推出极限为零,而\(\mu(X) < \infty\)确保了这一点)。

第五步:全空间测度无限时的反例
如果\(\mu(X) = \infty\),几乎处处收敛推不出依概率收敛。经典反例:取\(X = \mathbb{R}\)\(\mu\)为勒贝格测度。定义\(f_n = \chi_{[n, n+1]}\),即区间\([n, n+1]\)上的示性函数。则对任意\(x \in \mathbb{R}\),当\(n > x\)时,\(f_n(x)=0\),所以\(f_n(x) \to 0\)处处成立(不仅是几乎处处)。但是,对\(\epsilon = 1/2\),集合\(\{ x: |f_n(x)-0| \ge 1/2 \} = [n, n+1]\),其测度恒为1,不趋于0。所以\(f_n\)处处收敛于0,但不依概率收敛于0。

第六步:依概率收敛推不出几乎处处收敛
依概率收敛比几乎处处收敛弱得多。一个序列可以依概率收敛,但在每一点都发散。典型例子是“滑动区间”:设\(X=[0,1]\)\(\mu\)为勒贝格测度。将区间\([0,1]\)等分,并让示性函数在这些小区间上“滑动”。具体地,定义一列区间\(I_1 = [0,1], I_2 = [0, 1/2], I_3 = [1/2, 1], I_4 = [0, 1/3], I_5 = [1/3, 2/3], I_6 = [2/3, 1], \dots\)。令\(f_n = \chi_{I_n}\)。则对任意固定的\(\epsilon > 0\)\(\mu( \{ x: |f_n(x)-0| \ge \epsilon \} ) = \mu(I_n) \to 0\),所以\(f_n \xrightarrow{\mu} 0\)。然而,对任意一点\(x \in [0,1]\),数列\(f_n(x)\)在0和1之间无限次振荡,故不收敛。这说明依概率收敛不能保证哪怕存在一个收敛的点。

第七步:子序列原理(联系两种收敛的关键)
虽然依概率收敛不蕴含几乎处处收敛,但它蕴含存在一个几乎处处收敛的子序列。这是沟通两种收敛的最重要桥梁。
定理:如果\(f_n \xrightarrow{\mu} f\),则存在子序列\(\{f_{n_k}\}\)使得\(f_{n_k} \xrightarrow{a.e.} f\)
证明思路(构造性):由依概率收敛定义,对每个\(k\),可取\(n_k\)使得对\(\epsilon = 1/k\),有\(\mu( \{ x: |f_{n_k}(x) - f(x)| \ge 1/k \} ) < 1/2^k\)。可以选取\(n_k\)严格递增。然后考虑集合\(E_k = \{ x: |f_{n_k}(x) - f(x)| \ge 1/k \}\)。我们有\(\sum_{k=1}^\infty \mu(E_k) < \infty\)。由博雷尔-坎泰利引理,几乎所有的\(x\)只属于有限个\(E_k\)。这意味着,对几乎所有的\(x\),存在\(K(x)\),使得对所有\(k \ge K(x)\),有\(|f_{n_k}(x) - f(x)| < 1/k\)。这正好说明\(f_{n_k}(x) \to f(x)\)。因此该子序列几乎处处收敛。

第八步:等价刻画(在有限测度空间)
\(\mu(X) < \infty\)的条件下,以下陈述等价:

  1. \(f_n \xrightarrow{\mu} f\)
  2. \(\{f_n\}\)的任一子序列,都存在其进一步的子序列几乎处处收敛于\(f\)
    我们证明(1) \(\Rightarrow\) (2):若\(f_n \xrightarrow{\mu} f\),则其任一子序列也依概率收敛于\(f\)。由上述子序列原理,这个子序列又有子序列几乎处处收敛于\(f\)。(2) \(\Rightarrow\) (1):用反证法,假设\(f_n\)不依概率收敛于\(f\),则存在某个\(\epsilon>0\),使得\(\mu(|f_n - f| \ge \epsilon)\)不趋于0。那么可以找到一个子序列\(\{f_{n_k}\}\)和常数\(\delta>0\),使得\(\mu(|f_{n_k} - f| \ge \epsilon) \ge \delta\)对所有\(k\)成立。但根据条件(2),这个子序列又有子序列几乎处处收敛于\(f\),根据“几乎处处收敛蕴含依概率收敛”(在有限测度下),这个子子序列应依概率收敛于\(f\),这与\(\mu(|f_{n_k} - f| \ge \epsilon) \ge \delta\)矛盾。这个等价刻画表明,在有限测度下,依概率收敛是一种“按子序列检查”的几乎处处收敛。

第九步:在概率论中的重要性
在概率论中,随机变量序列\(X_n\)依概率收敛于\(X\)(记\(X_n \xrightarrow{P} X\))对应着“当\(n\)很大时,\(X_n\)\(X\)有显著差异的概率很小”。几乎处处收敛(也称“以概率1收敛”)则更强,意味着\(P(\lim_{n} X_n = X)=1\)。上述子序列原理是证明许多极限定理(如强大数定律)的关键工具。例如,弱大数定律(依概率收敛)结合子序列原理和唯一性,可用于帮助证明强大数定律(几乎处处收敛)的某些版本。两者都是研究随机现象极限行为的核心概念,依概率收敛更易验证,而几乎处处收敛给出了更强的路径性结论。

可测函数序列的几乎处处收敛与依概率收敛的关系 首先,让我们明确这两个收敛概念的定义和语境。我们考虑一个测度空间$(X, \mathcal{F}, \mu)$,以及定义在其上的一列可测函数$f_ n: X \to \mathbb{R}$(或$\mathbb{C}$)和一个可测函数$f: X \to \mathbb{R}$。我们假设所有函数都是有限值的(或几乎处处有限),以避免技术上的复杂表述。 第一步:定义几乎处处收敛 $f_ n$ 几乎处处收敛于$f$,记作 $f_ n \xrightarrow{a.e.} f$,是指存在一个零测集$N \in \mathcal{F}$(即$\mu(N)=0$),使得对于所有$x \in X \setminus N$,都有 $\lim_ {n \to \infty} f_ n(x) = f(x)$。用集合语言精确描述是:集合 $\{ x: \lim_ {n \to \infty} f_ n(x) = f(x) \}$ 的补集是一个零测集。这意味着除了一个“微不足道”的点集外,函数序列在每个点都逐点收敛。 第二步:定义依概率收敛(在测度论中也常称为“依测度收敛”) $f_ n$ 依概率收敛于$f$,记作 $f_ n \xrightarrow{\mu} f$,是指对于任意给定的$\epsilon > 0$,有 $$\lim_ {n \to \infty} \mu( \{ x: |f_ n(x) - f(x)| \ge \epsilon \} ) = 0.$$ 这里的集合 $\{ x: |f_ n(x) - f(x)| \ge \epsilon \}$ 测量了第$n$项函数与极限函数“偏差”超过$\epsilon$的那些点。依概率收敛要求,随着$n$增大,这些“坏点”所构成的集合的测度趋向于零。注意,它不关心那些“坏点”具体在哪里,只关心它们的“总大小”是否趋于零。 第三步:直观比较两种收敛 几乎处处收敛是“逐点”性质的,它关心几乎每一个单独的点的收敛行为。序列在某个点$x$不收敛,即使这样的$x$非常少(零测集),也会破坏几乎处处收敛。 依概率收敛是“整体”性质的,它允许序列在某些点上永远不收敛,只要随着$n$增大,这些“顽固不化”的点变得越来越稀少(测度趋于零)。它甚至允许每个点$x$都有无穷多个$n$使得$|f_ n(x)-f(x)| \ge \epsilon$,只要对每个固定的$n$,这种“坏”点的测度整体在缩小。 第四步:建立基本关系(几乎处处收敛蕴含依概率收敛) 在$\mu(X) < \infty$(即全空间测度有限)的条件下,几乎处处收敛蕴含依概率收敛。这是一个非常重要的结论。 我们来证明这一点:假设$f_ n \xrightarrow{a.e.} f$。根据几乎处处收敛的定义,存在零测集$N$,使得对任意$x \notin N$,$\lim_ {n} f_ n(x) = f(x)$。固定一个$\epsilon > 0$。对于$x \notin N$,因为$f_ n(x) \to f(x)$,所以存在一个指标$M(x, \epsilon)$,使得对所有$n \ge M(x, \epsilon)$,有$|f_ n(x)-f(x)| < \epsilon$。这意味着$x$最终会(对充分大的$n$)离开集合$A_ n(\epsilon) := \{ x: |f_ n(x) - f(x)| \ge \epsilon \}$。更精确地说,对$x \notin N$,$x$不属于所有足够大的$A_ n(\epsilon)$的交集的下极限,即$x \notin \limsup_ {n \to \infty} A_ n(\epsilon) := \bigcap_ {m=1}^\infty \bigcup_ {n=m}^\infty A_ n(\epsilon)$。这个$\limsup A_ n(\epsilon)$正是“使得$|f_ n(x)-f(x)| \ge \epsilon$对无穷多个$n$成立”的那些$x$的集合。由于几乎所有的$x$都收敛,我们有$\mu( \limsup_ {n} A_ n(\epsilon) ) = 0$。现在,注意$A_ n(\epsilon) \subseteq \bigcup_ {k=n}^\infty A_ k(\epsilon)$,所以$\mu(A_ n(\epsilon)) \le \mu( \bigcup_ {k=n}^\infty A_ k(\epsilon) )$。由于$\mu(X) < \infty$,我们可以使用测度的上连续性(或直接从可数可加性推导):因为集合列$\bigcup_ {k=n}^\infty A_ k(\epsilon)$是递减的(随着$n$增大),并且其交集正是$\limsup_ {n} A_ n(\epsilon)$,其测度为零,所以 $$\lim_ {n \to \infty} \mu( \bigcup_ {k=n}^\infty A_ k(\epsilon) ) = \mu( \limsup_ {n} A_ n(\epsilon) ) = 0.$$ 因此,$\lim_ {n \to \infty} \mu(A_ n(\epsilon)) = 0$,这正是依概率收敛的定义。这里全空间测度有限的条件用在了保证“递减集列的交的测度等于测度极限”这一步(测度的上连续性在测度无限时也成立,但我们需要$\mu( \bigcup_ {k=1}^\infty A_ k(\epsilon) )$有限来从可数可加性推出极限为零,而$\mu(X) < \infty$确保了这一点)。 第五步:全空间测度无限时的反例 如果$\mu(X) = \infty$,几乎处处收敛推不出依概率收敛。经典反例:取$X = \mathbb{R}$,$\mu$为勒贝格测度。定义$f_ n = \chi_ {[ n, n+1]}$,即区间$[ n, n+1]$上的示性函数。则对任意$x \in \mathbb{R}$,当$n > x$时,$f_ n(x)=0$,所以$f_ n(x) \to 0$处处成立(不仅是几乎处处)。但是,对$\epsilon = 1/2$,集合$\{ x: |f_ n(x)-0| \ge 1/2 \} = [ n, n+1]$,其测度恒为1,不趋于0。所以$f_ n$处处收敛于0,但不依概率收敛于0。 第六步:依概率收敛推不出几乎处处收敛 依概率收敛比几乎处处收敛弱得多。一个序列可以依概率收敛,但在每一点都发散。典型例子是“滑动区间”:设$X=[ 0,1]$,$\mu$为勒贝格测度。将区间$[ 0,1]$等分,并让示性函数在这些小区间上“滑动”。具体地,定义一列区间$I_ 1 = [ 0,1], I_ 2 = [ 0, 1/2], I_ 3 = [ 1/2, 1], I_ 4 = [ 0, 1/3], I_ 5 = [ 1/3, 2/3], I_ 6 = [ 2/3, 1], \dots$。令$f_ n = \chi_ {I_ n}$。则对任意固定的$\epsilon > 0$,$\mu( \{ x: |f_ n(x)-0| \ge \epsilon \} ) = \mu(I_ n) \to 0$,所以$f_ n \xrightarrow{\mu} 0$。然而,对任意一点$x \in [ 0,1]$,数列$f_ n(x)$在0和1之间无限次振荡,故不收敛。这说明依概率收敛不能保证哪怕存在一个收敛的点。 第七步:子序列原理(联系两种收敛的关键) 虽然依概率收敛不蕴含几乎处处收敛,但它蕴含存在一个几乎处处收敛的子序列。这是沟通两种收敛的最重要桥梁。 定理:如果$f_ n \xrightarrow{\mu} f$,则存在子序列$\{f_ {n_ k}\}$使得$f_ {n_ k} \xrightarrow{a.e.} f$。 证明思路(构造性):由依概率收敛定义,对每个$k$,可取$n_ k$使得对$\epsilon = 1/k$,有$\mu( \{ x: |f_ {n_ k}(x) - f(x)| \ge 1/k \} ) < 1/2^k$。可以选取$n_ k$严格递增。然后考虑集合$E_ k = \{ x: |f_ {n_ k}(x) - f(x)| \ge 1/k \}$。我们有$\sum_ {k=1}^\infty \mu(E_ k) < \infty$。由博雷尔-坎泰利引理,几乎所有的$x$只属于有限个$E_ k$。这意味着,对几乎所有的$x$,存在$K(x)$,使得对所有$k \ge K(x)$,有$|f_ {n_ k}(x) - f(x)| < 1/k$。这正好说明$f_ {n_ k}(x) \to f(x)$。因此该子序列几乎处处收敛。 第八步:等价刻画(在有限测度空间) 在$\mu(X) < \infty$的条件下,以下陈述等价: $f_ n \xrightarrow{\mu} f$。 对$\{f_ n\}$的任一子序列,都存在其进一步的子序列几乎处处收敛于$f$。 我们证明(1) $\Rightarrow$ (2):若$f_ n \xrightarrow{\mu} f$,则其任一子序列也依概率收敛于$f$。由上述子序列原理,这个子序列又有子序列几乎处处收敛于$f$。(2) $\Rightarrow$ (1):用反证法,假设$f_ n$不依概率收敛于$f$,则存在某个$\epsilon>0$,使得$\mu(|f_ n - f| \ge \epsilon)$不趋于0。那么可以找到一个子序列$\{f_ {n_ k}\}$和常数$\delta>0$,使得$\mu(|f_ {n_ k} - f| \ge \epsilon) \ge \delta$对所有$k$成立。但根据条件(2),这个子序列又有子序列几乎处处收敛于$f$,根据“几乎处处收敛蕴含依概率收敛”(在有限测度下),这个子子序列应依概率收敛于$f$,这与$\mu(|f_ {n_ k} - f| \ge \epsilon) \ge \delta$矛盾。这个等价刻画表明,在有限测度下,依概率收敛是一种“按子序列检查”的几乎处处收敛。 第九步:在概率论中的重要性 在概率论中,随机变量序列$X_ n$依概率收敛于$X$(记$X_ n \xrightarrow{P} X$)对应着“当$n$很大时,$X_ n$与$X$有显著差异的概率很小”。几乎处处收敛(也称“以概率1收敛”)则更强,意味着$P(\lim_ {n} X_ n = X)=1$。上述子序列原理是证明许多极限定理(如强大数定律)的关键工具。例如,弱大数定律(依概率收敛)结合子序列原理和唯一性,可用于帮助证明强大数定律(几乎处处收敛)的某些版本。两者都是研究随机现象极限行为的核心概念,依概率收敛更易验证,而几乎处处收敛给出了更强的路径性结论。