可测函数序列的几乎处处收敛与依概率收敛的关系
首先,让我们明确这两个收敛概念的定义和语境。我们考虑一个测度空间\((X, \mathcal{F}, \mu)\),以及定义在其上的一列可测函数\(f_n: X \to \mathbb{R}\)(或\(\mathbb{C}\))和一个可测函数\(f: X \to \mathbb{R}\)。我们假设所有函数都是有限值的(或几乎处处有限),以避免技术上的复杂表述。
第一步:定义几乎处处收敛
\(f_n\) 几乎处处收敛于\(f\),记作 \(f_n \xrightarrow{a.e.} f\),是指存在一个零测集\(N \in \mathcal{F}\)(即\(\mu(N)=0\)),使得对于所有\(x \in X \setminus N\),都有 \(\lim_{n \to \infty} f_n(x) = f(x)\)。用集合语言精确描述是:集合 \(\{ x: \lim_{n \to \infty} f_n(x) = f(x) \}\) 的补集是一个零测集。这意味着除了一个“微不足道”的点集外,函数序列在每个点都逐点收敛。
第二步:定义依概率收敛(在测度论中也常称为“依测度收敛”)
\(f_n\) 依概率收敛于\(f\),记作 \(f_n \xrightarrow{\mu} f\),是指对于任意给定的\(\epsilon > 0\),有
\[\lim_{n \to \infty} \mu( \{ x: |f_n(x) - f(x)| \ge \epsilon \} ) = 0. \]
这里的集合 \(\{ x: |f_n(x) - f(x)| \ge \epsilon \}\) 测量了第\(n\)项函数与极限函数“偏差”超过\(\epsilon\)的那些点。依概率收敛要求,随着\(n\)增大,这些“坏点”所构成的集合的测度趋向于零。注意,它不关心那些“坏点”具体在哪里,只关心它们的“总大小”是否趋于零。
第三步:直观比较两种收敛
- 几乎处处收敛是“逐点”性质的,它关心几乎每一个单独的点的收敛行为。序列在某个点\(x\)不收敛,即使这样的\(x\)非常少(零测集),也会破坏几乎处处收敛。
- 依概率收敛是“整体”性质的,它允许序列在某些点上永远不收敛,只要随着\(n\)增大,这些“顽固不化”的点变得越来越稀少(测度趋于零)。它甚至允许每个点\(x\)都有无穷多个\(n\)使得\(|f_n(x)-f(x)| \ge \epsilon\),只要对每个固定的\(n\),这种“坏”点的测度整体在缩小。
第四步:建立基本关系(几乎处处收敛蕴含依概率收敛)
在\(\mu(X) < \infty\)(即全空间测度有限)的条件下,几乎处处收敛蕴含依概率收敛。这是一个非常重要的结论。
我们来证明这一点:假设\(f_n \xrightarrow{a.e.} f\)。根据几乎处处收敛的定义,存在零测集\(N\),使得对任意\(x \notin N\),\(\lim_{n} f_n(x) = f(x)\)。固定一个\(\epsilon > 0\)。对于\(x \notin N\),因为\(f_n(x) \to f(x)\),所以存在一个指标\(M(x, \epsilon)\),使得对所有\(n \ge M(x, \epsilon)\),有\(|f_n(x)-f(x)| < \epsilon\)。这意味着\(x\)最终会(对充分大的\(n\))离开集合\(A_n(\epsilon) := \{ x: |f_n(x) - f(x)| \ge \epsilon \}\)。更精确地说,对\(x \notin N\),\(x\)不属于所有足够大的\(A_n(\epsilon)\)的交集的下极限,即\(x \notin \limsup_{n \to \infty} A_n(\epsilon) := \bigcap_{m=1}^\infty \bigcup_{n=m}^\infty A_n(\epsilon)\)。这个\(\limsup A_n(\epsilon)\)正是“使得\(|f_n(x)-f(x)| \ge \epsilon\)对无穷多个\(n\)成立”的那些\(x\)的集合。由于几乎所有的\(x\)都收敛,我们有\(\mu( \limsup_{n} A_n(\epsilon) ) = 0\)。现在,注意\(A_n(\epsilon) \subseteq \bigcup_{k=n}^\infty A_k(\epsilon)\),所以\(\mu(A_n(\epsilon)) \le \mu( \bigcup_{k=n}^\infty A_k(\epsilon) )\)。由于\(\mu(X) < \infty\),我们可以使用测度的上连续性(或直接从可数可加性推导):因为集合列\(\bigcup_{k=n}^\infty A_k(\epsilon)\)是递减的(随着\(n\)增大),并且其交集正是\(\limsup_{n} A_n(\epsilon)\),其测度为零,所以
\[\lim_{n \to \infty} \mu( \bigcup_{k=n}^\infty A_k(\epsilon) ) = \mu( \limsup_{n} A_n(\epsilon) ) = 0. \]
因此,\(\lim_{n \to \infty} \mu(A_n(\epsilon)) = 0\),这正是依概率收敛的定义。这里全空间测度有限的条件用在了保证“递减集列的交的测度等于测度极限”这一步(测度的上连续性在测度无限时也成立,但我们需要\(\mu( \bigcup_{k=1}^\infty A_k(\epsilon) )\)有限来从可数可加性推出极限为零,而\(\mu(X) < \infty\)确保了这一点)。
第五步:全空间测度无限时的反例
如果\(\mu(X) = \infty\),几乎处处收敛推不出依概率收敛。经典反例:取\(X = \mathbb{R}\),\(\mu\)为勒贝格测度。定义\(f_n = \chi_{[n, n+1]}\),即区间\([n, n+1]\)上的示性函数。则对任意\(x \in \mathbb{R}\),当\(n > x\)时,\(f_n(x)=0\),所以\(f_n(x) \to 0\)处处成立(不仅是几乎处处)。但是,对\(\epsilon = 1/2\),集合\(\{ x: |f_n(x)-0| \ge 1/2 \} = [n, n+1]\),其测度恒为1,不趋于0。所以\(f_n\)处处收敛于0,但不依概率收敛于0。
第六步:依概率收敛推不出几乎处处收敛
依概率收敛比几乎处处收敛弱得多。一个序列可以依概率收敛,但在每一点都发散。典型例子是“滑动区间”:设\(X=[0,1]\),\(\mu\)为勒贝格测度。将区间\([0,1]\)等分,并让示性函数在这些小区间上“滑动”。具体地,定义一列区间\(I_1 = [0,1], I_2 = [0, 1/2], I_3 = [1/2, 1], I_4 = [0, 1/3], I_5 = [1/3, 2/3], I_6 = [2/3, 1], \dots\)。令\(f_n = \chi_{I_n}\)。则对任意固定的\(\epsilon > 0\),\(\mu( \{ x: |f_n(x)-0| \ge \epsilon \} ) = \mu(I_n) \to 0\),所以\(f_n \xrightarrow{\mu} 0\)。然而,对任意一点\(x \in [0,1]\),数列\(f_n(x)\)在0和1之间无限次振荡,故不收敛。这说明依概率收敛不能保证哪怕存在一个收敛的点。
第七步:子序列原理(联系两种收敛的关键)
虽然依概率收敛不蕴含几乎处处收敛,但它蕴含存在一个几乎处处收敛的子序列。这是沟通两种收敛的最重要桥梁。
定理:如果\(f_n \xrightarrow{\mu} f\),则存在子序列\(\{f_{n_k}\}\)使得\(f_{n_k} \xrightarrow{a.e.} f\)。
证明思路(构造性):由依概率收敛定义,对每个\(k\),可取\(n_k\)使得对\(\epsilon = 1/k\),有\(\mu( \{ x: |f_{n_k}(x) - f(x)| \ge 1/k \} ) < 1/2^k\)。可以选取\(n_k\)严格递增。然后考虑集合\(E_k = \{ x: |f_{n_k}(x) - f(x)| \ge 1/k \}\)。我们有\(\sum_{k=1}^\infty \mu(E_k) < \infty\)。由博雷尔-坎泰利引理,几乎所有的\(x\)只属于有限个\(E_k\)。这意味着,对几乎所有的\(x\),存在\(K(x)\),使得对所有\(k \ge K(x)\),有\(|f_{n_k}(x) - f(x)| < 1/k\)。这正好说明\(f_{n_k}(x) \to f(x)\)。因此该子序列几乎处处收敛。
第八步:等价刻画(在有限测度空间)
在\(\mu(X) < \infty\)的条件下,以下陈述等价:
- \(f_n \xrightarrow{\mu} f\)。
- 对\(\{f_n\}\)的任一子序列,都存在其进一步的子序列几乎处处收敛于\(f\)。
我们证明(1) \(\Rightarrow\) (2):若\(f_n \xrightarrow{\mu} f\),则其任一子序列也依概率收敛于\(f\)。由上述子序列原理,这个子序列又有子序列几乎处处收敛于\(f\)。(2) \(\Rightarrow\) (1):用反证法,假设\(f_n\)不依概率收敛于\(f\),则存在某个\(\epsilon>0\),使得\(\mu(|f_n - f| \ge \epsilon)\)不趋于0。那么可以找到一个子序列\(\{f_{n_k}\}\)和常数\(\delta>0\),使得\(\mu(|f_{n_k} - f| \ge \epsilon) \ge \delta\)对所有\(k\)成立。但根据条件(2),这个子序列又有子序列几乎处处收敛于\(f\),根据“几乎处处收敛蕴含依概率收敛”(在有限测度下),这个子子序列应依概率收敛于\(f\),这与\(\mu(|f_{n_k} - f| \ge \epsilon) \ge \delta\)矛盾。这个等价刻画表明,在有限测度下,依概率收敛是一种“按子序列检查”的几乎处处收敛。
第九步:在概率论中的重要性
在概率论中,随机变量序列\(X_n\)依概率收敛于\(X\)(记\(X_n \xrightarrow{P} X\))对应着“当\(n\)很大时,\(X_n\)与\(X\)有显著差异的概率很小”。几乎处处收敛(也称“以概率1收敛”)则更强,意味着\(P(\lim_{n} X_n = X)=1\)。上述子序列原理是证明许多极限定理(如强大数定律)的关键工具。例如,弱大数定律(依概率收敛)结合子序列原理和唯一性,可用于帮助证明强大数定律(几乎处处收敛)的某些版本。两者都是研究随机现象极限行为的核心概念,依概率收敛更易验证,而几乎处处收敛给出了更强的路径性结论。