可测函数序列的依分布收敛
好的,我将为您讲解“可测函数序列的依分布收敛”这一概念。我们将从最基础的概率分布概念开始,逐步深入到依分布收敛的定义、性质及其与其他收敛方式的关系。
第一步:理解随机变量与其分布
- 随机变量:在概率论中,随机变量(通常用 \(X, Y, X_n\) 表示)是一个函数,它将一个概率空间(例如,一个包含所有可能结果的样本空间)中的每一个结果映射到一个实数。简单来说,它是一个其值由随机试验结果决定的量。
- 分布函数:每个随机变量 \(X\) 都对应一个分布函数(或称累积分布函数),记作 \(F_X(x)\)。它的定义是:
\[ F_X(x) = P(X \le x) \]
这个函数描述了随机变量 \(X\) 取值小于等于任意实数 \(x\) 的概率。分布函数 \(F_X\) 具有以下关键性质:
- 单调不减:如果 \(x_1 < x_2\),那么 \(F_X(x_1) \le F_X(x_2)\)。
- 右连续:\(\lim_{y \to x^+} F_X(y) = F_X(x)\)。
- \(\lim_{x \to -\infty} F_X(x) = 0\),且 \(\lim_{x \to +\infty} F_X(x) = 1\)。
第二步:收敛性的背景——其他收敛方式
在讨论依分布收敛之前,我们先简要回顾两种更“强”的收敛方式,这有助于理解依分布收敛的独特之处。假设 \(\{X_n\}\) 是一列随机变量,\(X\) 是另一个随机变量,它们定义在同一个概率空间上。
- 几乎必然收敛:序列 \(\{X_n\}\) 几乎必然收敛于 \(X\),记作 \(X_n \xrightarrow{a.s.} X\),如果
\[ P\left( \lim_{n \to \infty} X_n = X \right) = 1. \]
这意味着,除了一个概率为零的集合外,对于每一个样本点,序列 \(X_n\) 的数值都收敛于 \(X\) 的数值。
2. 依概率收敛:序列 \(\{X_n\}\) 依概率收敛于 \(X\),记作 \(X_n \xrightarrow{P} X\),如果对于任意 \(\epsilon > 0\),有
\[ \lim_{n \to \infty} P(|X_n - X| > \epsilon) = 0. \]
这表示 \(X_n\) 和 \(X\) 的差距很大的概率随着 \(n\) 增大而趋于零。几乎必然收敛蕴含依概率收敛,但反之不成立。
第三步:定义依分布收敛
依分布收敛,也称为弱收敛,关注的是随机变量的分布函数本身的收敛,而不是随机变量作为函数本身的收敛。
- 核心定义:设 \(\{X_n\}\) 是一列随机变量,其对应的分布函数为 \(\{F_n(x)\}\)。设 \(X\) 是一个随机变量,其分布函数为 \(F(x)\)。我们称序列 \(\{X_n\}\) 依分布收敛于 \(X\),记作 \(X_n \xrightarrow{d} X\) 或 \(F_n \xrightarrow{w} F\),如果对于 \(F(x)\) 的所有连续点 \(x\),都有
\[ \lim_{n \to \infty} F_n(x) = F(x). \]
注意:这里只要求在 \(F(x)\) 的连续点上收敛。这是因为分布函数是右连续的,在间断点(即 \(P(X=x) > 0\) 的点)处,极限行为可能不一致,但我们只关心其连续部分的收敛。
- 关键理解:
- 不要求定义在同一空间:与几乎必然收敛和依概率收敛不同,依分布收敛不要求随机变量 \(X_n\) 和 \(X\) 定义在同一个概率空间上。它只关心它们的分布函数 \(F_n\) 和 \(F\) 之间的关系。
- 更弱的收敛:依分布收敛是比依概率收敛更弱的收敛性。也就是说:
\[ X_n \xrightarrow{P} X \quad \Rightarrow \quad X_n \xrightarrow{d} X. \]
但反过来不成立。例如,假设 \(X\) 服从标准正态分布,令 \(X_n = (-1)^n X\)。那么每个 \(X_n\) 的分布都和 \(X\) 相同,所以显然 \(X_n \xrightarrow{d} X\)。但是 \(X_n\) 并不依概率收敛于 \(X\),因为 \(X_n\) 和 \(X\) 的差值可以很大。
第四步:刻画与性质
- 连续映射定理:这是依分布收敛中一个极其重要的定理。如果 \(X_n \xrightarrow{d} X\),且函数 \(g\) 是连续的(或者至少在其定义域上几乎处处连续,且间断点的集合是 \(X\) 的分布的零测集),那么
\[ g(X_n) \xrightarrow{d} g(X). \]
这个定理在统计推断中非常有用,它允许我们对收敛的统计量进行连续变换而保持收敛性。
- Slutsky 定理:这是另一个常用工具。假设 \(X_n \xrightarrow{d} X\),\(Y_n \xrightarrow{P} a\),\(Z_n \xrightarrow{P} b\),其中 \(a, b\) 是常数。那么:
- \(X_n + Y_n \xrightarrow{d} X + a\)
- \(X_n Y_n \xrightarrow{d} X \cdot b\)
- \(X_n / Z_n \xrightarrow{d} X / b\)(当 \(b \neq 0\) 时)
这个定理允许我们将依分布收敛和依概率收敛的序列进行组合。
第五步:与其他概念的关系及应用
- 特征函数:依分布收敛有一个非常优美的等价刻画:\(X_n \xrightarrow{d} X\) 当且仅当 它们的特征函数 \(\phi_n(t) = E[e^{itX_n}]\) 逐点收敛于 \(X\) 的特征函数 \(\phi(t) = E[e^{itX}]\)。这一定理(Lévy 连续性定理)是证明中心极限定理的强大工具。
- 中心极限定理:这是概率论中最重要的定理之一,它是依分布收敛的典型例子。它指出,在一定条件下,独立同分布随机变量和的标准化序列依分布收敛于标准正态分布。即:
\[ \frac{S_n - n\mu}{\sigma\sqrt{n}} \xrightarrow{d} N(0,1). \]
这里,收敛就是依分布收敛。
- 在统计学中的应用:依分布收敛是渐近统计理论的基石。许多统计量(如样本均值、样本方差等)的极限分布都是通过依分布收敛来描述的,这为构造置信区间和进行假设检验提供了理论依据。
总结来说,依分布收敛是研究随机变量序列极限行为的一种基本且重要的方式。它关注的是分布函数的收敛,是一种比几乎必然收敛和依概率收敛更弱的收敛形式,但其在理论推导和实际应用中(如中心极限定理)具有不可替代的地位。