随机变量的变换的Donsker定理
字数 3655 2025-12-17 14:34:58

随机变量的变换的Donsker定理

好的,我们现在来讲解随机变量的变换的Donsker定理。这是一个在概率极限理论和统计学中极为重要的结果,它建立了经验过程与布朗运动之间的联系,是很多统计推断(如Kolmogorov-Smirnov检验)的理论基石。我会循序渐进地展开。

第一步:背景与动机——从中心极限定理到函数空间的极限

  1. 复习经典中心极限定理
    假设我们有一列独立同分布的随机变量 \(X_1, X_2, ...\),其均值为 \(\mu\),方差为 \(\sigma^2\)。经典中心极限定理告诉我们,标准化和 的分布收敛到正态分布:

\[ \frac{S_n - n\mu}{\sigma \sqrt{n}} = \frac{\sum_{i=1}^{n} (X_i - \mu)}{\sigma \sqrt{n}} \xrightarrow{d} N(0,1) \]

这里的收敛是**依分布收敛**,即一维随机变量的分布收敛。
  1. 提出新问题
    但我们不仅关心“和”,还关心部分和过程。考虑随时间(或随索引)累积的偏差。我们定义一个随机过程 \(S_n(t)\)

\[ S_n(t) = \frac{1}{\sigma \sqrt{n}} \sum_{i=1}^{\lfloor nt \rfloor} (X_i - \mu), \quad 其中 0 \le t \le 1 \]

这里,\(\lfloor nt \rfloor\) 表示小于等于 \(nt\) 的最大整数。当 \(t=1\) 时,就是上面的中心极限定理。但当 \(t\) 从0变化到1时,\(S_n(t)\) 定义了一个在区间 [0,1] 上、由随机折线连接起来的随机函数(一个随机过程)。

  • \(t = k/n\) 时刻,函数值就是前k个标准化偏差的和。
  • \(t\) 不是 \(k/n\) 的时刻,通常用线性插值使其成为连续路径。
  1. 核心疑问
    当样本量 \(n \to \infty\) 时,这个随机过程 \(S_n(t)\) 会收敛到什么极限对象?这个极限对象应该是一个定义在连续函数空间上的随机过程。Donsker定理回答了这个问题。

第二步:极限对象——布朗运动

  1. 什么是布朗运动
    标准布朗运动(或维纳过程) \(\{ B(t), 0 \le t \le 1 \}\) 是一个连续时间的随机过程,满足:
  • \(B(0) = 0\)
  • 独立增量:对任意 \(0 \le t_1 < t_2 < ... < t_k \le 1\),增量 \(B(t_2)-B(t_1), ..., B(t_k)-B(t_{k-1})\) 相互独立。
  • 正态增量:对任意 \(0 \le s < t \le 1\),增量 \(B(t) - B(s) \sim N(0, t-s)\)
  • 连续路径:以概率1,\(B(t)\)\(t\) 的连续函数。
  1. 直观理解
    你可以将布朗运动想象为一个连续时间、连续状态的随机游走。它的路径虽然连续,但在任何一点都不可导,充满了“抖动”。它是随机过程理论中最基本、最重要的对象之一。

第三步:Donsker定理的精确表述

Donsker定理(也称为不变性原理或泛函中心极限定理)的核心思想是:标准化部分和过程 \(S_n(t)\) 的分布,在函数空间(具体是连续函数空间 \(C[0,1]\) 或其上的 Skorokhod 空间)中,弱收敛到标准布朗运动 \(B(t)\)

用数学语言表述:

\(\{X_i\}\) 是独立同分布的随机变量,\(E[X_1] = 0\)\(Var(X_1) = \sigma^2 < \infty\)。定义随机过程:

\[ > S_n(t) = \frac{1}{\sigma \sqrt{n}} \sum_{i=1}^{\lfloor nt \rfloor} X_i, \quad 0 \le t \le 1 > \]

在 [0,1] 区间上用线性插值使其连续。则当 \(n \to \infty\) 时,有:

\[ > S_n(\cdot) \xrightarrow{d} B(\cdot) > \]

这里的“ \(\xrightarrow{d}\) ”是指在连续函数空间 \(C[0,1]\) 上的弱收敛(依分布收敛)。

“弱收敛”在函数空间中的含义
这意味着,对于任何“好的”(连续且有界的)泛函 \(h: C[0,1] \to \mathbb{R}\),随机变量 \(h(S_n)\) 的分布都会收敛到随机变量 \(h(B)\) 的分布。即:

\[E[h(S_n)] \to E[h(B)],\quad 对\ 所有\ 连续有界泛函\ h。 \]

这就是“不变性”的来源:极限分布不依赖于原始随机变量 \(X_i\) 的具体分布(只要均值为0,方差有限),只取决于布朗运动的性质。

第四步:一个关键应用示例——Kolmogorov-Smirnov检验

Donsker定理最著名的应用之一是推导Kolmogorov-Smirnov(K-S)检验的极限分布。

  1. 构造经验过程
    假设我们想检验样本 \(X_1, ..., X_n\) 是否来自某个已知的连续分布函数 \(F(x)\)。定义经验分布函数:

\[ F_n(x) = \frac{1}{n} \sum_{i=1}^{n} I(X_i \le x) \]

其中 \(I\) 是示性函数。我们可以构造一个经验过程

\[ G_n(x) = \sqrt{n} (F_n(x) - F(x)) \]

这个 \(G_n(x)\) 衡量了经验分布与理论分布在各点的偏差。

  1. 与Donsker定理的联系
    做一个概率积分变换:令 \(U_i = F(X_i)\)。如果 \(X_i\) 真的服从 \(F\),那么 \(U_i\) 就服从 [0,1] 上的均匀分布。定义均匀分布的经验过程:

\[ B_n(t) = \sqrt{n} (U_n(t) - t),\quad 其中\ U_n(t)=\frac{1}{n}\sum_{i=1}^n I(U_i \le t) \]

可以证明,这个过程与Donsker定理中的 \(S_n(t)\) 本质上是等价的(通过构造和时间参数替换)。因此,Donsker定理告诉我们:

\[ B_n(\cdot) \xrightarrow{d} B^0(\cdot) \]

这里 \(B^0(t)\) 是一个特殊的布朗运动,称为布朗桥,它是起点和终点都被钉在0的布朗运动(即 \(B^0(0)=B^0(1)=0\))。

  1. 推导检验统计量
    K-S检验统计量是经验过程的上确界:

\[ D_n = \sup_{x} |F_n(x) - F(x)| = \sup_{0 \le t \le 1} |B_n(t)| \]

由于 \(B_n(\cdot)\) 弱收敛到布朗桥 \(B^0(\cdot)\),并且泛函 \(h(f) = \sup_{t} |f(t)|\)\(C[0,1]\) 上是连续的。根据Donsker定理和连续映射定理,有:

\[ D_n = h(B_n) \xrightarrow{d} h(B^0) = \sup_{0 \le t \le 1} |B^0(t)| \]

\(\sup_{0 \le t \le 1} |B^0(t)|\) 的分布是已知的(Kolmogorov分布),这就给出了K-S检验的临界值表。

第五步:总结与意义

  • 核心思想:Donsker定理是中心极限定理在函数空间上的推广。它将一个由独立随机变量构造的、离散的、锯齿状的随机折线过程,与连续的、无限维的布朗运动(或布朗桥)联系起来。
  • “不变性”:极限分布(布朗运动)不依赖于原始随机变量的具体分布(除了有限方差条件),这使得基于它的推论(如K-S检验)是“非参数”的,具有广泛的适用性。
  • 方法论:它提供了一套强大的工具——泛函中心极限定理。通过将统计量(如K-S距离、Cramér–von Mises统计量)表示为经验过程的连续泛函,我们可以利用Donsker定理和连续映射定理,一举推导出它们的渐近分布,而不需要为每个统计量做复杂的独立推导。

总而言之,Donsker定理是连接经典概率论、随机过程理论和数理统计推断的一座关键桥梁,它使得对复杂经验过程进行严格的渐近分析成为可能。

随机变量的变换的Donsker定理 好的,我们现在来讲解 随机变量的变换的Donsker定理 。这是一个在概率极限理论和统计学中极为重要的结果,它建立了经验过程与布朗运动之间的联系,是很多统计推断(如Kolmogorov-Smirnov检验)的理论基石。我会循序渐进地展开。 第一步:背景与动机——从中心极限定理到函数空间的极限 复习经典中心极限定理 : 假设我们有一列独立同分布的随机变量 \( X_ 1, X_ 2, ... \),其均值为 \( \mu \),方差为 \( \sigma^2 \)。经典中心极限定理告诉我们, 标准化和 的分布收敛到正态分布: \[ \frac{S_ n - n\mu}{\sigma \sqrt{n}} = \frac{\sum_ {i=1}^{n} (X_ i - \mu)}{\sigma \sqrt{n}} \xrightarrow{d} N(0,1) \] 这里的收敛是 依分布收敛 ,即一维随机变量的分布收敛。 提出新问题 : 但我们不仅关心“和”,还关心 部分和过程 。考虑随时间(或随索引)累积的偏差。我们定义一个随机过程 \( S_ n(t) \): \[ S_ n(t) = \frac{1}{\sigma \sqrt{n}} \sum_ {i=1}^{\lfloor nt \rfloor} (X_ i - \mu), \quad 其中 0 \le t \le 1 \] 这里,\( \lfloor nt \rfloor \) 表示小于等于 \( nt \) 的最大整数。当 \( t=1 \) 时,就是上面的中心极限定理。但当 \( t \) 从0变化到1时,\( S_ n(t) \) 定义了一个在区间 [ 0,1] 上、由随机折线连接起来的 随机函数 (一个随机过程)。 在 \( t = k/n \) 时刻,函数值就是前k个标准化偏差的和。 在 \( t \) 不是 \( k/n \) 的时刻,通常用线性插值使其成为连续路径。 核心疑问 : 当样本量 \( n \to \infty \) 时,这个随机过程 \( S_ n(t) \) 会收敛到什么极限对象?这个极限对象应该是一个定义在连续函数空间上的 随机过程 。Donsker定理回答了这个问题。 第二步:极限对象——布朗运动 什么是布朗运动 ? 标准布朗运动(或维纳过程) \( \{ B(t), 0 \le t \le 1 \} \) 是一个连续时间的随机过程,满足: \( B(0) = 0 \)。 独立增量 :对任意 \( 0 \le t_ 1 < t_ 2 < ... < t_ k \le 1 \),增量 \( B(t_ 2)-B(t_ 1), ..., B(t_ k)-B(t_ {k-1}) \) 相互独立。 正态增量 :对任意 \( 0 \le s < t \le 1 \),增量 \( B(t) - B(s) \sim N(0, t-s) \)。 连续路径 :以概率1,\( B(t) \) 是 \( t \) 的连续函数。 直观理解 : 你可以将布朗运动想象为一个连续时间、连续状态的随机游走。它的路径虽然连续,但在任何一点都不可导,充满了“抖动”。它是随机过程理论中最基本、最重要的对象之一。 第三步:Donsker定理的精确表述 Donsker定理(也称为不变性原理或泛函中心极限定理)的核心思想是:标准化部分和过程 \( S_ n(t) \) 的分布,在函数空间(具体是连续函数空间 \( C[ 0,1 ] \) 或其上的 Skorokhod 空间)中,弱收敛到标准布朗运动 \( B(t) \)。 用数学语言表述: 设 \( \{X_ i\} \) 是独立同分布的随机变量,\( E[ X_ 1] = 0 \),\( Var(X_ 1) = \sigma^2 < \infty \)。定义随机过程: \[ S_ n(t) = \frac{1}{\sigma \sqrt{n}} \sum_ {i=1}^{\lfloor nt \rfloor} X_ i, \quad 0 \le t \le 1 \] 在 [ 0,1 ] 区间上用线性插值使其连续。则当 \( n \to \infty \) 时,有: \[ S_ n(\cdot) \xrightarrow{d} B(\cdot) \] 这里的“ \( \xrightarrow{d} \) ”是指在连续函数空间 \( C[ 0,1] \) 上的 弱收敛 (依分布收敛)。 “弱收敛”在函数空间中的含义 : 这意味着,对于任何“好的”(连续且有界的)泛函 \( h: C[ 0,1] \to \mathbb{R} \),随机变量 \( h(S_ n) \) 的分布都会收敛到随机变量 \( h(B) \) 的分布。即: \[ E[ h(S_ n)] \to E[ h(B) ],\quad 对\ 所有\ 连续有界泛函\ h。 \] 这就是“不变性”的来源:极限分布不依赖于原始随机变量 \( X_ i \) 的具体分布(只要均值为0,方差有限),只取决于布朗运动的性质。 第四步:一个关键应用示例——Kolmogorov-Smirnov检验 Donsker定理最著名的应用之一是推导Kolmogorov-Smirnov(K-S)检验的极限分布。 构造经验过程 : 假设我们想检验样本 \( X_ 1, ..., X_ n \) 是否来自某个已知的连续分布函数 \( F(x) \)。定义经验分布函数: \[ F_ n(x) = \frac{1}{n} \sum_ {i=1}^{n} I(X_ i \le x) \] 其中 \( I \) 是示性函数。我们可以构造一个 经验过程 : \[ G_ n(x) = \sqrt{n} (F_ n(x) - F(x)) \] 这个 \( G_ n(x) \) 衡量了经验分布与理论分布在各点的偏差。 与Donsker定理的联系 : 做一个概率积分变换:令 \( U_ i = F(X_ i) \)。如果 \( X_ i \) 真的服从 \( F \),那么 \( U_ i \) 就服从 [ 0,1 ] 上的均匀分布。定义均匀分布的经验过程: \[ B_ n(t) = \sqrt{n} (U_ n(t) - t),\quad 其中\ U_ n(t)=\frac{1}{n}\sum_ {i=1}^n I(U_ i \le t) \] 可以证明,这个过程与Donsker定理中的 \( S_ n(t) \) 本质上是等价的(通过构造和时间参数替换)。因此,Donsker定理告诉我们: \[ B_ n(\cdot) \xrightarrow{d} B^0(\cdot) \] 这里 \( B^0(t) \) 是一个特殊的布朗运动,称为 布朗桥 ,它是起点和终点都被钉在0的布朗运动(即 \( B^0(0)=B^0(1)=0 \))。 推导检验统计量 : K-S检验统计量是经验过程的上确界: \[ D_ n = \sup_ {x} |F_ n(x) - F(x)| = \sup_ {0 \le t \le 1} |B_ n(t)| \] 由于 \( B_ n(\cdot) \) 弱收敛到布朗桥 \( B^0(\cdot) \),并且泛函 \( h(f) = \sup_ {t} |f(t)| \) 在 \( C[ 0,1 ] \) 上是连续的。根据Donsker定理和连续映射定理,有: \[ D_ n = h(B_ n) \xrightarrow{d} h(B^0) = \sup_ {0 \le t \le 1} |B^0(t)| \] 而 \( \sup_ {0 \le t \le 1} |B^0(t)| \) 的分布是已知的(Kolmogorov分布),这就给出了K-S检验的临界值表。 第五步:总结与意义 核心思想 :Donsker定理是中心极限定理在 函数空间 上的推广。它将一个由独立随机变量构造的、离散的、锯齿状的随机折线过程,与连续的、无限维的布朗运动(或布朗桥)联系起来。 “不变性” :极限分布(布朗运动)不依赖于原始随机变量的具体分布(除了有限方差条件),这使得基于它的推论(如K-S检验)是“非参数”的,具有广泛的适用性。 方法论 :它提供了一套强大的工具—— 泛函中心极限定理 。通过将统计量(如K-S距离、Cramér–von Mises统计量)表示为经验过程的连续泛函,我们可以利用Donsker定理和连续映射定理,一举推导出它们的渐近分布,而不需要为每个统计量做复杂的独立推导。 总而言之,Donsker定理是连接经典概率论、随机过程理论和数理统计推断的一座关键桥梁,它使得对复杂经验过程进行严格的渐近分析成为可能。