中心极限定理的Berry-Esseen界
字数 925 2025-11-23 00:32:07
中心极限定理的Berry-Esseen界
我们先从中心极限定理(CLT)的直观理解开始。CLT指出,当样本量足够大时,独立同分布随机变量的标准化和近似服从标准正态分布。但"近似"的精度如何?Berry-Esseen界就是量化这个近似误差的重要工具。
第一步:标准化和的分布函数
设X₁, X₂, ..., Xₙ是独立同分布的随机变量,E(Xᵢ) = μ,Var(Xᵢ) = σ² > 0。定义标准化和:
Sₙ = (X₁ + ... + Xₙ - nμ)/(σ√n)
CLT告诉我们,当n→∞时,Sₙ依分布收敛于标准正态随机变量Z。
第二步:分布函数的逼近误差
我们关心的是Sₙ的分布函数Fₙ(x)与标准正态分布函数Φ(x)的接近程度。Berry-Esseen界给出了两者之间差异的上界:
sup|Fₙ(x) - Φ(x)| ≤ C·(E|X₁ - μ|³)/(σ³√n)
其中上确界sup取遍所有实数x,C是一个绝对常数。
第三步:关键参数的含义
- E|X₁ - μ|³是随机变量的三阶中心矩,衡量分布的偏度和厚尾性
- σ³是标准差的三次方
- 比值ρ = E|X₁ - μ|³/σ³称为标准化三阶矩,与分布的偏度相关
- 分母中的√n显示了误差以n^{-1/2}的速率衰减
第四步:Berry-Esseen常数
常数C的最佳已知值在0.4096到0.4784之间。这个常数是普适的,不依赖于具体分布,只与样本量n和标准化三阶矩ρ有关。
第五步:定理的应用条件
Berry-Esseen定理要求:
- 随机变量独立同分布
- 方差有限且为正
- 三阶绝对矩有限(E|X₁|³ < ∞)
这是比CLT更强的条件,因为CLT只要求有限方差。
第六步:误差界的意义
这个上界告诉我们:
- 当分布更对称、更接近正态时(ρ较小),收敛更快
- 对于固定分布,误差以O(n^{-1/2})的速率衰减
- 这个收敛速率在一般情况下是最优的,不能再改进
第七步:推广形式
Berry-Esseen界还有多种推广:
- 非独立情形下的版本
- 非同分布情形下的版本
- 多元情形下的推广
- 基于特征函数的证明方法
这个上界为CLT的实际应用提供了严格的误差控制,在统计推断和概率计算中具有重要意义。