中心极限定理的Berry-Esseen界
字数 925 2025-11-23 00:32:07

中心极限定理的Berry-Esseen界

我们先从中心极限定理(CLT)的直观理解开始。CLT指出,当样本量足够大时,独立同分布随机变量的标准化和近似服从标准正态分布。但"近似"的精度如何?Berry-Esseen界就是量化这个近似误差的重要工具。

第一步:标准化和的分布函数
设X₁, X₂, ..., Xₙ是独立同分布的随机变量,E(Xᵢ) = μ,Var(Xᵢ) = σ² > 0。定义标准化和:
Sₙ = (X₁ + ... + Xₙ - nμ)/(σ√n)
CLT告诉我们,当n→∞时,Sₙ依分布收敛于标准正态随机变量Z。

第二步:分布函数的逼近误差
我们关心的是Sₙ的分布函数Fₙ(x)与标准正态分布函数Φ(x)的接近程度。Berry-Esseen界给出了两者之间差异的上界:
sup|Fₙ(x) - Φ(x)| ≤ C·(E|X₁ - μ|³)/(σ³√n)
其中上确界sup取遍所有实数x,C是一个绝对常数。

第三步:关键参数的含义

  • E|X₁ - μ|³是随机变量的三阶中心矩,衡量分布的偏度和厚尾性
  • σ³是标准差的三次方
  • 比值ρ = E|X₁ - μ|³/σ³称为标准化三阶矩,与分布的偏度相关
  • 分母中的√n显示了误差以n^{-1/2}的速率衰减

第四步:Berry-Esseen常数
常数C的最佳已知值在0.4096到0.4784之间。这个常数是普适的,不依赖于具体分布,只与样本量n和标准化三阶矩ρ有关。

第五步:定理的应用条件
Berry-Esseen定理要求:

  1. 随机变量独立同分布
  2. 方差有限且为正
  3. 三阶绝对矩有限(E|X₁|³ < ∞)
    这是比CLT更强的条件,因为CLT只要求有限方差。

第六步:误差界的意义
这个上界告诉我们:

  • 当分布更对称、更接近正态时(ρ较小),收敛更快
  • 对于固定分布,误差以O(n^{-1/2})的速率衰减
  • 这个收敛速率在一般情况下是最优的,不能再改进

第七步:推广形式
Berry-Esseen界还有多种推广:

  • 非独立情形下的版本
  • 非同分布情形下的版本
  • 多元情形下的推广
  • 基于特征函数的证明方法

这个上界为CLT的实际应用提供了严格的误差控制,在统计推断和概率计算中具有重要意义。

中心极限定理的Berry-Esseen界 我们先从中心极限定理(CLT)的直观理解开始。CLT指出,当样本量足够大时,独立同分布随机变量的标准化和近似服从标准正态分布。但"近似"的精度如何?Berry-Esseen界就是量化这个近似误差的重要工具。 第一步:标准化和的分布函数 设X₁, X₂, ..., Xₙ是独立同分布的随机变量,E(Xᵢ) = μ,Var(Xᵢ) = σ² > 0。定义标准化和: Sₙ = (X₁ + ... + Xₙ - nμ)/(σ√n) CLT告诉我们,当n→∞时,Sₙ依分布收敛于标准正态随机变量Z。 第二步:分布函数的逼近误差 我们关心的是Sₙ的分布函数Fₙ(x)与标准正态分布函数Φ(x)的接近程度。Berry-Esseen界给出了两者之间差异的上界: sup|Fₙ(x) - Φ(x)| ≤ C·(E|X₁ - μ|³)/(σ³√n) 其中上确界sup取遍所有实数x,C是一个绝对常数。 第三步:关键参数的含义 E|X₁ - μ|³是随机变量的三阶中心矩,衡量分布的偏度和厚尾性 σ³是标准差的三次方 比值ρ = E|X₁ - μ|³/σ³称为标准化三阶矩,与分布的偏度相关 分母中的√n显示了误差以n^{-1/2}的速率衰减 第四步:Berry-Esseen常数 常数C的最佳已知值在0.4096到0.4784之间。这个常数是普适的,不依赖于具体分布,只与样本量n和标准化三阶矩ρ有关。 第五步:定理的应用条件 Berry-Esseen定理要求: 随机变量独立同分布 方差有限且为正 三阶绝对矩有限(E|X₁|³ < ∞) 这是比CLT更强的条件,因为CLT只要求有限方差。 第六步:误差界的意义 这个上界告诉我们: 当分布更对称、更接近正态时(ρ较小),收敛更快 对于固定分布,误差以O(n^{-1/2})的速率衰减 这个收敛速率在一般情况下是最优的,不能再改进 第七步:推广形式 Berry-Esseen界还有多种推广: 非独立情形下的版本 非同分布情形下的版本 多元情形下的推广 基于特征函数的证明方法 这个上界为CLT的实际应用提供了严格的误差控制,在统计推断和概率计算中具有重要意义。