随机变量的变换的Berry-Esseen定理
Berry-Esseen定理是概率论中描述独立随机变量和收敛到正态分布时收敛速率的重要结果。让我们从基础开始逐步理解这个定理。
首先,定理的核心背景是中心极限定理。当考虑独立同分布的随机变量序列时,其标准化和的分布函数会收敛到标准正态分布。但中心极限定理只告诉我们收敛会发生,却没有说明收敛的速度有多快。
为了量化这个收敛速度,我们需要引入一个度量工具——分布函数之间的最大距离。具体来说,如果我们记标准化和的分布函数为F_n(x),标准正态分布函数为Φ(x),那么研究的对象就是这两个函数在整个实数轴上的上确界距离。
接下来,定理成立需要满足矩条件。最基本的要求是随机变量的三阶绝对矩存在且有限。这个条件很直观:如果随机变量的分布过于分散(比如具有很厚的尾部),那么收敛到正态分布的速度自然会变慢。
定理的具体形式给出了这个上确界距离的一个上界估计。这个上界与样本量n的平方根成反比,同时与随机变量的标准化三阶矩成正比。这意味着当样本量增大时,收敛速度以1/√n的速率提高;而当随机变量的偏斜程度(通过三阶矩体现)较大时,收敛速度会变慢。
证明这个定理的主要工具是特征函数和傅里叶分析。思路是通过比较标准化和的特征函数与标准正态分布特征函数的差异,然后利用反演公式将特征函数的差异转换回分布函数的差异。在这个过程中,需要精细地控制各种近似误差。
Berry-Esseen定理中的常数是另一个重要话题。最初的证明给出的通用常数较大,后来经过多位数学家的改进,现在知道最优常数在0.4到0.5之间。这个常数的大小在实际应用中很重要,因为它直接影响着正态近似的精度估计。
定理的推广版本考虑了许多更一般的情况。比如对于不同分布的随机变量序列,上界会依赖于各随机变量三阶矩的某种加权和。对于某些特殊分布类型,还可以得到更精确的收敛速率估计。
在实际应用中,Berry-Esseen定理为使用正态近似提供了理论保证。当我们用正态分布来近似样本均值时,这个定理告诉我们需要多大的样本量才能达到所需的近似精度。特别是在统计推断中,这对确定置信区间的覆盖概率等问题的精度分析非常重要。