随机变量的变换的渐近展开方法

字数 2217 2025-11-27 09:01:38

随机变量的变换的渐近展开方法

基本概念：什么是渐近展开？
渐近展开是一种用一系列（通常是简单的）函数来近似复杂函数的方法。其核心思想是，当某个参数（如样本大小 n）趋于无穷大时，这个近似会变得越来越精确。一个典型的渐近展开形式如下：
\(f_n(x) = g_0(x) + \frac{g_1(x)}{n^{1/2}} + \frac{g_2(x)}{n} + \frac{g_3(x)}{n^{3/2}} + \cdots\)
其中，\(f_n(x)\) 是我们想要近似的函数（例如，一个统计量的概率密度函数），\(g_0(x), g_1(x), ...\) 是展开项。当 n 很大时，右边的和可以很好地逼近左边的复杂函数。我们通常只取前几项来获得一个实用的、且比只取第一项（即 \(g_0(x)\)）更精确的近似。
动机：为什么我们需要对随机变量的变换进行渐近展开？
在统计学中，我们经常关心一个统计量（它是随机变量的函数）的分布。例如，样本均值。中心极限定理告诉我们，样本均值经过标准化后，其分布渐近于标准正态分布。这就是一个“零阶”渐近展开（只取第一项 \(g_0(x)\)，即正态分布）。然而，当样本量 n 不是无限大时，真实分布与正态分布之间存在误差。渐近展开的目的就是系统地修正这种误差，通过加入更高阶的项（如 \(1/\sqrt{n}, 1/n\) 等项）来获得更精确的近似，特别是在分布的尾部区域。
核心工具：特征函数与累积量
要对分布进行渐近展开，一个非常强大的工具是特征函数。随机变量 X 的特征函数定义为 \(\phi_X(t) = E[e^{itX}]\)。它的一个关键优势是：独立随机变量和的特征函数等于其特征函数的乘积。
对特征函数取对数，我们得到累积量生成函数：\(K_X(t) = \log \phi_X(t)\)。\(K_X(t)\) 的泰勒展开系数称为累积量。正态分布的所有三阶及以上的累积量为零。因此，当我们研究一个渐近于正态分布的统计量时，其累积量生成函数的展开式中，三阶及以上的项通常以 \(1/\sqrt{n}, 1/n\) 等的速度衰减。这为构造渐近展开提供了自然的框架。
展开过程：Edgeworth 展开
Edgeworth 展开是概率分布函数的一种渐近展开方法，它是对中心极限定理的精细化。其基本步骤如下：
a. 标准化：设 \(X_1, X_2, ..., X_n\) 是独立同分布的随机变量，均值为 \(\mu\)，方差为 \(\sigma^2\)。构造标准化和 \(S_n = \frac{\sum_{i=1}^n X_i - n\mu}{\sigma \sqrt{n}}\)。根据中心极限定理，\(S_n\) 依分布收敛于标准正态分布 \(Z \sim N(0,1)\)。
b. 比较特征函数：计算 \(S_n\) 的特征函数 \(\phi_{S_n}(t)\) 和标准正态特征函数 \(\phi_Z(t) = e^{-t^2/2}\)。
c. 取对数并展开：对特征函数之比取对数，并利用累积量进行展开：
\(\log \left( \frac{\phi_{S_n}(t)}{\phi_Z(t)} \right) = \frac{\kappa_3}{6\sqrt{n}} (it)^3 + \frac{\kappa_4}{24n}(it)^4 + \frac{\kappa_3^2}{72 n}(it)^6 + \cdots\)
其中 \(\kappa_3, \kappa_4\) 是原变量 \(X_i\) 的三阶和四阶累积量（分别对应偏度和峰度）。
d. 指数化与傅里叶逆变换：将上述展开式指数化，得到 \(\phi_{S_n}(t)\) 的近似表达式。然后，利用傅里叶逆变换，将特征函数的展开式转换回分布函数或密度函数的展开式。最终得到的密度函数展开形式为：
\(f_{S_n}(x) \approx \phi(x) \left[ 1 + \frac{\kappa_3}{6\sqrt{n}} H_3(x) + \frac{1}{n} \left( \frac{\kappa_4}{24} H_4(x) + \frac{\kappa_3^2}{72} H_6(x) \right) + \cdots \right]\)
其中 \(\phi(x)\) 是标准正态密度，\(H_k(x)\) 是 k 阶 Hermite 多项式（例如，\(H_3(x) = x^3 - 3x\)，\(H_4(x) = x^4 - 6x^2 + 3\)）。
应用与注意事项
Edgeworth 展开主要用于：
- 提高近似精度：在样本量中等时，对正态近似的尾部概率提供更精确的估计。
- 构造更精确的置信区间。
- 逼近分位数。
  需要注意的是，Edgeworth 展开是一个渐近展开。在分布的极端尾部（x 非常大时），展开可能表现不佳，甚至可能产生负的“概率”值。在这种情况下，可能需要使用其他类型的展开，如鞍点近似，它在尾部通常有更好的表现。

随机变量的变换的渐近展开方法基本概念：什么是渐近展开？渐近展开是一种用一系列（通常是简单的）函数来近似复杂函数的方法。其核心思想是，当某个参数（如样本大小 n）趋于无穷大时，这个近似会变得越来越精确。一个典型的渐近展开形式如下： \( f_ n(x) = g_ 0(x) + \frac{g_ 1(x)}{n^{1/2}} + \frac{g_ 2(x)}{n} + \frac{g_ 3(x)}{n^{3/2}} + \cdots \) 其中，\( f_ n(x) \) 是我们想要近似的函数（例如，一个统计量的概率密度函数），\( g_ 0(x), g_ 1(x), ... \) 是展开项。当 n 很大时，右边的和可以很好地逼近左边的复杂函数。我们通常只取前几项来获得一个实用的、且比只取第一项（即 \( g_ 0(x) \)）更精确的近似。动机：为什么我们需要对随机变量的变换进行渐近展开？在统计学中，我们经常关心一个统计量（它是随机变量的函数）的分布。例如，样本均值。中心极限定理告诉我们，样本均值经过标准化后，其分布渐近于标准正态分布。这就是一个“零阶”渐近展开（只取第一项 \( g_ 0(x) \)，即正态分布）。然而，当样本量 n 不是无限大时，真实分布与正态分布之间存在误差。渐近展开的目的就是系统地修正这种误差，通过加入更高阶的项（如 \( 1/\sqrt{n}, 1/n \) 等项）来获得更精确的近似，特别是在分布的尾部区域。核心工具：特征函数与累积量要对分布进行渐近展开，一个非常强大的工具是特征函数。随机变量 X 的特征函数定义为 \( \phi_ X(t) = E[ e^{itX} ] \)。它的一个关键优势是：独立随机变量和的特征函数等于其特征函数的乘积。对特征函数取对数，我们得到累积量生成函数：\( K_ X(t) = \log \phi_ X(t) \)。\( K_ X(t) \) 的泰勒展开系数称为累积量。正态分布的所有三阶及以上的累积量为零。因此，当我们研究一个渐近于正态分布的统计量时，其累积量生成函数的展开式中，三阶及以上的项通常以 \( 1/\sqrt{n}, 1/n \) 等的速度衰减。这为构造渐近展开提供了自然的框架。展开过程：Edgeworth 展开 Edgeworth 展开是概率分布函数的一种渐近展开方法，它是对中心极限定理的精细化。其基本步骤如下： a. 标准化：设 \( X_ 1, X_ 2, ..., X_ n \) 是独立同分布的随机变量，均值为 \( \mu \)，方差为 \( \sigma^2 \)。构造标准化和 \( S_ n = \frac{\sum_ {i=1}^n X_ i - n\mu}{\sigma \sqrt{n}} \)。根据中心极限定理，\( S_ n \) 依分布收敛于标准正态分布 \( Z \sim N(0,1) \)。 b. 比较特征函数：计算 \( S_ n \) 的特征函数 \( \phi_ {S_ n}(t) \) 和标准正态特征函数 \( \phi_ Z(t) = e^{-t^2/2} \)。 c. 取对数并展开：对特征函数之比取对数，并利用累积量进行展开： \( \log \left( \frac{\phi_ {S_ n}(t)}{\phi_ Z(t)} \right) = \frac{\kappa_ 3}{6\sqrt{n}} (it)^3 + \frac{\kappa_ 4}{24n}(it)^4 + \frac{\kappa_ 3^2}{72 n}(it)^6 + \cdots \) 其中 \( \kappa_ 3, \kappa_ 4 \) 是原变量 \( X_ i \) 的三阶和四阶累积量（分别对应偏度和峰度）。 d. 指数化与傅里叶逆变换：将上述展开式指数化，得到 \( \phi_ {S_ n}(t) \) 的近似表达式。然后，利用傅里叶逆变换，将特征函数的展开式转换回分布函数或密度函数的展开式。最终得到的密度函数展开形式为： \( f_ {S_ n}(x) \approx \phi(x) \left[ 1 + \frac{\kappa_ 3}{6\sqrt{n}} H_ 3(x) + \frac{1}{n} \left( \frac{\kappa_ 4}{24} H_ 4(x) + \frac{\kappa_ 3^2}{72} H_ 6(x) \right) + \cdots \right ] \) 其中 \( \phi(x) \) 是标准正态密度，\( H_ k(x) \) 是 k 阶 Hermite 多项式（例如，\( H_ 3(x) = x^3 - 3x \)，\( H_ 4(x) = x^4 - 6x^2 + 3 \)）。应用与注意事项 Edgeworth 展开主要用于：提高近似精度：在样本量中等时，对正态近似的尾部概率提供更精确的估计。构造更精确的置信区间。逼近分位数。需要注意的是，Edgeworth 展开是一个渐近展开。在分布的极端尾部（x 非常大时），展开可能表现不佳，甚至可能产生负的“概率”值。在这种情况下，可能需要使用其他类型的展开，如鞍点近似，它在尾部通常有更好的表现。