随机变量的变换的鞍点近似方法
字数 1711 2025-11-07 12:33:26

随机变量的变换的鞍点近似方法

鞍点近似是一种用于近似概率分布或累积分布函数尾部概率的渐近方法,特别适用于处理独立随机变量和或似然函数的计算。其核心思想是利用被积函数的指数形式,通过将积分路径变形,使其通过被积函数在复平面上的一个临界点(即鞍点),从而获得高精度的近似。

  1. 基本动机
  • 在许多实际问题中,例如计算独立同分布随机变量和的尾部概率 \(P(S_n > x)\)(其中 \(S_n = X_1 + \dots + X_n\)),其精确表达式可能非常复杂或难以计算。
  • 中心极限定理提供了全局近似,但在分布的尾部(即 \(x\) 远离均值时)近似精度较差。
    • 鞍点近似旨在提供一种在整个定义域内,特别是尾部,都具有较高精度的近似方法。
  1. 核心工具:累积量生成函数
  • 设随机变量 \(X\) 的矩生成函数为 \(M_X(t) = E[e^{tX}]\)
  • \(X\) 的累积量生成函数定义为 \(K_X(t) = \log M_X(t)\)
  • 累积量生成函数的一阶导数 \(K_X'(t)\) 给出了一个以 \(t\) 为参数的“倾斜”分布的均值。二阶导数 \(K_X''(t)\) 给出了该倾斜分布的方差。
  1. 鞍点的定义
  • 对于给定的实数 \(x\),鞍点 \(\hat{t}\) 是下面方程关于 \(t\) 的解:
    \(K_X'(\hat{t}) = x\)
  • 这个方程的意义是:我们寻找一个参数 \(\hat{t}\),使得在由 \(\hat{t}\) 定义的倾斜分布下,随机变量 \(X\) 的期望值恰好等于我们关心的点 \(x\)。这个点 \(\hat{t}\) 在复平面上通常是被积函数的鞍点。
  1. 鞍点近似的推导思路(以密度函数近似为例)
  • 目标:近似随机变量 \(X\) 在点 \(x\) 的概率密度函数 \(f_X(x)\)
    • 利用傅里叶逆变换,密度函数可以表示为:
      \(f_X(x) = \frac{1}{2\pi i} \int_{-i\infty}^{i\infty} e^{K_X(t) - t x} dt\)
  • 被积函数是指数形式 \(e^{n \phi(t)}\)(对于 \(S_n\),其中 \(\phi(t) = (K_X(t) - t x)/n\))。当 \(n\) 较大或 \(x\) 在尾部时,这个指数函数在鞍点 \(\hat{t}\) 处取得极大值(沿虚轴方向)。
  • 将积分路径变形,使其通过鞍点 \(\hat{t}\)
  • 在鞍点 \(\hat{t}\) 处对指数部分 \(K_X(t) - t x\) 进行二阶泰勒展开:
    \(K_X(t) - t x \approx K_X(\hat{t}) - \hat{t} x + \frac{1}{2} K_X''(\hat{t}) (t - \hat{t})^2\)
    (注意,一阶项为零,因为 \(K_X'(\hat{t}) = x\)。)
    • 将这个近似代入积分表达式,并完成高斯积分,得到鞍点近似公式:
      \(f_X(x) \approx \frac{1}{\sqrt{2\pi K_X''(\hat{t})}} e^{K_X(\hat{t}) - \hat{t} x}\)
  • 对于和 \(S_n\) 的密度,公式为:
    \(f_{S_n}(s) \approx \frac{1}{\sqrt{2\pi n K_X''(\hat{t})}} e^{n[K_X(\hat{t}) - \hat{t} (s/n)]}\)
  1. 鞍点近似的性质
    • 高精度:与中心极限定理等一阶近似相比,鞍点近似是相对误差意义上的近似,通常在分布的尾部也能保持很高的精度。
    • 可归一化:鞍点近似得到的密度函数近似表达式本身就是一个有效的概率密度函数(可能需要一个常数因子),这在实际应用中很方便。
    • 应用广泛:除了密度函数,还可用于近似分布函数、似然函数、条件概率等。
随机变量的变换的鞍点近似方法 鞍点近似是一种用于近似概率分布或累积分布函数尾部概率的渐近方法,特别适用于处理独立随机变量和或似然函数的计算。其核心思想是利用被积函数的指数形式,通过将积分路径变形,使其通过被积函数在复平面上的一个临界点(即鞍点),从而获得高精度的近似。 基本动机 在许多实际问题中,例如计算独立同分布随机变量和的尾部概率 \( P(S_ n > x) \)(其中 \( S_ n = X_ 1 + \dots + X_ n \)),其精确表达式可能非常复杂或难以计算。 中心极限定理提供了全局近似,但在分布的尾部(即 \( x \) 远离均值时)近似精度较差。 鞍点近似旨在提供一种在整个定义域内,特别是尾部,都具有较高精度的近似方法。 核心工具:累积量生成函数 设随机变量 \( X \) 的矩生成函数为 \( M_ X(t) = E[ e^{tX} ] \)。 \( X \) 的累积量生成函数定义为 \( K_ X(t) = \log M_ X(t) \)。 累积量生成函数的一阶导数 \( K_ X'(t) \) 给出了一个以 \( t \) 为参数的“倾斜”分布的均值。二阶导数 \( K_ X''(t) \) 给出了该倾斜分布的方差。 鞍点的定义 对于给定的实数 \( x \),鞍点 \( \hat{t} \) 是下面方程关于 \( t \) 的解: \( K_ X'(\hat{t}) = x \)。 这个方程的意义是:我们寻找一个参数 \( \hat{t} \),使得在由 \( \hat{t} \) 定义的倾斜分布下,随机变量 \( X \) 的期望值恰好等于我们关心的点 \( x \)。这个点 \( \hat{t} \) 在复平面上通常是被积函数的鞍点。 鞍点近似的推导思路(以密度函数近似为例) 目标:近似随机变量 \( X \) 在点 \( x \) 的概率密度函数 \( f_ X(x) \)。 利用傅里叶逆变换,密度函数可以表示为: \( f_ X(x) = \frac{1}{2\pi i} \int_ {-i\infty}^{i\infty} e^{K_ X(t) - t x} dt \)。 被积函数是指数形式 \( e^{n \phi(t)} \)(对于 \( S_ n \),其中 \( \phi(t) = (K_ X(t) - t x)/n \))。当 \( n \) 较大或 \( x \) 在尾部时,这个指数函数在鞍点 \( \hat{t} \) 处取得极大值(沿虚轴方向)。 将积分路径变形,使其通过鞍点 \( \hat{t} \)。 在鞍点 \( \hat{t} \) 处对指数部分 \( K_ X(t) - t x \) 进行二阶泰勒展开: \( K_ X(t) - t x \approx K_ X(\hat{t}) - \hat{t} x + \frac{1}{2} K_ X''(\hat{t}) (t - \hat{t})^2 \)。 (注意,一阶项为零,因为 \( K_ X'(\hat{t}) = x \)。) 将这个近似代入积分表达式,并完成高斯积分,得到鞍点近似公式: \( f_ X(x) \approx \frac{1}{\sqrt{2\pi K_ X''(\hat{t})}} e^{K_ X(\hat{t}) - \hat{t} x} \)。 对于和 \( S_ n \) 的密度,公式为: \( f_ {S_ n}(s) \approx \frac{1}{\sqrt{2\pi n K_ X''(\hat{t})}} e^{n[ K_ X(\hat{t}) - \hat{t} (s/n) ]} \)。 鞍点近似的性质 高精度 :与中心极限定理等一阶近似相比,鞍点近似是相对误差意义上的近似,通常在分布的尾部也能保持很高的精度。 可归一化 :鞍点近似得到的密度函数近似表达式本身就是一个有效的概率密度函数(可能需要一个常数因子),这在实际应用中很方便。 应用广泛 :除了密度函数,还可用于近似分布函数、似然函数、条件概率等。