随机变量的变换的Laplace渐近展开方法
我们来学习Laplace渐近展开方法。这是一种在概率论与统计学中非常重要的渐近分析技术,它允许我们近似计算特定类型的积分,特别是当积分中含有一个快速振荡的指数项或一个大的参数时。这种方法的核心思想是利用被积函数在极值点(通常是最大值点)附近的局部行为来获得积分的渐近表达式。
第一步:理解基本问题场景
设想我们需要计算如下形式的积分:
\[I(\lambda) = \int_a^b e^{\lambda g(x)} h(x) \, dx \]
其中 \(\lambda\) 是一个很大的正实数,函数 \(g(x)\) 和 \(h(x)\) 满足一定的光滑性条件(例如,足够多次可微)。当 \(\lambda\) 很大时,积分的主要贡献来自于函数 \(g(x)\) 在其最大值点附近的区域,因为指数项 \(e^{\lambda g(x)}\) 在那里被急剧放大。如果 \(g(x)\) 在区间内部某点 \(x_0\) 处取得唯一的全局最大值,并且 \(g''(x_0) < 0\)(即在该点是严格凹的),那么Laplace方法告诉我们,对于大的 \(\lambda\),积分 \(I(\lambda)\) 可以由 \(x_0\) 附近的一个小邻域内的积分来主导。
第二步:核心思想与一阶近似(最陡下降法)
基本思路是:在最大值点 \(x_0\) 附近对 \(g(x)\) 进行泰勒展开。由于 \(x_0\) 是极值点,有 \(g'(x_0) = 0\)。
\[g(x) \approx g(x_0) + \frac{1}{2} g''(x_0)(x - x_0)^2 \]
(注意一阶项为零。)
将 \(h(x)\) 近似为其在 \(x_0\) 处的值 \(h(x_0)\),因为主要贡献区域很小。于是积分近似为:
\[I(\lambda) \approx \int_{x_0 - \epsilon}^{x_0 + \epsilon} e^{\lambda [g(x_0) + \frac{1}{2} g''(x_0)(x - x_0)^2]} h(x_0) \, dx \]
由于当 \(|x - x_0|\) 较大时,被积函数指数级衰减,我们可以将积分限近似扩展到整个实数轴 \((-\infty, \infty)\),而引入的误差是可忽略的。这样就得到了一个高斯积分:
\[I(\lambda) \approx e^{\lambda g(x_0)} h(x_0) \int_{-\infty}^{\infty} e^{\frac{\lambda}{2} g''(x_0)(x - x_0)^2} \, dx \]
利用高斯积分公式 \(\int_{-\infty}^{\infty} e^{-a t^2} dt = \sqrt{\frac{\pi}{a}}\)(其中 \(a>0\)),这里 \(a = -\frac{\lambda}{2} g''(x_0)\)(因为 \(g''(x_0) < 0\),所以 \(a>0\)):
\[I(\lambda) \approx e^{\lambda g(x_0)} h(x_0) \sqrt{\frac{2\pi}{-\lambda g''(x_0)}} \]
这就是Laplace方法的一阶渐近近似。它表明,对于大的 \(\lambda\),积分 \(I(\lambda)\) 以指数速率 \(e^{\lambda g(x_0)}\) 增长,并且其渐近行为由最大值点 \(x_0\) 处的函数值 \(g(x_0)\)、\(h(x_0)\) 以及 \(g(x)\) 在 \(x_0\) 处的曲率 \(g''(x_0)\) 共同决定。
第三步:进行高阶展开(Laplace渐近展开)
一阶近似虽然有用,但有时我们需要更精确的近似。Laplace渐近展开方法通过进行高阶泰勒展开来获得更高阶的渐近项。
- 变量替换:令 \(t = x - x_0\),将积分中心移至最大值点。
\[ I(\lambda) = e^{\lambda g(x_0)} \int_{a - x_0}^{b - x_0} e^{\lambda [g(x_0 + t) - g(x_0)]} h(x_0 + t) \, dt \]
- 泰勒展开:将指数部分和函数 \(h\) 在 \(t=0\) 处进行泰勒展开。
\[ g(x_0 + t) - g(x_0) = \frac{1}{2!}g''(x_0)t^2 + \frac{1}{3!}g^{(3)}(x_0)t^3 + \frac{1}{4!}g^{(4)}(x_0)t^4 + \cdots \]
\[ h(x_0 + t) = h(x_0) + h'(x_0)t + \frac{1}{2!}h''(x_0)t^2 + \cdots \]
- 合并展开式:将 \(h(x_0+t)\) 的展开式乘以 \(e^{\lambda [g(x_0+t)-g(x_0)]}\) 的展开式(对指数函数本身进行展开)。
\[ e^{\lambda [g(x_0+t)-g(x_0)]} h(x_0+t) = \left[ 1 + \lambda \left( \frac{g^{(3)}(x_0)t^3}{6} + \frac{g^{(4)}(x_0)t^4}{24} + \cdots \right) + \frac{\lambda^2}{2} \left( \frac{g^{(3)}(x_0)t^3}{6} + \cdots \right)^2 + \cdots \right] \times \left[ h(x_0) + h'(x_0)t + \frac{h''(x_0)t^2}{2} + \cdots \right] \]
将这两个级数相乘,并按 \(t\) 的幂次重新整理。由于被积函数是偶函数(主导项是 \(t^2\))的微小扰动,奇次幂项 \(t, t^3, ...\) 在对称区间 \((-\infty, \infty)\) 上的积分为零。我们主要关心偶次幂项。
-
逐项积分:将整理后的级数代入积分,并再次将积分限扩展到整个实数轴。积分变为一系列形如 \(\int_{-\infty}^{\infty} t^{2k} e^{\frac{\lambda}{2} g''(x_0) t^2} dt\) 的高斯矩的线性组合。这些矩可以通过已知公式计算。
-
得到渐近级数:最终,我们得到 \(I(\lambda)\) 的一个按 \(\lambda^{-1/2}, \lambda^{-1}, \lambda^{-3/2}, ...\) 降幂排列的渐近展开式:
\[ I(\lambda) \sim e^{\lambda g(x_0)} \sqrt{\frac{2\pi}{-\lambda g''(x_0)}} \left[ h(x_0) + \frac{C_1}{\lambda} + \frac{C_2}{\lambda^2} + \cdots \right] \quad \text{as } \lambda \to \infty \]
其中系数 \(C_1, C_2, ...\) 是由 \(g(x)\) 和 \(h(x)\) 在 \(x_0\) 处的高阶导数(三阶、四阶等)构成的复杂表达式。这个级数通常是发散的,但对于固定的项数,当 \(\lambda\) 足够大时,部分和可以提供非常精确的近似。
第四步:在概率论与统计中的应用
Laplace渐近展开方法在概率统计中应用广泛:
- 渐近正态性:中心极限定理的证明中,特征函数的对数展开本质上是Laplace思想在复平面上的应用(最陡下降法)。
- 后验分布的近似(Laplace近似):在贝叶斯统计中,对于参数 \(\theta\) 的后验分布 \(p(\theta | data) \propto L(data | \theta) \pi(\theta)\),当其难以直接计算时,可以在后验众数(最大值点)附近进行二阶泰勒展开,用高斯分布来近似后验分布。这正是Laplace方法的思想。
- 边缘似然计算:在层次模型或混合模型中,计算边缘似然函数有时可以转化为一个Laplace积分的形式。
- 大偏差理论:计算罕见事件概率的渐近率函数时,也常常用到Laplace方法的思想。
总结
Laplace渐近展开方法是一种强大的工具,它通过分析被积函数在临界点(通常是最大值点)附近的局部行为,来获得含大参数积分的渐近表达式。其核心步骤是变量替换、泰勒展开、合并级数和高斯积分。从简单的一阶近似到系统的高阶展开,该方法为我们理解和计算复杂概率模型中的积分和渐近行为提供了坚实的理论基础。