随机变量的变换的Robbins-Monro方法
-
让我们从最基础的概念开始。想象你有一个函数,但不知道它的确切形式,只能通过实验来观察它。具体来说,假设你有一个函数 M(θ),但你不能直接写出它的表达式,只能通过实验在任意点 θ 处获得一个带有噪声的观测值 Y,使得 E[Y | θ] = M(θ)。你的目标是找到这个函数的根,即使得 M(θ) = 0 的点 θ*。这就是 Robbins-Monro 方法要解决的核心问题。
-
在 Robbins-Monro 方法中,我们通过一个迭代过程来寻找这个根。这个过程是一个随机逼近算法。迭代公式为:θ_{n+1} = θ_n - a_n Y_n,其中 Y_n 是在 θ_n 处对 M(θ_n) 的带有噪声的观测。序列 {a_n} 是一组正的步长或增益系数。这个迭代的思想是:在每一步,根据当前点的观测值,沿着可能减少函数值的方向(这里是寻找根,所以是使 M(θ) 趋近于 0 的方向)调整参数 θ。
-
步长序列 {a_n} 的选择至关重要,它需要满足两个关键条件以确保算法的收敛性。首先,步长需要足够大以克服随机噪声,因此要求 ∑ a_n = ∞。其次,步长最终需要变小以确保算法的稳定性,因此要求 ∑ a_n² < ∞。一个常见的例子是 a_n = c / n,其中 c > 0 是一个常数。这些条件保证了算法既能充分探索参数空间,又能在接近根时稳定下来。
-
为了确保 Robbins-Monro 算法收敛到真正的根 θ*,我们还需要对函数 M(θ) 本身施加一些条件。一个典型的条件是“平均斜率”条件:存在一个常数 k > 0,使得对于所有 θ ≠ θ*,有 (θ - θ*) M(θ) > 0。这意味着当 θ > θ* 时,M(θ) > 0;当 θ < θ* 时,M(θ) < 0。这个条件确保了函数在根的两侧有正确的符号,从而引导迭代方向朝向根。
-
最后,我们来探讨 Robbins-Monro 方法的收敛性。在满足上述条件(包括步长条件和函数符号条件)下,并且噪声序列 {Y_n - M(θ_n)} 是一个鞅差序列(即其条件期望为零)且具有有条件的有限方差,那么可以证明,由 Robbins-Monro 算法产生的序列 {θ_n} 将以概率 1 收敛到根 θ*。这意味着,通过足够多次的迭代,你的估计值将几乎必然地逼近真实解。