马尔可夫链的漂移与矩不等式
-
基础概念回顾
在马尔可夫链中,漂移条件(Drift Condition)是分析链的长期行为(如收敛性、稳定性)的重要工具。它通过构造一个李雅普诺夫函数(Lyapunov Function)\(V: S \to [0, \infty)\) 来描述状态空间 \(S\) 中能量的变化趋势。- 若在某个区域外,函数 \(V\) 的期望值显著下降(即 \(\mathbb{E}[V(X_{n+1}) \mid X_n = x] \leq V(x) - \epsilon\)),则链倾向于返回“中心区域”,这可用于证明链的常返性或遍历性。
-
漂移条件的数学定义
对于不可约马尔可夫链 \(\{X_n\}\),若存在函数 \(V \geq 1\)、常数 \(\delta > 0, b < \infty\) 及有限集 \(C \subset S\),使得对所有 \(x \in S\) 满足:
\[ \mathbb{E}[V(X_{n+1}) \mid X_n = x] \leq (1 - \delta) V(x) + b \cdot \mathbb{I}_{\{x \in C\}} \]
这一条件称为几何漂移条件(Geometric Drift Condition),它隐含了链的几何遍历性(即收敛到平稳分布的速度是指数级的)。
-
矩不等式的引入
漂移条件可进一步推导出关于链的矩不等式(Moment Inequalities)。这类不等式通过控制函数 \(V\) 的期望,限制链在特定区域的停留时间或尾部概率。- 例如,若漂移条件成立,则对任意初始状态 \(x\),返回有限集 \(C\) 的时间 \(\tau_C\) 满足 \(\mathbb{E}_x[\tau_C] \leq \frac{V(x)}{\delta}\)。
-
矩不等式的具体形式
假设几何漂移条件成立,定义停时 \(\tau_C = \inf\{n \geq 0: X_n \in C\}\)。则存在常数 \(\alpha > 1\) 和 \(M < \infty\),使得:
\[ \mathbb{E}_x\left[ \alpha^{\tau_C} \right] \leq V(x) + M \]
这一结果通过停时定理(Optional Stopping Theorem)和迭代期望性质证明,表明返回时间 \(\tau_C\) 具有指数阶矩,从而隐含其尾部概率呈指数衰减。
- 应用与扩展
- 收敛速率分析:结合漂移条件与微小集(Small Set)理论,可量化马尔可夫链蒙特卡洛(MCMC)的混合时间。
- 稳健性研究:矩不等式可用于分析链对扰动的稳定性,例如当转移核发生微小变化时,平稳分布的误差界限。
- 复杂模型中的应用:在排队网络、随机环境模型等领域,通过设计合适的李雅普诺夫函数,可验证系统的稳定性条件。