马尔可夫链的中心极限定理
字数 1935 2025-11-03 18:01:13
马尔可夫链的中心极限定理
马尔可夫链的中心极限定理是遍历理论中的一个重要结果,它描述了在满足一定条件的马尔可夫链中,关于链的函数的和(或时间平均)的波动行为的渐近分布。
- 基本设定与目标
- 考虑一个在状态空间 \(X\) 上的、具有平稳分布 \(\pi\) 的不可约、正递归马尔可夫链 \(\{X_n\}\)。
- 设 \(f: X \to \mathbb{R}\) 是一个实值函数(通常称为观测函数)。我们关心的是部分和 \(S_n = \sum_{k=0}^{n-1} f(X_k)\)。
- 由遍历定理,我们知道时间平均 \(S_n/n\) 几乎必然收敛于空间平均 \(\mathbb{E}_{\pi}[f] = \int f d\pi\)。
- 中心极限定理则研究缩放后的波动 \(\frac{S_n - n\mathbb{E}_{\pi}[f]}{\sqrt{n}}\) 的渐近分布。我们想知道,当 \(n \to \infty\) 时,这个量是否收敛于某个正态分布。
- 渐近方差
- 中心极限定理成立的关键在于一个称为“渐近方差”的量必须是有限且正的。
- 对于均值为零(即 \(\mathbb{E}_{\pi}[f] = 0\))的函数 \(f\),渐近方差 \(\sigma^2(f)\) 定义为:
\[ \sigma^2(f) = \lim_{n \to \infty} \frac{1}{n} \mathbb{E}[(S_n)^2] \]
- 这个量衡量了部分和 \(S_n\) 的长期波动幅度。可以证明,在遍历条件下,\(\sigma^2(f)\) 可以表示为:
\[ \sigma^2(f) = \mathbb{E}_{\pi}[f^2] + 2 \sum_{k=1}^{\infty} \mathbb{E}_{\pi}[f(X_0)f(X_k)] \]
其中,\(\mathbb{E}_{\pi}[f(X_0)f(X_k)]\) 是 \(f\) 在时间间隔 \(k\) 上的自协方差。这个公式显示了马尔可夫链中序列相关性对波动性的累积影响。
- 中心极限定理的成立条件
- 马尔可夫链的中心极限定理并非总是成立。它需要比遍历定理更强的条件。
- 一个经典且强大的充分条件是 几何遍历性。如果一个马尔可夫链是几何遍历的,那么对于所有满足 \(\mathbb{E}_{\pi}[f^2] < \infty\) 的函数 \(f\),只要其渐近方差 \(\sigma^2(f) > 0\),中心极限定理就成立:
\[ \frac{S_n - n\mathbb{E}_{\pi}[f]}{\sqrt{n}} \xrightarrow{d} \mathcal{N}(0, \sigma^2(f)) \]
其中 \(\xrightarrow{d}\) 表示依分布收敛,\(\mathcal{N}(0, \sigma^2)\) 是均值为0、方差为 \(\sigma^2\) 的正态分布。
* 几何遍历性比一般遍历性更强,它要求马尔可夫链以几何速率收敛到平稳分布。
- 证明思路与关键工具
- 证明马尔可夫链中心极限定理的一个核心工具是 泊松方程。
- 泊松方程的形式是:\(g - Pg = f\),其中 \(P\) 是马尔可夫链的转移算子,\(f\) 是我们的观测函数(均值为零),而 \(g\) 是待求解的函数。
- 如果能找到一个函数 \(g\) 满足这个方程(且 \(g\) 具有较好的性质,如平方可积),那么我们可以将部分和 \(S_n\) 表示为一个鞅的差(Martingale Difference)加上一个可控制的余项。具体地,\(S_n = M_n + g(X_0) - g(X_n)\),其中 \(M_n\) 是一个鞅。
- 对于鞅 \(M_n\),我们可以应用经典的鞅中心极限定理。而余项 \(g(X_0) - g(X_n)\) 在适当的缩放下(除以 \(\sqrt{n}\))会依概率收敛到零。这样,\(S_n/\sqrt{n}\) 的极限分布就由 \(M_n/\sqrt{n}\) 决定,从而是一个正态分布。
- 意义与应用
- 马尔可夫链的中心极限定理为基于马尔可夫链的统计推断提供了理论基础。
- 例如,在马尔可夫链蒙特卡洛方法中,我们使用一条马尔可夫链的样本路径来估计期望 \(\mathbb{E}_{\pi}[f]\)。中心极限定理允许我们构造这个估计值的置信区间,从而评估模拟结果的精度。
- 它也将动力系统中“混沌”的程度与统计规律性联系起来,强烈的混合性(如几何遍历性)通常保证了中心极限定理的成立。