马尔可夫链的中心极限定理
字数 3265 2025-12-07 11:50:37

马尔可夫链的中心极限定理

我们来循序渐进地讲解马尔可夫链的中心极限定理。首先,确保你已经理解之前讲过的“马尔可夫链的平稳分布”、“马尔可夫链的遍历定理”和“中心极限定理”等概念,因为它们是本词条的基础。下面,我们将从最简单的背景开始,逐步深入。

第一步:回顾经典中心极限定理(CLT)的动机
在概率论中,经典的中心极限定理描述了独立同分布随机变量和的渐近分布。具体来说,若 \(X_1, X_2, \dots, X_n\) 独立同分布,均值为 \(\mu\),方差为 \(\sigma^2\),则其和的标准化形式 \(S_n = \frac{\sum_{i=1}^n (X_i - \mu)}{\sigma \sqrt{n}}\) 依分布收敛到标准正态分布 \(N(0,1)\)。这个结论是许多统计推断的基石。但它的关键前提是“独立性”,这在许多实际序列(如时间序列、状态转移序列)中并不成立。

第二步:引入马尔可夫链的依赖性问题
马尔可夫链是一类具有马尔可夫性质的随机过程,其未来状态仅依赖于当前状态,与过去历史无关。虽然这种依赖性比一般过程简单,但它打破了经典CLT所要求的独立性假设。因此,一个自然的问题是:对于一个平稳的、遍历的马尔可夫链 \(\{X_n\}_{n \geq 0}\),当我们观察一个关于状态空间的函数(比如 \(f(X_n)\) ),其部分和 \(S_n = \sum_{i=0}^{n-1} f(X_i)\) 是否也存在类似的中心极限定理?即标准化后的 \(S_n\) 是否也收敛到正态分布?答案是肯定的,但需要额外的条件,并会引入新的特征量。

第三步:设定严格框架与平稳分布
考虑一个在状态空间 \(\mathcal{X}\) 上、时间齐次的马尔可夫链 \(\{X_n\}\),其转移核为 \(P(x, dy)\)。设该链是不可约、非周期、正常返的,因此存在唯一的平稳分布 \(\pi\)。我们假设链从平稳分布开始,即 \(X_0 \sim \pi\),这样整个过程是严平稳的。令 \(f: \mathcal{X} \to \mathbb{R}\) 是一个可测函数,我们关心的是随机变量和:

\[S_n = \sum_{i=0}^{n-1} f(X_i)。 \]

在平稳条件下,每个 \(f(X_i)\) 的边际分布相同,但彼此之间是相关的。

第四步:定义渐近方差(扩散系数)
由于序列存在相关性,经典CLT中使用的方差 \(\text{Var}(f(X_0))\) 不再能刻画和的波动尺度。事实上,通过遍历定理,我们知道样本均值 \(\frac{1}{n}S_n\) 几乎必然收敛到期望 \(\pi(f) = \mathbb{E}_\pi[f(X_0)]\)。而中心极限定理关注的是其波动幅度:

\[\frac{S_n - n\pi(f)}{\sqrt{n}}。 \]

其极限方差(如果存在)不再是 \(\sigma^2 = \text{Var}_\pi(f(X_0))\),而是一个包含了所有滞后协方差的求和,称为渐近方差扩散系数

\[\sigma^2_f = \text{Var}_\pi(f(X_0)) + 2 \sum_{k=1}^{\infty} \text{Cov}_\pi(f(X_0), f(X_k))。 \]

这里,下标 \(\pi\) 表示在初始分布为平稳分布下的期望和协方差。这个无穷级数必须收敛,中心极限定理才可能成立。收敛性由马尔可夫链的混合速度(如几何遍历性)来保证。

第五步:马尔可夫链中心极限定理的表述
在适当的条件下(例如,链是几何遍历的,且函数 \(f\) 满足一定的可积性,如 \(f \in L^2(\pi)\) ),上述渐近方差 \(\sigma^2_f\) 有限且非负,并且我们有:

\[\frac{S_n - n\pi(f)}{\sqrt{n}} \xrightarrow{d} N(0, \sigma^2_f), \quad \text{当 } n \to \infty。 \]

这就是马尔可夫链的中心极限定理。它表明,尽管观测序列是相关的,但其标准化和的极限分布仍然是正态的,只是方差变成了 \(\sigma^2_f\),这个方差综合反映了链的依赖结构。

第六步:理解渐近方差的另一种视角——泊松方程
在马尔可夫链理论中,计算或表示 \(\sigma^2_f\) 的一个有力工具是泊松方程(也称为泊松方程)。我们寻找一个函数 \(g\) 满足:

\[g(x) - Pg(x) = f(x) - \pi(f), \quad \text{对所有 } x \in \mathcal{X}, \]

其中 \(Pg(x) = \mathbb{E}[g(X_1) | X_0 = x]\) 是转移算子的一次作用。这个方程的意义在于,它将 \(f\) 的中心化形式表示为一个“鞅差序列”的变换。如果这样的解 \(g\) 存在(在相差一个常数的意义下),那么可以证明渐近方差可以简洁地表示为:

\[\sigma^2_f = \mathbb{E}_\pi[g(X_0)^2 - (Pg(X_0))^2]。 \]

进一步,如果链是可逆的(满足细致平衡条件),则有更简单的形式:

\[\sigma^2_f = \mathbb{E}_\pi[g(X_0)^2 - (Pg(X_0))^2] = \langle g, (I-P)g \rangle_\pi, \]

其中内积是在 \(L^2(\pi)\) 中定义的。这显示了渐近方差与链的谱性质(特别是谱间隙)的联系。

第七步:条件的重要性与常见的充分条件
为了确保CLT成立,我们需要以下关键条件:

  1. 链的稳定性:链必须是遍历的,通常要求是几何遍历或一致遍历。这保证了相关函数以指数速度衰减,从而确保 \(\sigma^2_f\) 中的协方差求和收敛。
  2. 函数的可积性:通常要求 \(f \in L^2(\pi)\)。对于更一般的链(如多项式遍历),可能需要更强的矩条件。
  3. 非简并条件\(\sigma^2_f > 0\)。如果 \(\sigma^2_f = 0\),则极限分布退化为常数0,此时标准化因子可能需要调整(如用 \(n^{1/4}\) 代替 \(\sqrt{n}\)),这涉及到更精细的极限定理。

第八步:应用与意义
马尔可夫链中心极限定理是马尔可夫链蒙特卡洛 方法理论的核心之一。在MCMC中,我们运行一条马尔可夫链来近似计算积分 \(\pi(f) = \mathbb{E}_\pi[f(X)]\)。CLT保证了:

  • 样本均值 \(\bar{f}_n = \frac{1}{n}S_n\)\(\pi(f)\) 的一致估计。
  • 估计误差 \(\sqrt{n}(\bar{f}_n - \pi(f))\) 近似服从 \(N(0, \sigma^2_f)\) 分布。
    这允许我们构建置信区间 和进行误差分析。实践中,我们需要估计 \(\sigma^2_f\),这催生了各种批次方法谱窗方法再生模拟 等技术。

总结:马尔可夫链的中心极限定理将经典中心极限定理推广到了具有马尔可夫依赖性的序列上。其核心结论是,在遍历性和一定的混合条件下,标准化和的极限分布是正态的,但其方差被一个包含了无穷阶协方差和的“渐近方差”所修正。这个定理通过泊松方程与马尔可夫算子的谱理论相联系,并为MCMC模拟的统计推断提供了理论基础。

马尔可夫链的中心极限定理 我们来循序渐进地讲解马尔可夫链的中心极限定理。首先,确保你已经理解之前讲过的“马尔可夫链的平稳分布”、“马尔可夫链的遍历定理”和“中心极限定理”等概念,因为它们是本词条的基础。下面,我们将从最简单的背景开始,逐步深入。 第一步:回顾经典中心极限定理(CLT)的动机 在概率论中,经典的中心极限定理描述了 独立同分布 随机变量和的渐近分布。具体来说,若 \( X_ 1, X_ 2, \dots, X_ n \) 独立同分布,均值为 \( \mu \),方差为 \( \sigma^2 \),则其和的标准化形式 \( S_ n = \frac{\sum_ {i=1}^n (X_ i - \mu)}{\sigma \sqrt{n}} \) 依分布收敛到标准正态分布 \( N(0,1) \)。这个结论是许多统计推断的基石。但它的关键前提是“独立性”,这在许多实际序列(如时间序列、状态转移序列)中并不成立。 第二步:引入马尔可夫链的依赖性问题 马尔可夫链是一类具有马尔可夫性质的随机过程,其未来状态仅依赖于当前状态,与过去历史无关。虽然这种依赖性比一般过程简单,但它打破了经典CLT所要求的独立性假设。因此,一个自然的问题是:对于一个平稳的、遍历的马尔可夫链 \( \{X_ n\} {n \geq 0} \),当我们观察一个关于状态空间的函数(比如 \( f(X_ n) \) ),其部分和 \( S_ n = \sum {i=0}^{n-1} f(X_ i) \) 是否也存在类似的中心极限定理?即标准化后的 \( S_ n \) 是否也收敛到正态分布?答案是肯定的,但需要额外的条件,并会引入新的特征量。 第三步:设定严格框架与平稳分布 考虑一个在状态空间 \( \mathcal{X} \) 上、时间齐次的马尔可夫链 \( \{X_ n\} \),其转移核为 \( P(x, dy) \)。设该链是 不可约、非周期、正常返 的,因此存在唯一的 平稳分布 \( \pi \)。我们假设链从平稳分布开始,即 \( X_ 0 \sim \pi \),这样整个过程是严平稳的。令 \( f: \mathcal{X} \to \mathbb{R} \) 是一个可测函数,我们关心的是随机变量和: \[ S_ n = \sum_ {i=0}^{n-1} f(X_ i)。 \] 在平稳条件下,每个 \( f(X_ i) \) 的边际分布相同,但彼此之间是相关的。 第四步:定义渐近方差(扩散系数) 由于序列存在相关性,经典CLT中使用的方差 \( \text{Var}(f(X_ 0)) \) 不再能刻画和的波动尺度。事实上,通过遍历定理,我们知道样本均值 \( \frac{1}{n}S_ n \) 几乎必然收敛到期望 \( \pi(f) = \mathbb{E} \pi[ f(X_ 0) ] \)。而中心极限定理关注的是其波动幅度: \[ \frac{S_ n - n\pi(f)}{\sqrt{n}}。 \] 其极限方差(如果存在)不再是 \( \sigma^2 = \text{Var} \pi(f(X_ 0)) \),而是一个包含了所有滞后协方差的求和,称为 渐近方差 或 扩散系数 : \[ \sigma^2_ f = \text{Var} \pi(f(X_ 0)) + 2 \sum {k=1}^{\infty} \text{Cov}_ \pi(f(X_ 0), f(X_ k))。 \] 这里,下标 \( \pi \) 表示在初始分布为平稳分布下的期望和协方差。这个无穷级数必须收敛,中心极限定理才可能成立。收敛性由马尔可夫链的混合速度(如几何遍历性)来保证。 第五步:马尔可夫链中心极限定理的表述 在适当的条件下(例如,链是 几何遍历 的,且函数 \( f \) 满足一定的可积性,如 \( f \in L^2(\pi) \) ),上述渐近方差 \( \sigma^2_ f \) 有限且非负,并且我们有: \[ \frac{S_ n - n\pi(f)}{\sqrt{n}} \xrightarrow{d} N(0, \sigma^2_ f), \quad \text{当 } n \to \infty。 \] 这就是 马尔可夫链的中心极限定理 。它表明,尽管观测序列是相关的,但其标准化和的极限分布仍然是正态的,只是方差变成了 \( \sigma^2_ f \),这个方差综合反映了链的依赖结构。 第六步:理解渐近方差的另一种视角——泊松方程 在马尔可夫链理论中,计算或表示 \( \sigma^2_ f \) 的一个有力工具是 泊松方程 (也称为 泊松方程 )。我们寻找一个函数 \( g \) 满足: \[ g(x) - Pg(x) = f(x) - \pi(f), \quad \text{对所有 } x \in \mathcal{X}, \] 其中 \( Pg(x) = \mathbb{E}[ g(X_ 1) | X_ 0 = x ] \) 是转移算子的一次作用。这个方程的意义在于,它将 \( f \) 的中心化形式表示为一个“鞅差序列”的变换。如果这样的解 \( g \) 存在(在相差一个常数的意义下),那么可以证明渐近方差可以简洁地表示为: \[ \sigma^2_ f = \mathbb{E} \pi[ g(X_ 0)^2 - (Pg(X_ 0))^2 ]。 \] 进一步,如果链是 可逆的 (满足细致平衡条件),则有更简单的形式: \[ \sigma^2_ f = \mathbb{E} \pi[ g(X_ 0)^2 - (Pg(X_ 0))^2] = \langle g, (I-P)g \rangle_ \pi, \] 其中内积是在 \( L^2(\pi) \) 中定义的。这显示了渐近方差与链的谱性质(特别是谱间隙)的联系。 第七步:条件的重要性与常见的充分条件 为了确保CLT成立,我们需要以下关键条件: 链的稳定性 :链必须是 遍历 的,通常要求是几何遍历或一致遍历。这保证了相关函数以指数速度衰减,从而确保 \( \sigma^2_ f \) 中的协方差求和收敛。 函数的可积性 :通常要求 \( f \in L^2(\pi) \)。对于更一般的链(如多项式遍历),可能需要更强的矩条件。 非简并条件 :\( \sigma^2_ f > 0 \)。如果 \( \sigma^2_ f = 0 \),则极限分布退化为常数0,此时标准化因子可能需要调整(如用 \( n^{1/4} \) 代替 \( \sqrt{n} \)),这涉及到更精细的极限定理。 第八步:应用与意义 马尔可夫链中心极限定理是 马尔可夫链蒙特卡洛 方法理论的核心之一。在MCMC中,我们运行一条马尔可夫链来近似计算积分 \( \pi(f) = \mathbb{E}_ \pi[ f(X) ] \)。CLT保证了: 样本均值 \( \bar{f}_ n = \frac{1}{n}S_ n \) 是 \( \pi(f) \) 的一致估计。 估计误差 \( \sqrt{n}(\bar{f}_ n - \pi(f)) \) 近似服从 \( N(0, \sigma^2_ f) \) 分布。 这允许我们构建 置信区间 和进行误差分析。实践中,我们需要估计 \( \sigma^2_ f \),这催生了各种 批次方法 、 谱窗方法 或 再生模拟 等技术。 总结 :马尔可夫链的中心极限定理将经典中心极限定理推广到了具有马尔可夫依赖性的序列上。其核心结论是,在遍历性和一定的混合条件下,标准化和的极限分布是正态的,但其方差被一个包含了无穷阶协方差和的“渐近方差”所修正。这个定理通过泊松方程与马尔可夫算子的谱理论相联系,并为MCMC模拟的统计推断提供了理论基础。