马尔可夫链的大数定律
-
基础概念回顾与问题引入
假设你观察一个马尔可夫链(例如一个简单的随机游走)在很长一段时间内的行为。你记录下某个特定状态(比如状态A)出现的频率。一个自然的问题是:当观察时间趋向于无穷时,这个频率会稳定下来吗?如果会,它会稳定在哪个值?马尔可夫链的大数定律正是回答这个问题的定理。它指出,在适当的条件下,这个时间平均(即频率)会几乎必然地收敛于该状态在平稳分布中的概率(即空间平均)。 -
数学框架与前提条件
设 \((X_n)\) 是一个在可数状态空间 \(S\) 上的时间齐次马尔可夫链,其转移矩阵为 \(P\)。我们假设该链是不可约且正常返的。这意味着从任何状态出发都能到达任何其他状态,并且链会无限次返回每个状态,其平均返回时间是有限的。在此条件下,存在唯一的平稳分布 \(\pi\),满足 \(\pi P = \pi\)。平稳分布 \(\pi(j)\) 可以解释为链长期处于状态 \(j\) 的概率。 -
定理的严格表述
马尔可夫链(强大数定律):设 \((X_n)\) 是一个不可约、正常返的马尔可夫链,其平稳分布为 \(\pi\)。那么,对于任何有界函数 \(f: S \to \mathbb{R}\) 以及任何初始分布,都有:
\[ \lim_{n \to \infty} \frac{1}{n} \sum_{k=0}^{n-1} f(X_k) = \mathbb{E}_\pi[f] \quad \text{几乎必然}. \]
这里,\(\mathbb{E}_\pi[f] = \sum_{j \in S} f(j) \pi(j)\) 是函数 \(f\) 关于平稳分布 \(\pi\) 的期望。特别地,如果我们取 \(f\) 为状态 \(j\) 的指示函数(即当 \(X_k = j\) 时为1,否则为0),那么左边求和就表示前 \(n\) 步中访问状态 \(j\) 的次数,而右边就是 \(\pi(j)\)。这直接回答了引言中的问题:访问频率几乎必然收敛于平稳概率。
-
与遍历理论的核心联系
这个定理是遍历理论在马尔可夫链这一具体模型上的一个深刻体现。我们可以将马尔可夫链与一个保测动力系统联系起来。考虑序列空间 \(\Omega = S^{\mathbb{N}}\) 及其上的移位变换 \(T\)。在平稳分布 \(\pi\) 下,马尔可夫链的轨道分布 \(\mathbb{P}_\pi\) 构成了一个关于 \(T\) 的不变概率测度。此时,不可约性和正常返性保证了该动力系统是遍历的。因此,马尔可夫链的大数定律本质上是伯克霍夫逐点遍历定理在这一特定遍历系统上的应用。它揭示了时间平均(轨道的历史行为)等于空间平均(相空间整体的统计特性)。 -
证明思路解析
证明的核心是使用鞅论这一强大工具。定义 \(Y_n = f(X_n)\),并考虑其与条件期望的偏差所构成的累加和 \(M_n = \sum_{k=0}^{n-1} [f(X_k) - Pf(X_k)]\),其中 \(Pf(X_k) = \mathbb{E}[f(X_{k+1}) | X_k]\)。可以证明 \((M_n)\) 是一个鞅,其增量具有有界的条件方差。对鞅应用强大数定律,可得 \(M_n/n \to 0\) 几乎必然。由于链具有平稳分布 \(\pi\) 且不可约,当 \(n\) 很大时,\(Pf(X_k)\) 在时间平均下近似于 \(\mathbb{E}_\pi[Pf]\)。而根据平稳分布的性质,\(\mathbb{E}_\pi[Pf] = \mathbb{E}_\pi[f]\)。将这几部分结合起来,就完成了定理的证明。 -
重要性与应用场景
马尔可夫链的大数定律是概率论和统计学中许多应用的基石。
- 蒙特卡洛方法:在马尔可夫链蒙特卡洛中,我们构造一个以目标分布 \(\pi\) 为平稳分布的马尔可夫链。通过运行该链并计算时间平均,我们可以近似计算关于 \(\pi\) 的期望值 \(\mathbb{E}_\pi[f]\)。大数定律保证了这种近似的渐近正确性。
- 统计估计:当观测数据来自一个遍历的马尔可夫链时,样本均值是总体均值的一致估计量。
- 排队论与可靠性分析:用于分析系统长期运行下的平均队列长度、服务器利用率等性能指标。