马尔可夫链的极限定理
字数 1859 2025-10-27 19:14:30
马尔可夫链的极限定理
接下来,我们将循序渐进地探讨马尔可夫链的极限定理。这个定理是研究马尔可夫链长期行为的一个核心结果,它描述了在什么条件下,一个马尔可夫链的状态分布会收敛到一个唯一的极限分布(即平稳分布),并且这个极限分布不依赖于链的初始状态。
- 回顾:平稳分布与收敛性
首先,我们需要回顾两个你已经学过的关键概念。- 平稳分布:对于一个马尔可夫链,如果存在一个概率分布 π,使得 π = πP(其中 P 是转移概率矩阵),那么 π 被称为该链的平稳分布。直观上,如果链在某个时刻的分布是 π,那么它在未来所有时刻的分布都将保持为 π。
- 收敛性:我们说一个马尔可夫链收敛,如果无论链从哪个初始状态出发,随着时间步数 n 趋于无穷大,其 n 步转移概率都会趋向于平稳分布。即,对于任意状态 i 和 j,都有 \(\lim_{n \to \infty} P^{(n)}_{ij} = \pi_j\)。
- 极限定理成立的核心条件:不可约性与非周期性
并非所有的马尔可夫链都会收敛到一个唯一的平稳分布。极限定理成立需要满足两个关键条件:- 不可约性:一个马尔可夫链是不可约的,如果从任何一个状态出发,经过有限步转移,它都能到达任何其他状态(也许不是一步到位)。这意味着状态空间是“一个整体”,链不会被限制在某个子集内。如果链是可约的,它可能会被困在几个互不相通的部分中,每个部分可能有自己的平稳分布,从而导致不存在唯一的、全局的极限分布。
- 非周期性:周期性是链行为的一种循环模式。一个状态 i 的周期 d 是所有满足 \(P^{(n)}_{ii} > 0\) 的步数 n 的最大公约数。如果 d=1,则状态 i 是非周期的。如果一个不可约的马尔可夫链中至少有一个状态是非周期的,那么整个链就是非周期的。非周期性保证了链的转移不会陷入一个固定的循环中,从而使得长期行为是“平滑”的收敛,而不是在不同值之间振荡。
- 极限定理的表述
现在我们可以正式陈述马尔可夫链的极限定理:如果一个马尔可夫链是不可约、非周期,并且是正常返的(对于有限状态马尔可夫链,不可约性隐含了正常返性),那么该链存在唯一的平稳分布 π。并且,对于任意初始状态 i 和任意状态 j,都有:
\[ \lim_{n \to \infty} P^{(n)}_{ij} = \pi_j \]
> 这意味着,无论链从哪个状态开始,当转移步数 n 足够大时,链处于状态 j 的概率将无限接近 π_j。
-
定理的直观解释与意义
- “忘记”起点:这个定理最强大的结论之一是,链的长期行为“忘记”了它的初始状态。无论你从 i=1 还是 i=100 开始,经过足够长的时间后,你处于状态 j 的概率都是一样的,即 π_j。
- 时间平均等于空间平均:这个极限定理与你学过的遍历定理紧密相关。它意味着,从单个状态序列的长期观察中计算出的处于某个状态的时间比例(时间平均),几乎必然地等于该状态的平稳概率 π_j(空间平均)。
- 应用价值:这一定理是马尔可夫链蒙特卡洛方法 的理论基石。MCMC方法的目标就是从某个复杂的目标分布(即平稳分布 π)中生成样本。我们构建一个满足上述条件的马尔可夫链,使其平稳分布恰好是这个目标分布。然后,我们让链运行足够长的时间(称为“预热期”或“老化期”),之后链产生的状态就可以近似看作是从目标分布中抽取的样本,因为链已经收敛了。
-
一个简单的例子:天气模型
假设天气只有“晴”和“雨”两种状态,转移矩阵为:
P = [0.9 0.1
0.5 0.5]- 检查条件:这个链显然是不可约的(晴雨相通)且非周期的(例如,从晴到晴一步概率为0.9>0,周期为1)。
- 求平稳分布:解方程 πP = π。设 π = [a, b],则有:
a = 0.9a + 0.5b
b = 0.1a + 0.5b
且 a + b = 1
解得 a = 5/6 ≈ 0.833, b = 1/6 ≈ 0.167。 - 验证极限:计算 P^2, P^4, P^8...,你会发现矩阵的每一行都越来越接近 [5/6, 1/6]。这直观地展示了极限定理:无论今天天气如何,很多天之后,是晴天的概率都约为83.3%,是雨天的概率约为16.7%。
总结来说,马尔可夫链的极限定理为我们提供了预测其长期行为的强大工具,只要链满足不可约和非周期这两个基本条件,它的状态分布最终会稳定下来,并“忘记”起点,收敛到唯一的平稳分布。