马尔可夫链的极限定理
字数 1859 2025-10-27 19:14:30

马尔可夫链的极限定理

接下来,我们将循序渐进地探讨马尔可夫链的极限定理。这个定理是研究马尔可夫链长期行为的一个核心结果,它描述了在什么条件下,一个马尔可夫链的状态分布会收敛到一个唯一的极限分布(即平稳分布),并且这个极限分布不依赖于链的初始状态。

  1. 回顾:平稳分布与收敛性
    首先,我们需要回顾两个你已经学过的关键概念。
    • 平稳分布:对于一个马尔可夫链,如果存在一个概率分布 π,使得 π = πP(其中 P 是转移概率矩阵),那么 π 被称为该链的平稳分布。直观上,如果链在某个时刻的分布是 π,那么它在未来所有时刻的分布都将保持为 π。
  • 收敛性:我们说一个马尔可夫链收敛,如果无论链从哪个初始状态出发,随着时间步数 n 趋于无穷大,其 n 步转移概率都会趋向于平稳分布。即,对于任意状态 i 和 j,都有 \(\lim_{n \to \infty} P^{(n)}_{ij} = \pi_j\)
  1. 极限定理成立的核心条件:不可约性与非周期性
    并非所有的马尔可夫链都会收敛到一个唯一的平稳分布。极限定理成立需要满足两个关键条件:
    • 不可约性:一个马尔可夫链是不可约的,如果从任何一个状态出发,经过有限步转移,它都能到达任何其他状态(也许不是一步到位)。这意味着状态空间是“一个整体”,链不会被限制在某个子集内。如果链是可约的,它可能会被困在几个互不相通的部分中,每个部分可能有自己的平稳分布,从而导致不存在唯一的、全局的极限分布。
  • 非周期性:周期性是链行为的一种循环模式。一个状态 i 的周期 d 是所有满足 \(P^{(n)}_{ii} > 0\) 的步数 n 的最大公约数。如果 d=1,则状态 i 是非周期的。如果一个不可约的马尔可夫链中至少有一个状态是非周期的,那么整个链就是非周期的。非周期性保证了链的转移不会陷入一个固定的循环中,从而使得长期行为是“平滑”的收敛,而不是在不同值之间振荡。
  1. 极限定理的表述
    现在我们可以正式陈述马尔可夫链的极限定理:

    如果一个马尔可夫链是不可约非周期,并且是正常返的(对于有限状态马尔可夫链,不可约性隐含了正常返性),那么该链存在唯一的平稳分布 π。并且,对于任意初始状态 i 和任意状态 j,都有:

\[ \lim_{n \to \infty} P^{(n)}_{ij} = \pi_j \]

> 这意味着,无论链从哪个状态开始,当转移步数 n 足够大时,链处于状态 j 的概率将无限接近 π_j。
  1. 定理的直观解释与意义

    • “忘记”起点:这个定理最强大的结论之一是,链的长期行为“忘记”了它的初始状态。无论你从 i=1 还是 i=100 开始,经过足够长的时间后,你处于状态 j 的概率都是一样的,即 π_j。
    • 时间平均等于空间平均:这个极限定理与你学过的遍历定理紧密相关。它意味着,从单个状态序列的长期观察中计算出的处于某个状态的时间比例(时间平均),几乎必然地等于该状态的平稳概率 π_j(空间平均)。
    • 应用价值:这一定理是马尔可夫链蒙特卡洛方法 的理论基石。MCMC方法的目标就是从某个复杂的目标分布(即平稳分布 π)中生成样本。我们构建一个满足上述条件的马尔可夫链,使其平稳分布恰好是这个目标分布。然后,我们让链运行足够长的时间(称为“预热期”或“老化期”),之后链产生的状态就可以近似看作是从目标分布中抽取的样本,因为链已经收敛了。
  2. 一个简单的例子:天气模型
    假设天气只有“晴”和“雨”两种状态,转移矩阵为:
    P = [0.9 0.1
    0.5 0.5]

    • 检查条件:这个链显然是不可约的(晴雨相通)且非周期的(例如,从晴到晴一步概率为0.9>0,周期为1)。
    • 求平稳分布:解方程 πP = π。设 π = [a, b],则有:
      a = 0.9a + 0.5b
      b = 0.1a + 0.5b
      且 a + b = 1
      解得 a = 5/6 ≈ 0.833, b = 1/6 ≈ 0.167。
    • 验证极限:计算 P^2, P^4, P^8...,你会发现矩阵的每一行都越来越接近 [5/6, 1/6]。这直观地展示了极限定理:无论今天天气如何,很多天之后,是晴天的概率都约为83.3%,是雨天的概率约为16.7%。

总结来说,马尔可夫链的极限定理为我们提供了预测其长期行为的强大工具,只要链满足不可约和非周期这两个基本条件,它的状态分布最终会稳定下来,并“忘记”起点,收敛到唯一的平稳分布。

马尔可夫链的极限定理 接下来,我们将循序渐进地探讨马尔可夫链的极限定理。这个定理是研究马尔可夫链长期行为的一个核心结果,它描述了在什么条件下,一个马尔可夫链的状态分布会收敛到一个唯一的极限分布(即平稳分布),并且这个极限分布不依赖于链的初始状态。 回顾:平稳分布与收敛性 首先,我们需要回顾两个你已经学过的关键概念。 平稳分布 :对于一个马尔可夫链,如果存在一个概率分布 π,使得 π = πP(其中 P 是转移概率矩阵),那么 π 被称为该链的平稳分布。直观上,如果链在某个时刻的分布是 π,那么它在未来所有时刻的分布都将保持为 π。 收敛性 :我们说一个马尔可夫链收敛,如果无论链从哪个初始状态出发,随着时间步数 n 趋于无穷大,其 n 步转移概率都会趋向于平稳分布。即,对于任意状态 i 和 j,都有 \( \lim_ {n \to \infty} P^{(n)}_ {ij} = \pi_ j \)。 极限定理成立的核心条件:不可约性与非周期性 并非所有的马尔可夫链都会收敛到一个唯一的平稳分布。极限定理成立需要满足两个关键条件: 不可约性 :一个马尔可夫链是不可约的,如果从任何一个状态出发,经过有限步转移,它都能到达任何其他状态(也许不是一步到位)。这意味着状态空间是“一个整体”,链不会被限制在某个子集内。如果链是可约的,它可能会被困在几个互不相通的部分中,每个部分可能有自己的平稳分布,从而导致不存在唯一的、全局的极限分布。 非周期性 :周期性是链行为的一种循环模式。一个状态 i 的周期 d 是所有满足 \( P^{(n)}_ {ii} > 0 \) 的步数 n 的最大公约数。如果 d=1,则状态 i 是非周期的。如果一个不可约的马尔可夫链中至少有一个状态是非周期的,那么整个链就是非周期的。非周期性保证了链的转移不会陷入一个固定的循环中,从而使得长期行为是“平滑”的收敛,而不是在不同值之间振荡。 极限定理的表述 现在我们可以正式陈述马尔可夫链的极限定理: 如果一个马尔可夫链是 不可约 、 非周期 ,并且是 正常返 的(对于有限状态马尔可夫链,不可约性隐含了正常返性),那么该链存在唯一的平稳分布 π。并且,对于任意初始状态 i 和任意状态 j,都有: \[ \lim_ {n \to \infty} P^{(n)}_ {ij} = \pi_ j \] 这意味着,无论链从哪个状态开始,当转移步数 n 足够大时,链处于状态 j 的概率将无限接近 π_ j。 定理的直观解释与意义 “忘记”起点 :这个定理最强大的结论之一是,链的长期行为“忘记”了它的初始状态。无论你从 i=1 还是 i=100 开始,经过足够长的时间后,你处于状态 j 的概率都是一样的,即 π_ j。 时间平均等于空间平均 :这个极限定理与你学过的 遍历定理 紧密相关。它意味着,从单个状态序列的长期观察中计算出的处于某个状态的时间比例(时间平均),几乎必然地等于该状态的平稳概率 π_ j(空间平均)。 应用价值 :这一定理是 马尔可夫链蒙特卡洛方法 的理论基石。MCMC方法的目标就是从某个复杂的目标分布(即平稳分布 π)中生成样本。我们构建一个满足上述条件的马尔可夫链,使其平稳分布恰好是这个目标分布。然后,我们让链运行足够长的时间(称为“预热期”或“老化期”),之后链产生的状态就可以近似看作是从目标分布中抽取的样本,因为链已经收敛了。 一个简单的例子:天气模型 假设天气只有“晴”和“雨”两种状态,转移矩阵为: P = [ 0.9 0.1 0.5 0.5 ] 检查条件 :这个链显然是不可约的(晴雨相通)且非周期的(例如,从晴到晴一步概率为0.9>0,周期为1)。 求平稳分布 :解方程 πP = π。设 π = [ a, b ],则有: a = 0.9a + 0.5b b = 0.1a + 0.5b 且 a + b = 1 解得 a = 5/6 ≈ 0.833, b = 1/6 ≈ 0.167。 验证极限 :计算 P^2, P^4, P^8...,你会发现矩阵的每一行都越来越接近 [ 5/6, 1/6 ]。这直观地展示了极限定理:无论今天天气如何,很多天之后,是晴天的概率都约为83.3%,是雨天的概率约为16.7%。 总结来说,马尔可夫链的极限定理为我们提供了预测其长期行为的强大工具,只要链满足不可约和非周期这两个基本条件,它的状态分布最终会稳定下来,并“忘记”起点,收敛到唯一的平稳分布。