马尔可夫链的遍历理论
字数 1299 2025-10-30 17:43:44

马尔可夫链的遍历理论

  1. 基本定义回顾与马尔可夫链的特殊性
    首先,我们回顾一个“保测动力系统”是一个四元组 (X, B, μ, T),其中 T 是一个“可测变换”且保持测度 μ。马尔可夫链可以嵌入到这个框架中,但其状态空间和变换具有特殊的结构。
    考虑一个在有限或可数状态空间 S 上的时齐次马尔可夫链。其“动力系统”的相空间 X 由所有可能的轨道(即序列 (x_0, x_1, x_2, ...),其中每个 x_i ∈ S)构成。变换 T 是移位算子:T(x_0, x_1, x_2, ...) = (x_1, x_2, x_3, ...)。系统的测度 μ 则由马尔可夫链的转移概率和初始分布共同决定。这使得马尔可夫链成为一个具有特定统计规律的“保测动力系统”。

  2. 不变测度与平稳分布
    对于一个马尔可夫链,其“保测变换”所保持的测度 μ 在轨道空间上的表现,与链的“平稳分布”概念紧密相关。
    具体来说,如果概率分布 π 是马尔可夫链的平稳分布(即满足 π = πP,其中 P 是转移概率矩阵),那么由 π 作为初始分布所诱导出的轨道空间上的测度 μ_π,在移位变换 T 下是不变的。也就是说,(X, B, μ_π, T) 构成了一个保测动力系统。这个 μ_π 就是我们遍历理论框架下的“不变测度”。

  3. 不可约性与遍历性
    在马尔可夫链的语境下,我们有其独特的“不可约”概念:如果链可以从任何一个状态以正概率到达另一个状态,则称其为不可约的。
    在遍历理论的框架下,我们关心的是动力系统 (X, B, μ_π, T) 的“遍历性”(或“度量可传递性”)。对于由不可约且正常返的马尔可夫链的平稳分布 π 所构建的系统,它是遍历的。这意味着,从 π-几乎每一个初始轨道出发,系统的时间平均都等于空间平均。这正是“伯克霍夫平均遍历定理”在马尔可夫链上的具体体现。

  4. 收敛速度与混合性
    遍历性保证了长期时间平均的收敛,但不涉及收敛的速度。马尔可夫链的遍历理论进一步研究收敛速度,这与其对应的动力系统的“混合性”强弱有关。
    一个不可约、非周期的马尔可夫链,其概率分布会以指数速度收敛到平稳分布 π。在动力系统术语中,这对应于一种强混合性质。系统的状态在经过足够多次的移位变换后,会变得与初始状态统计独立。这种快速的混合性意味着系统“忘记”其初始条件的速度很快。

  5. 可逆性与谱隙
    许多重要的马尔可夫链(如Metropolis-Hastings算法等MCMC方法中使用的链)是“可逆的”,即满足细致平衡条件:π_i P_{ij} = π_j P_{ji}
    对于可逆的马尔可夫链,其转移概率矩阵 P 在配备了适当内积的函数空间上是自伴的。这使得我们可以研究 P 的谱(特征值)。最大的特征值是1,对应平稳分布。系统的混合速度由第二大的特征值模长(即“谱隙”)控制。谱隙越大(即第二大特征值离1越远),链收敛到平稳分布的速度就越快。这直接关联到动力系统中“保测变换的谱”理论,谱隙的存在意味着系统具有良好的混合性质。

马尔可夫链的遍历理论 基本定义回顾与马尔可夫链的特殊性 首先,我们回顾一个“保测动力系统”是一个四元组 (X, B, μ, T) ,其中 T 是一个“可测变换”且保持测度 μ 。马尔可夫链可以嵌入到这个框架中,但其状态空间和变换具有特殊的结构。 考虑一个在有限或可数状态空间 S 上的时齐次马尔可夫链。其“动力系统”的相空间 X 由所有可能的轨道(即序列 (x_0, x_1, x_2, ...) ,其中每个 x_i ∈ S )构成。变换 T 是移位算子: T(x_0, x_1, x_2, ...) = (x_1, x_2, x_3, ...) 。系统的测度 μ 则由马尔可夫链的转移概率和初始分布共同决定。这使得马尔可夫链成为一个具有特定统计规律的“保测动力系统”。 不变测度与平稳分布 对于一个马尔可夫链,其“保测变换”所保持的测度 μ 在轨道空间上的表现,与链的“平稳分布”概念紧密相关。 具体来说,如果概率分布 π 是马尔可夫链的平稳分布(即满足 π = πP ,其中 P 是转移概率矩阵),那么由 π 作为初始分布所诱导出的轨道空间上的测度 μ_π ,在移位变换 T 下是不变的。也就是说, (X, B, μ_π, T) 构成了一个保测动力系统。这个 μ_π 就是我们遍历理论框架下的“不变测度”。 不可约性与遍历性 在马尔可夫链的语境下,我们有其独特的“不可约”概念:如果链可以从任何一个状态以正概率到达另一个状态,则称其为不可约的。 在遍历理论的框架下,我们关心的是动力系统 (X, B, μ_π, T) 的“遍历性”(或“度量可传递性”)。对于由不可约且正常返的马尔可夫链的平稳分布 π 所构建的系统,它是遍历的。这意味着,从 π -几乎每一个初始轨道出发,系统的时间平均都等于空间平均。这正是“伯克霍夫平均遍历定理”在马尔可夫链上的具体体现。 收敛速度与混合性 遍历性保证了长期时间平均的收敛,但不涉及收敛的速度。马尔可夫链的遍历理论进一步研究收敛速度,这与其对应的动力系统的“混合性”强弱有关。 一个不可约、非周期的马尔可夫链,其概率分布会以指数速度收敛到平稳分布 π 。在动力系统术语中,这对应于一种强混合性质。系统的状态在经过足够多次的移位变换后,会变得与初始状态统计独立。这种快速的混合性意味着系统“忘记”其初始条件的速度很快。 可逆性与谱隙 许多重要的马尔可夫链(如Metropolis-Hastings算法等MCMC方法中使用的链)是“可逆的”,即满足细致平衡条件: π_i P_{ij} = π_j P_{ji} 。 对于可逆的马尔可夫链,其转移概率矩阵 P 在配备了适当内积的函数空间上是自伴的。这使得我们可以研究 P 的谱(特征值)。最大的特征值是1,对应平稳分布。系统的混合速度由第二大的特征值模长(即“谱隙”)控制。谱隙越大(即第二大特征值离1越远),链收敛到平稳分布的速度就越快。这直接关联到动力系统中“保测变换的谱”理论,谱隙的存在意味着系统具有良好的混合性质。