马尔可夫链的遍历理论
-
基本定义回顾与马尔可夫链的特殊性
首先,我们回顾一个“保测动力系统”是一个四元组(X, B, μ, T),其中T是一个“可测变换”且保持测度μ。马尔可夫链可以嵌入到这个框架中,但其状态空间和变换具有特殊的结构。
考虑一个在有限或可数状态空间S上的时齐次马尔可夫链。其“动力系统”的相空间X由所有可能的轨道(即序列(x_0, x_1, x_2, ...),其中每个x_i ∈ S)构成。变换T是移位算子:T(x_0, x_1, x_2, ...) = (x_1, x_2, x_3, ...)。系统的测度μ则由马尔可夫链的转移概率和初始分布共同决定。这使得马尔可夫链成为一个具有特定统计规律的“保测动力系统”。 -
不变测度与平稳分布
对于一个马尔可夫链,其“保测变换”所保持的测度μ在轨道空间上的表现,与链的“平稳分布”概念紧密相关。
具体来说,如果概率分布π是马尔可夫链的平稳分布(即满足π = πP,其中P是转移概率矩阵),那么由π作为初始分布所诱导出的轨道空间上的测度μ_π,在移位变换T下是不变的。也就是说,(X, B, μ_π, T)构成了一个保测动力系统。这个μ_π就是我们遍历理论框架下的“不变测度”。 -
不可约性与遍历性
在马尔可夫链的语境下,我们有其独特的“不可约”概念:如果链可以从任何一个状态以正概率到达另一个状态,则称其为不可约的。
在遍历理论的框架下,我们关心的是动力系统(X, B, μ_π, T)的“遍历性”(或“度量可传递性”)。对于由不可约且正常返的马尔可夫链的平稳分布π所构建的系统,它是遍历的。这意味着,从π-几乎每一个初始轨道出发,系统的时间平均都等于空间平均。这正是“伯克霍夫平均遍历定理”在马尔可夫链上的具体体现。 -
收敛速度与混合性
遍历性保证了长期时间平均的收敛,但不涉及收敛的速度。马尔可夫链的遍历理论进一步研究收敛速度,这与其对应的动力系统的“混合性”强弱有关。
一个不可约、非周期的马尔可夫链,其概率分布会以指数速度收敛到平稳分布π。在动力系统术语中,这对应于一种强混合性质。系统的状态在经过足够多次的移位变换后,会变得与初始状态统计独立。这种快速的混合性意味着系统“忘记”其初始条件的速度很快。 -
可逆性与谱隙
许多重要的马尔可夫链(如Metropolis-Hastings算法等MCMC方法中使用的链)是“可逆的”,即满足细致平衡条件:π_i P_{ij} = π_j P_{ji}。
对于可逆的马尔可夫链,其转移概率矩阵P在配备了适当内积的函数空间上是自伴的。这使得我们可以研究P的谱(特征值)。最大的特征值是1,对应平稳分布。系统的混合速度由第二大的特征值模长(即“谱隙”)控制。谱隙越大(即第二大特征值离1越远),链收敛到平稳分布的速度就越快。这直接关联到动力系统中“保测变换的谱”理论,谱隙的存在意味着系统具有良好的混合性质。