马尔可夫链的混合时间
字数 1393 2025-10-31 08:19:59
马尔可夫链的混合时间
1. 基本概念与动机
混合时间(Mixing Time)是衡量马尔可夫链从初始分布收敛到平稳分布速度的指标。若一个马尔可夫链具有遍历性(如你已学过的“马尔可夫链的遍历性”),则其分布会随时间趋近于唯一平稳分布。混合时间定量描述这一过程需要多少步才能达到“接近”平稳分布的状态。
2. 严格定义
设马尔可夫链在有限状态空间上的平稳分布为 \(\pi\),初始分布为 \(\mu\)。在时间 \(t\) 的分布记为 \(\mu_t\)。混合时间通常通过全变差距离(Total Variation Distance)定义:
\[d_{\text{TV}}(\mu_t, \pi) = \frac{1}{2} \sum_x |\mu_t(x) - \pi(x)| \]
对给定的容差 \(\varepsilon > 0\),混合时间定义为:
\[t_{\text{mix}}(\varepsilon) = \min \{ t : \sup_{\mu} d_{\text{TV}}(\mu_t, \pi) \leq \varepsilon \} \]
其中上确界取遍所有初始分布 \(\mu\)。常取 \(\varepsilon = 1/4\) 并记 \(t_{\text{mix}} = t_{\text{mix}}(1/4)\)。
3. 混合时间的性质
- 单调性:混合时间随 \(\varepsilon\) 减小而增大,且满足 \(t_{\text{mix}}(\varepsilon) \leq \lceil \log_2 \varepsilon^{-1} \rceil t_{\text{mix}}\)。
- 最坏初始状态:混合时间由最难以收敛的初始状态(如某个点质量分布)决定。
- 与谱隙的关系:若链可逆(如你已学的“谱隙”),混合时间与谱隙 \(\lambda\) 满足 \(t_{\text{mix}} \propto 1/\lambda\),体现松弛时间的倒数关系。
4. 估计混合时间的方法
- 耦合方法(Coupling):构造两个分别从不同初始状态出发的链,使其在某个随机时刻后状态相同。耦合时间(Coupling Time)的期望可提供混合时间的上界。
- 特征值分析:通过转移矩阵的第二大特征值模长估计谱隙,进而推导混合时间(适用于可逆链)。
- 路径技巧(如康托洛维奇-鲁宾斯坦度量):通过优化运输成本函数来改进耦合分析。
5. 应用与实例
- 随机游走:在 \(n\) 个点的完全图上,混合时间为 \(O(\log n)\);在环状图上为 \(O(n^2)\)。
- 抽样算法:MCMC方法(如Metropolis-Hastings)的效率直接依赖混合时间,快速混合(多项式时间)是算法可行的关键。
- 临界现象:某些链(如伊辛模型 near临界温度)可能出现混合时间指数级增长的相变。
6. 进阶方向
- 切割时间(Cutoff Phenomenon):许多链在 \(t_{\text{mix}}\) 附近发生分布的突然锐变,即“切割现象”。
- 非可逆链的混合:非可逆链可能通过绕过谱隙瓶颈实现更快的混合(如加速的MCMC设计)。
- 连续时间链的混合:类似定义可推广至连续时间马尔可夫过程,混合时间与生成元的谱相关。