马尔可夫链的混合时间
字数 1393 2025-10-31 08:19:59

马尔可夫链的混合时间

1. 基本概念与动机
混合时间(Mixing Time)是衡量马尔可夫链从初始分布收敛到平稳分布速度的指标。若一个马尔可夫链具有遍历性(如你已学过的“马尔可夫链的遍历性”),则其分布会随时间趋近于唯一平稳分布。混合时间定量描述这一过程需要多少步才能达到“接近”平稳分布的状态。

2. 严格定义
设马尔可夫链在有限状态空间上的平稳分布为 \(\pi\),初始分布为 \(\mu\)。在时间 \(t\) 的分布记为 \(\mu_t\)。混合时间通常通过全变差距离(Total Variation Distance)定义:

\[d_{\text{TV}}(\mu_t, \pi) = \frac{1}{2} \sum_x |\mu_t(x) - \pi(x)| \]

对给定的容差 \(\varepsilon > 0\),混合时间定义为:

\[t_{\text{mix}}(\varepsilon) = \min \{ t : \sup_{\mu} d_{\text{TV}}(\mu_t, \pi) \leq \varepsilon \} \]

其中上确界取遍所有初始分布 \(\mu\)。常取 \(\varepsilon = 1/4\) 并记 \(t_{\text{mix}} = t_{\text{mix}}(1/4)\)

3. 混合时间的性质

  • 单调性:混合时间随 \(\varepsilon\) 减小而增大,且满足 \(t_{\text{mix}}(\varepsilon) \leq \lceil \log_2 \varepsilon^{-1} \rceil t_{\text{mix}}\)
  • 最坏初始状态:混合时间由最难以收敛的初始状态(如某个点质量分布)决定。
  • 与谱隙的关系:若链可逆(如你已学的“谱隙”),混合时间与谱隙 \(\lambda\) 满足 \(t_{\text{mix}} \propto 1/\lambda\),体现松弛时间的倒数关系。

4. 估计混合时间的方法

  • 耦合方法(Coupling):构造两个分别从不同初始状态出发的链,使其在某个随机时刻后状态相同。耦合时间(Coupling Time)的期望可提供混合时间的上界。
  • 特征值分析:通过转移矩阵的第二大特征值模长估计谱隙,进而推导混合时间(适用于可逆链)。
  • 路径技巧(如康托洛维奇-鲁宾斯坦度量):通过优化运输成本函数来改进耦合分析。

5. 应用与实例

  • 随机游走:在 \(n\) 个点的完全图上,混合时间为 \(O(\log n)\);在环状图上为 \(O(n^2)\)
  • 抽样算法:MCMC方法(如Metropolis-Hastings)的效率直接依赖混合时间,快速混合(多项式时间)是算法可行的关键。
  • 临界现象:某些链(如伊辛模型 near临界温度)可能出现混合时间指数级增长的相变。

6. 进阶方向

  • 切割时间(Cutoff Phenomenon):许多链在 \(t_{\text{mix}}\) 附近发生分布的突然锐变,即“切割现象”。
  • 非可逆链的混合:非可逆链可能通过绕过谱隙瓶颈实现更快的混合(如加速的MCMC设计)。
  • 连续时间链的混合:类似定义可推广至连续时间马尔可夫过程,混合时间与生成元的谱相关。
马尔可夫链的混合时间 1. 基本概念与动机 混合时间(Mixing Time)是衡量马尔可夫链从初始分布收敛到平稳分布速度的指标。若一个马尔可夫链具有遍历性(如你已学过的“马尔可夫链的遍历性”),则其分布会随时间趋近于唯一平稳分布。混合时间定量描述这一过程需要多少步才能达到“接近”平稳分布的状态。 2. 严格定义 设马尔可夫链在有限状态空间上的平稳分布为 \(\pi\),初始分布为 \(\mu\)。在时间 \(t\) 的分布记为 \(\mu_ t\)。混合时间通常通过全变差距离(Total Variation Distance)定义: \[ d_ {\text{TV}}(\mu_ t, \pi) = \frac{1}{2} \sum_ x |\mu_ t(x) - \pi(x)| \] 对给定的容差 \(\varepsilon > 0\),混合时间定义为: \[ t_ {\text{mix}}(\varepsilon) = \min \{ t : \sup_ {\mu} d_ {\text{TV}}(\mu_ t, \pi) \leq \varepsilon \} \] 其中上确界取遍所有初始分布 \(\mu\)。常取 \(\varepsilon = 1/4\) 并记 \(t_ {\text{mix}} = t_ {\text{mix}}(1/4)\)。 3. 混合时间的性质 单调性 :混合时间随 \(\varepsilon\) 减小而增大,且满足 \(t_ {\text{mix}}(\varepsilon) \leq \lceil \log_ 2 \varepsilon^{-1} \rceil t_ {\text{mix}}\)。 最坏初始状态 :混合时间由最难以收敛的初始状态(如某个点质量分布)决定。 与谱隙的关系 :若链可逆(如你已学的“谱隙”),混合时间与谱隙 \(\lambda\) 满足 \(t_ {\text{mix}} \propto 1/\lambda\),体现松弛时间的倒数关系。 4. 估计混合时间的方法 耦合方法 (Coupling):构造两个分别从不同初始状态出发的链,使其在某个随机时刻后状态相同。耦合时间(Coupling Time)的期望可提供混合时间的上界。 特征值分析 :通过转移矩阵的第二大特征值模长估计谱隙,进而推导混合时间(适用于可逆链)。 路径技巧 (如康托洛维奇-鲁宾斯坦度量):通过优化运输成本函数来改进耦合分析。 5. 应用与实例 随机游走 :在 \(n\) 个点的完全图上,混合时间为 \(O(\log n)\);在环状图上为 \(O(n^2)\)。 抽样算法 :MCMC方法(如Metropolis-Hastings)的效率直接依赖混合时间,快速混合(多项式时间)是算法可行的关键。 临界现象 :某些链(如伊辛模型 near临界温度)可能出现混合时间指数级增长的相变。 6. 进阶方向 切割时间 (Cutoff Phenomenon):许多链在 \(t_ {\text{mix}}\) 附近发生分布的突然锐变,即“切割现象”。 非可逆链的混合 :非可逆链可能通过绕过谱隙瓶颈实现更快的混合(如加速的MCMC设计)。 连续时间链的混合 :类似定义可推广至连续时间马尔可夫过程,混合时间与生成元的谱相关。