马尔可夫链的逆过程
步骤1:马尔可夫链的基本回顾
马尔可夫链是一类特殊的随机过程,其核心特性是“无记忆性”或马尔可夫性。具体来说,一个离散时间、离散状态的马尔可夫链的未来状态的条件概率分布,只依赖于当前状态,而与过去的状态无关。我们用 \(X_0, X_1, X_2, \ldots\) 表示状态序列,其马尔可夫性可以表示为:
\(P(X_{n+1} = j | X_n = i, X_{n-1}, \ldots, X_0) = P(X_{n+1} = j | X_n = i)\)
这个条件概率被称为从状态 \(i\) 到状态 \(j\) 的一步转移概率,记作 \(p_{ij}\)。所有转移概率构成的矩阵 \(P\) 称为转移概率矩阵。
步骤2:时间可逆性的直观引入
现在,我们考虑一个平稳的马尔可夫链。假设该链已经运行了很长时间,其状态分布已经达到了平稳分布 \(\pi\),即 \(\pi P = \pi\)。如果我们把这个过程录制下来,然后倒放,观察状态序列 \(\ldots, X_{n+1}, X_n, X_{n-1}, \ldots\)。
一个自然的问题是:这个倒放后的序列本身是否仍然构成一个马尔可夫链?如果构成,它是否还具有无记忆性?这个“倒放”的过程,就是我们所说的逆过程。研究逆过程的核心概念是时间可逆性。
步骤3:逆过程的精确定义
设 \(\{X_n\}_{n \geq 0}\) 是一个平稳的马尔可夫链,其平稳分布为 \(\pi\)(即 \(\pi_i > 0\) 对所有 \(i\) 成立,且 \(\pi P = \pi\))。
我们定义一个新的随机过程 \(\{Y_n\}\),其中 \(Y_n = X_{-n}\)(即原过程在时间点 \(-n\) 的状态)。这个过程 \(\{Y_n\}\) 就称为原马尔可夫链 \(\{X_n\}\) 的逆过程。
我们需要探究 \(\{Y_n\}\) 是否也是一个马尔可夫链。
步骤4:推导逆过程的转移概率
为了判断 \(\{Y_n\}\) 是否是马尔可夫链,我们需要计算其转移概率。考虑逆过程在已知当前状态的情况下,下一个状态的条件概率:
\(q_{ij} = P(Y_{n+1} = j | Y_n = i)\)
根据逆过程的定义,\(Y_n = X_{-n} = i\),\(Y_{n+1} = X_{-(n+1)} = j\)。因此,这个概率等价于:
\(q_{ij} = P(X_{-(n+1)} = j | X_{-n} = i)\)
由于原过程是平稳的,其统计特性不随时间平移而改变。因此,我们可以等价地考虑时间点 \(n=1\) 和 \(n=0\):
\(q_{ij} = P(X_0 = j | X_1 = i)\)
现在,我们利用贝叶斯定理来计算这个条件概率:
\(P(X_0 = j | X_1 = i) = \frac{P(X_1 = i | X_0 = j) P(X_0 = j)}{P(X_1 = i)}\)
由于平稳性,\(P(X_0 = j) = \pi_j\) 且 \(P(X_1 = i) = \pi_i\)。
而 \(P(X_1 = i | X_0 = j)\) 正是原过程的转移概率 \(p_{ji}\)。
因此,我们得到逆过程的转移概率为:
\(q_{ij} = \frac{\pi_j p_{ji}}{\pi_i}\)
步骤5:时间可逆性的定义与充要条件
如果逆过程 \(\{Y_n\}\) 的转移概率 \(q_{ij}\) 与原过程 \(\{X_n\}\) 的转移概率 \(p_{ij}\) 对于所有状态 \(i, j\) 都相等,即:
\(\pi_i p_{ij} = \pi_j p_{ji} \quad \text{对所有 } i, j \text{ 成立}\)
那么,我们称这个平稳的马尔可夫链是时间可逆的。上述等式被称为细致平衡条件。
这意味着,对于一个时间可逆的链,在平稳分布下,从状态 \(i\) 转移到状态 \(j\) 的概率流(\(\pi_i p_{ij}\))等于从状态 \(j\) 转移到状态 \(i\) 的概率流(\(\pi_j p_{ji}\))。其统计规律在时间正序和逆序上是不可区分的。
步骤6:时间可逆性的重要意义与应用
- 模型验证:如果一个物理系统或随机过程被建模为马尔可夫链,并且我们相信该系统在时间上是可逆的(例如,许多封闭的平衡态物理系统),那么该模型的转移概率必须满足细致平衡条件。这为模型构建提供了重要的约束。
- 简化计算:在马尔可夫链蒙特卡洛方法中,如果我们能构造一个满足细致平衡条件的转移核,那么该链的平稳分布就是我们所期望的目标分布。这大大简化了MCMC算法的设计,Metropolis-Hastings算法就是基于这一原理。
- 性质分析:时间可逆性意味着链具有一些额外的良好性质。例如,可逆链的转移概率矩阵 \(P\) 在适当的内积下是自伴的(对称的),这使得其谱分解和分析更为简便。
- 排队网络:在排队论和网络分析中,许多重要的模型(如Jackson网络)都被证明是时间可逆的,这使得分析其稳态行为变得更容易。