马尔可夫链
我们来学习概率论中一个描述“记忆缺失”随机过程的重要概念:马尔可夫链。
第一步:核心思想——马尔可夫性
想象一个系统,它随着时间在多个可能的状态间切换。比如,每天的天气可以是“晴”、“阴”、“雨”三种状态之一。马尔可夫链的核心特性叫做“马尔可夫性”或无记忆性。它的定义是:
系统在下一时刻的状态,只依赖于当前时刻的状态,而与过去的历史状态无关。
用数学语言表达就是:设 X_n 表示系统在时刻 n 的状态。那么,对于任何时刻 n 和任何可能的状态 i, j, i_{n-1}, ..., i_0,都有:
P(X_{n+1} = j | X_n = i, X_{n-1} = i_{n-1}, ..., X_0 = i_0) = P(X_{n+1} = j | X_n = i)
这个条件概率 P(X_{n+1} = j | X_n = i) 是马尔可夫链的灵魂,我们称之为 “一步转移概率”。
第二步:模型的构成要素
一个(离散时间、有限状态)马尔可夫链由以下几个基本要素确定:
- 状态空间 (S):所有可能状态的集合,通常记为
S = {1, 2, ..., N}(状态数量有限)。 - 转移概率 (P):一个条件概率矩阵,也称为转移矩阵。矩阵中的每个元素
p_{ij}表示系统从状态i一步转移到状态j的概率。即:
p_{ij} = P(X_{n+1} = j | X_n = i) - 初始分布 (π⁽⁰⁾):一个概率向量,表示系统在初始时刻 (
n=0) 处于各个状态的概率。例如,π⁽⁰⁾ = [P(X_0=1), P(X_0=2), ..., P(X_0=N)]。
第三步:转移矩阵与状态演化
转移矩阵 P 是一个 N x N 的方阵,它有一些非常重要的性质:
- 每个元素
p_{ij}都是一个概率,因此满足0 ≤ p_{ij} ≤ 1。 - 从任何一个状态
i出发,下一步必须转移到状态空间中的某个状态(包括自身)。因此,矩阵每一行的概率之和必须等于1,即Σ_j p_{ij} = 1(对所有的i都成立)。
有了转移矩阵和初始分布,我们就可以预测系统在未来任何时刻的状态分布。记 π⁽ⁿ⁾ 为时刻 n 的状态分布向量。那么,π⁽ⁿ⁾ 可以通过矩阵乘法计算:
π⁽ⁿ⁾ = π⁽⁰⁾ Pⁿ
这里 Pⁿ 表示转移矩阵 P 的 n 次幂。这个公式完美体现了马尔可夫链的威力:未来的状态分布完全由初始状态和转移概率决定。
第四步:状态的分类与长期行为
研究马尔可夫链的一个核心问题是:当时间无限推移(n -> ∞)时,系统的行为会怎样?它是否会稳定下来?为了回答这个问题,我们需要对状态进行分类:
- 可达与互通:如果从状态
i出发,经过有限步后有可能到达状态j,则称j是从i可达的。如果i和j互相可达,则称它们是互通的。互通的状态可以归为一个状态类。 - 不可约性:如果一个马尔可夫链的所有状态都属于同一个互通类,则称这个链是不可约的。否则就是可约的。
- 常返性与瞬变性:
- 常返态:一个状态是常返的,如果系统从该状态出发,在将来几乎必定(概率为1)会返回该状态。
- 瞬变态:一个状态是瞬变的,如果系统从该状态出发,存在一个正的概率永远不会返回。
- 周期性:一个状态可能有周期。例如,如果一个状态只能每隔2个时间步被访问到(比如在第2,4,6...步),那么它的周期是2。如果一个状态的周期是1,则称其为非周期的。
第五步:平稳分布
对于不可约且非周期的马尔可夫链,一个非常重要的性质是:无论系统从哪个状态开始,经过长时间演化后,处于各个状态的概率分布会趋于一个稳定的极限,这个极限分布称为平稳分布,记作行向量 π。
平稳分布 π 可以通过求解以下方程得到:
πP = π 且 Σ_i π_i = 1
这个方程的含义是:如果一个时刻系统的状态分布是 π,那么下一时刻的分布依然是 π,分布不再随时间改变。平稳分布描述了马尔可夫链的长期统计平衡行为。