随机矩阵的遍历性
随机矩阵的遍历性研究的是由随机矩阵定义的马尔可夫链的长期行为,特别是其状态分布是否收敛到唯一的平稳分布,以及这种收敛的速度。这与确定性动力系统中的遍历理论有深刻的类比。
第一步:理解随机矩阵与马尔可夫链的基本联系
一个随机矩阵 \(P\) 是一个非负矩阵,其每行元素之和为1,即 \(\sum_j P_{ij} = 1\)。它定义了一个时间齐次的马尔可夫链:如果链在当前时刻 \(n\) 处于状态 \(i\),那么它在下一时刻 \(n+1\) 转移到状态 \(j\) 的概率为 \(P_{ij}\)。如果链的初始状态分布是一个行向量 \(\mu^{(0)}\),那么经过 \(n\) 步后的状态分布为 \(\mu^{(n)} = \mu^{(0)} P^n\)。
第二步:平稳分布与遍历性的核心问题
一个概率分布 \(\pi\)(行向量)被称为平稳分布,如果它满足 \(\pi P = \pi\)。这意味着一旦链的分布达到 \(\pi\),它将始终保持在这一分布。遍历性的核心问题是:
- 平稳分布 \(\pi\) 是否存在且唯一?
- 对于任意的初始分布 \(\mu^{(0)}\),当 \(n \to \infty\) 时,\(\mu^{(0)} P^n\) 是否收敛于 \(\pi\)?
如果这两个条件都满足,我们通常称该马尔可夫链(或其对应的随机矩阵)是遍历的。
第三步:判断遍历性的关键准则——不可约性与非周期性
对于有限状态的马尔可夫链,遍历性的判断有明确的代数准则。
- 不可约性: 如果从任何一个状态 \(i\) 出发,经过若干步后都能以正概率到达任何一个状态 \(j\),则称该链是不可约的。这等价于其随机矩阵 \(P\) 是一个不可约矩阵。不可约性保证了平稳分布 \(\pi\) 的存在性和唯一性,并且 \(\pi\) 的所有分量都大于零。
- 非周期性: 一个状态 \(i\) 的周期是所有满足 \(P_{ii}^{(n)} > 0\) 的步数 \(n\) 的最大公约数。如果所有状态的周期都为1,则称链是非周期的。非周期性是保证分布 \(\mu^{(0)} P^n\) 能够收敛(而不只是振荡)到 \(\pi\) 的关键条件。
因此,一个有限状态、不可约且非周期的马尔可夫链是遍历的,即 \(\lim_{n \to \infty} P^n\) 存在,且其每一行都是平稳分布 \(\pi\)。
第四步:从有限维到无限维的推广与谱隙
对于状态空间可能是无限(可数或连续)的马尔可夫链,情况更为复杂。此时,遍历性通常与随机矩阵(或更一般地,转移算子)在某个函数空间(如 \(L^1\) 或 \(L^2\))上的谱性质密切相关。
- 转移算子: 随机矩阵 \(P\) 可以自然地诱导一个对概率分布进行操作的算子(\(\mu \mapsto \mu P\)),也可以诱导一个对函数进行操作的算子(\((Pf)(i) = \sum_j P_{ij} f(j)\))。后一个算子在 \(L^2(\pi)\) 空间(以平稳分布 \(\pi\) 为测度)上是一个压缩算子。
- 谱隙: 在这个 \(L^2(\pi)\) 空间中,常数函数是特征值1对应的特征向量。遍历性等价于1是单重特征值。如果算子的谱(除了1以外)都包含在某个半径小于1的圆盘内,即存在一个“谱隙”,那么这通常意味着分布以几何速率(指数级快速)收敛到平稳分布。这种强收敛性质称为几何遍历性。
第五步:随机矩阵遍历性在更广阔图景中的意义
随机矩阵的遍历性理论是连接离散时间马尔可夫过程与遍历理论的桥梁。一个遍历的马尔可夫链可以看作一个保测动力系统(其相空间是轨道空间,变换是移位算子)。此时,伯克霍夫遍历定理保证了时间平均等于空间平均(对平稳分布 \(\pi\) 的平均)。因此,研究随机矩阵的遍历性,本质上是在研究一类特殊但非常重要的动力系统的统计规律。