遍历理论中的齐次马尔可夫链
字数 2400 2025-11-04 00:21:33

遍历理论中的齐次马尔可夫链

我们开始学习“遍历理论中的齐次马尔可夫链”。这个词条将马尔可夫链的经典概率论概念置于遍历理论的框架下进行分析,重点关注在保测变换的视角下如何理解其渐近行为。

第一步:齐次马尔可夫链的基本定义

一个(离散时间)齐次马尔可夫链是一个随机过程,其未来状态的条件概率分布只依赖于当前状态,并且这个条件概率不随时间变化。

  1. 状态空间:我们考虑一个可测空间 (X, B),其中 X 是状态集合(可以是有限、可数无限或更一般的空间),BX 上的一个 σ-代数。
  2. 转移概率:齐次性由一个转移核 P(x, A) 描述,其中 x ∈ XA ∈ B。它满足:
    • 对每个固定的 xP(x, ·)(X, B) 上的一个概率测度。
    • 对每个固定的 AP(·, A) 是一个可测函数。
    • P(x, A) 表示系统当前处于状态 x 时,下一步转移到集合 A 中的概率。
  3. 初始分布:过程的起点由一个初始概率测度 μ 描述,μ(A) 表示初始状态位于集合 A 中的概率。
  4. 路径空间:整个马尔可夫链的演化路径存在于序列空间 Ω = X^Z(或 X^N)中。路径记为 ω = (..., ω_{-1}, ω_0, ω_1, ...)

第二步:马尔可夫链的保测变换视角

遍历理论的核心是研究保测变换的渐近性质。我们可以将一个马尔可夫链“提升”为一个保测动力系统。

  1. 移位算子:在路径空间 Ω 上定义移位变换 T: Ω -> Ω,满足 (Tω)_n = ω_{n+1}。这个算子将整个路径在时间上向前移动一步。
  2. 不变测度的构造:关键问题是如何在路径空间 (Ω, F) 上构造一个概率测度 P_μ,使得移位变换 T 成为保测变换(即 P_μ(T^{-1}F) = P_μ(F) 对所有可测集 F 成立)。
  3. 科尔莫戈罗夫延拓定理:给定初始分布 μ 和转移核 P,我们可以唯一地确定路径空间上的一个测度 P_μ。对于只依赖于有限个时间点的柱集 C = {ω : ω_0 ∈ A_0, ω_1 ∈ A_1, ..., ω_k ∈ A_k},其测度定义为:
    P_μ(C) = ∫_{A_0} μ(dx_0) ∫_{A_1} P(x_0, dx_1) ... ∫_{A_k} P(x_{k-1}, dx_k)
    这个测度 P_μ 被称为由 μP 生成的马尔可夫测度。可以证明,在这个测度下,移位变换 T 是保测的。因此,(Ω, F, P_μ, T) 构成了一个保测动力系统。

第三步:不变测度与平稳分布

在路径空间上构造的保测变换,其性质与状态空间上的一个关键概念紧密相关。

  1. 平稳分布:状态空间 X 上的一个概率测度 π 被称为关于转移核 P平稳分布(或不变测度),如果它对所有 A ∈ B 满足:
    π(A) = ∫_X P(x, A) π(dx)
    这个等式意味着,如果链在某个时刻的分布是 π,那么下一步(以及所有未来时刻)的分布也仍然是 π
  2. 平稳分布与路径空间不变测度的关系:如果初始分布 μ 是平稳分布 π,那么对应的路径空间测度 P_π 在移位变换 T 下不仅是保测的,而且是平稳的(即过程在时间上是统计均匀的)。此时,我们称马尔可夫链是平稳的。

第四步:遍历性与不可约性

在建立了保测系统框架后,我们可以应用遍历理论的基本概念。

  1. 不可约性:这是马尔可夫链自身的一个核心概念。一个链被称为 φ-不可约 的,如果存在一个测度 φ 使得对任何满足 φ(A) > 0 的集合 A,从任何状态 x 出发,经过有限步到达 A 的概率都大于零。这保证了状态空间不能被分解成两个互不相通的部分。
  2. 遍历性的等价表述:在保测系统 (Ω, F, P_π, T) 的语境下,遍历性意味着任何满足 T^{-1}F = F 的集合 F(即不变集),其测度 P_π(F) 只能是 0 或 1。
  3. 马尔可夫链的遍历定理:对于一个具有平稳分布 π 的不可约马尔可夫链,其对应的保测系统 (Ω, F, P_π, T) 是遍历的。这意味着,对于任何可测函数 f: X -> R∫ |f| dπ < ∞,时间平均几乎必然收敛于空间平均:
    lim_{n->∞} (1/n) Σ_{k=0}^{n-1} f(ω_k) = ∫_X f(x) π(dx), 对于 P_π-几乎所有的路径 ω 成立。
    这为马尔可夫链的蒙特卡洛方法提供了理论基础。

第五步:更强性质与混合性

遍历性(不可约性)保证了时间平均收敛,但未说明收敛的速度。更强的遍历性质对应于更快的收敛。

  1. 混合性:如果马尔可夫链是非周期的不可约的,那么它通常具有更强的混合性质。这意味着,无论初始分布如何,链在 n 步后的分布 μP^n 都会弱收敛到平稳分布 π
  2. 在保测系统中的体现:在路径空间 (Ω, F, P_π, T) 上,混合性表现为:对于任意两个可测集 A, B ∈ F,有 lim_{n->∞} P_π(A ∩ T^{-n}B) = P_π(A) P_π(B)。这表示在长时间后,事件 A 和事件 T^{-n}B(即 Bn 步后发生)变得近乎独立。
  3. 谱隙:混合性的速度与转移算子(在 L^2(π) 空间上定义)的谱隙有关。如果存在谱隙,则收敛是指数级的,这是许多应用中所期望的性质。

通过以上五个步骤,我们将概率论中的齐次马尔可夫链,系统地置于遍历理论的框架下进行了解读,揭示了其动态本质。

遍历理论中的齐次马尔可夫链 我们开始学习“遍历理论中的齐次马尔可夫链”。这个词条将马尔可夫链的经典概率论概念置于遍历理论的框架下进行分析,重点关注在保测变换的视角下如何理解其渐近行为。 第一步:齐次马尔可夫链的基本定义 一个(离散时间)齐次马尔可夫链是一个随机过程,其未来状态的条件概率分布只依赖于当前状态,并且这个条件概率不随时间变化。 状态空间 :我们考虑一个可测空间 (X, B) ,其中 X 是状态集合(可以是有限、可数无限或更一般的空间), B 是 X 上的一个 σ-代数。 转移概率 :齐次性由一个 转移核 P(x, A) 描述,其中 x ∈ X , A ∈ B 。它满足: 对每个固定的 x , P(x, ·) 是 (X, B) 上的一个概率测度。 对每个固定的 A , P(·, A) 是一个可测函数。 P(x, A) 表示系统当前处于状态 x 时,下一步转移到集合 A 中的概率。 初始分布 :过程的起点由一个初始概率测度 μ 描述, μ(A) 表示初始状态位于集合 A 中的概率。 路径空间 :整个马尔可夫链的演化路径存在于序列空间 Ω = X^Z (或 X^N )中。路径记为 ω = (..., ω_{-1}, ω_0, ω_1, ...) 。 第二步:马尔可夫链的保测变换视角 遍历理论的核心是研究保测变换的渐近性质。我们可以将一个马尔可夫链“提升”为一个保测动力系统。 移位算子 :在路径空间 Ω 上定义 移位变换 T: Ω -> Ω ,满足 (Tω)_n = ω_{n+1} 。这个算子将整个路径在时间上向前移动一步。 不变测度的构造 :关键问题是如何在路径空间 (Ω, F) 上构造一个概率测度 P_μ ,使得移位变换 T 成为保测变换(即 P_μ(T^{-1}F) = P_μ(F) 对所有可测集 F 成立)。 科尔莫戈罗夫延拓定理 :给定初始分布 μ 和转移核 P ,我们可以唯一地确定路径空间上的一个测度 P_μ 。对于只依赖于有限个时间点的柱集 C = {ω : ω_0 ∈ A_0, ω_1 ∈ A_1, ..., ω_k ∈ A_k} ,其测度定义为: P_μ(C) = ∫_{A_0} μ(dx_0) ∫_{A_1} P(x_0, dx_1) ... ∫_{A_k} P(x_{k-1}, dx_k) 。 这个测度 P_μ 被称为由 μ 和 P 生成的 马尔可夫测度 。可以证明,在这个测度下,移位变换 T 是保测的。因此, (Ω, F, P_μ, T) 构成了一个保测动力系统。 第三步:不变测度与平稳分布 在路径空间上构造的保测变换,其性质与状态空间上的一个关键概念紧密相关。 平稳分布 :状态空间 X 上的一个概率测度 π 被称为关于转移核 P 的 平稳分布 (或不变测度),如果它对所有 A ∈ B 满足: π(A) = ∫_X P(x, A) π(dx) 。 这个等式意味着,如果链在某个时刻的分布是 π ,那么下一步(以及所有未来时刻)的分布也仍然是 π 。 平稳分布与路径空间不变测度的关系 :如果初始分布 μ 是平稳分布 π ,那么对应的路径空间测度 P_π 在移位变换 T 下不仅是保测的,而且是 平稳的 (即过程在时间上是统计均匀的)。此时,我们称马尔可夫链是平稳的。 第四步:遍历性与不可约性 在建立了保测系统框架后,我们可以应用遍历理论的基本概念。 不可约性 :这是马尔可夫链自身的一个核心概念。一个链被称为 φ-不可约 的,如果存在一个测度 φ 使得对任何满足 φ(A) > 0 的集合 A ,从任何状态 x 出发,经过有限步到达 A 的概率都大于零。这保证了状态空间不能被分解成两个互不相通的部分。 遍历性的等价表述 :在保测系统 (Ω, F, P_π, T) 的语境下,遍历性意味着任何满足 T^{-1}F = F 的集合 F (即不变集),其测度 P_π(F) 只能是 0 或 1。 马尔可夫链的遍历定理 :对于一个具有平稳分布 π 的不可约马尔可夫链,其对应的保测系统 (Ω, F, P_π, T) 是遍历的。这意味着,对于任何可测函数 f: X -> R 且 ∫ |f| dπ < ∞ ,时间平均几乎必然收敛于空间平均: lim_{n->∞} (1/n) Σ_{k=0}^{n-1} f(ω_k) = ∫_X f(x) π(dx) , 对于 P_π -几乎所有的路径 ω 成立。 这为马尔可夫链的蒙特卡洛方法提供了理论基础。 第五步:更强性质与混合性 遍历性(不可约性)保证了时间平均收敛,但未说明收敛的速度。更强的遍历性质对应于更快的收敛。 混合性 :如果马尔可夫链是 非周期的 且 不可约的 ,那么它通常具有更强的混合性质。这意味着,无论初始分布如何,链在 n 步后的分布 μP^n 都会弱收敛到平稳分布 π 。 在保测系统中的体现 :在路径空间 (Ω, F, P_π, T) 上,混合性表现为:对于任意两个可测集 A, B ∈ F ,有 lim_{n->∞} P_π(A ∩ T^{-n}B) = P_π(A) P_π(B) 。这表示在长时间后,事件 A 和事件 T^{-n}B (即 B 在 n 步后发生)变得近乎独立。 谱隙 :混合性的速度与转移算子(在 L^2(π) 空间上定义)的 谱隙 有关。如果存在谱隙,则收敛是指数级的,这是许多应用中所期望的性质。 通过以上五个步骤,我们将概率论中的齐次马尔可夫链,系统地置于遍历理论的框架下进行了解读,揭示了其动态本质。