马尔可夫移位
字数 1928 2025-10-29 21:52:58

马尔可夫移位

好的,我们开始学习“马尔可夫移位”。这是一个将遍历理论与随机过程(特别是马尔可夫链)深刻联系起来的核心概念。

第一步:重温基础——符号动力系统与移位算子

首先,想象一个由符号构成的空间。最简单的情况是,我们有两个符号,比如0和1。那么,所有双向无限的0-1序列就构成了一个空间,记为 Σ = { (..., x⁻², x⁻¹, x⁰, x¹, x², ...) | 每个 xⁱ 是 0 或 1 }。这个空间里的一个点,就是一个完整的、向过去和未来都无限延伸的序列。

在这个空间上,我们定义一个非常重要的变换,叫做移位算子,通常记为 σ。它的作用很简单:把序列整体向左移动一位。具体来说,如果有一个点 x = (..., x₋₁, x₀, x₁, x₂, ...),那么经过移位变换后,得到的新点 y = σ(x),其第 n 位的符号满足 y_n = x_{n+1}。也就是说,原来在第1位的符号,现在到了第0位;原来在第0位的符号,现在到了第-1位,以此类推。这个 (Σ, σ) 系统本身就是一个动力系统,称为伯努利移位(如果我们给每个符号赋予等概率的话)。

第二步:引入随机性——马尔可夫链的视角

现在,我们暂时离开动力系统,回想一个简单的马尔可夫链。假设有一个系统,其状态空间是有限的,比如 S = {A, B, C}。这个链的状态转移由一個转移概率矩阵 P 来描述。例如,P_ij 表示从状态 i 转移到状态 j 的概率。

如果我们从一个初始概率分布 π₀ 开始,这个分布会随着时间演化。如果存在一个概率分布 π,使得 πP = π(即分布不再随时间改变),我们称 π 为一个平稳分布。在适当的条件下(如不可约和非周期性),无论从哪个初始状态开始,系统在长时间后都会趋于这个平稳分布。这是马尔可夫链的经典概率论观点。

第三步:关键结合——构造马尔可夫移位

马尔可夫移位的核心思想是:将一个马尔可夫链“实现”为一个符号动力系统。

  1. 状态空间:我们的符号集就是马尔可夫链的状态集 S。我们的序列空间 Σ 由所有双向无限的序列构成,序列中的每个元素都来自 S。

  2. 概率测度 μ:这是最关键的一步。我们不能像伯努利移位那样给所有符号赋予独立的等概率。我们需要定义一个测度 μ,使得序列中符号出现的概率规律正好符合给定的马尔可夫链。

    具体如何定义?我们需要两个东西:

    • 平稳分布 π:作为马尔可夫链的“平衡状态”。
    • 转移概率矩阵 P

    对于一个有限的序列块,比如 (x₀, x₁, ..., x_n),我们定义它对应的柱集的测度为:
    μ({序列: 第0位是x₀, 第1位是x₁, ..., 第n位是x_n}) = π(x₀) * P(x₀, x₁) * P(x₁, x₂) * ... * P(x_{n-1}, x_n)

    这个定义直观上很好理解:π(x₀) 是初始状态是 x₀ 的概率,之后每一步都乘以相应的转移概率。通过测度论的方法,我们可以将这种定义延拓到整个序列空间 Σ 上,得到一个完整的概率测度 μ。

  3. 动力系统:在这个赋予了测度 μ 的空间 (Σ, B(Σ), μ) 上,我们依然使用移位算子 σ 作为时间演化规则。

这样,四元组 (Σ, B(Σ), μ, σ) 就构成了一个保测动力系统,我们称之为马尔可夫移位。这个系统精确地编码了原马尔可夫链的统计规律。

第四步:核心特性与分类

马尔可夫移位继承了其背后马尔可夫链的性质。

  1. 遍历性:一个马尔可夫移位是遍历的,当且仅当它所对应的马尔可夫链是不可约的(即所有状态都是互通的)。不可约性保证了系统无法被分解成两个互不影响的、具有正测度的部分,这正是动力系统中遍历性的体现。
  2. 混合性:一个马尔可夫移位是混合的(一种比遍历性更强的性质),当且仅当它所对应的马尔可夫链是不可约且非周期的。非周期性保证了系统在长时间后“忘记”其初始状态,这对应于动力系统中,任意两个事件在长时间后变得近乎独立。
  3. 与伯努利移位的关系:伯努利移位可以看作是一种特殊的马尔可夫移位,其转移概率矩阵的每一行都相同(即下一状态的概率分布与当前状态无关)。换句话说,伯努利移位对应的是一个独立同分布的随机过程,它是“最随机”的马尔可夫移位。

总结

马尔可夫移位是一个强大的框架,它将概率论中研究的马尔可夫过程,完美地嵌入到了遍历理论的动力系统语言中。这使得我们可以运用遍历理论的强大工具(如各种遍历定理、熵理论)来研究马尔可夫链的长期统计行为。通过判断马尔可夫链是否不可约、是否非周期,我们可以立即得知其对应的马尔可夫移位是否遍历、是否混合。

马尔可夫移位 好的,我们开始学习“马尔可夫移位”。这是一个将遍历理论与随机过程(特别是马尔可夫链)深刻联系起来的核心概念。 第一步:重温基础——符号动力系统与移位算子 首先,想象一个由符号构成的空间。最简单的情况是,我们有两个符号,比如0和1。那么,所有双向无限的0-1序列就构成了一个空间,记为 Σ = { (..., x⁻², x⁻¹, x⁰, x¹, x², ...) | 每个 xⁱ 是 0 或 1 }。这个空间里的一个点,就是一个完整的、向过去和未来都无限延伸的序列。 在这个空间上,我们定义一个非常重要的变换,叫做 移位算子 ,通常记为 σ。它的作用很简单:把序列整体向左移动一位。具体来说,如果有一个点 x = (..., x₋₁, x₀, x₁, x₂, ...),那么经过移位变换后,得到的新点 y = σ(x),其第 n 位的符号满足 y_ n = x_ {n+1}。也就是说,原来在第1位的符号,现在到了第0位;原来在第0位的符号,现在到了第-1位,以此类推。这个 (Σ, σ) 系统本身就是一个动力系统,称为 伯努利移位 (如果我们给每个符号赋予等概率的话)。 第二步:引入随机性——马尔可夫链的视角 现在,我们暂时离开动力系统,回想一个简单的 马尔可夫链 。假设有一个系统,其状态空间是有限的,比如 S = {A, B, C}。这个链的状态转移由一個 转移概率矩阵 P 来描述。例如,P_ ij 表示从状态 i 转移到状态 j 的概率。 如果我们从一个初始概率分布 π₀ 开始,这个分布会随着时间演化。如果存在一个概率分布 π,使得 πP = π(即分布不再随时间改变),我们称 π 为一个 平稳分布 。在适当的条件下(如不可约和非周期性),无论从哪个初始状态开始,系统在长时间后都会趋于这个平稳分布。这是马尔可夫链的经典概率论观点。 第三步:关键结合——构造马尔可夫移位 马尔可夫移位的核心思想是:将一个马尔可夫链“实现”为一个符号动力系统。 状态空间 :我们的符号集就是马尔可夫链的状态集 S。我们的序列空间 Σ 由所有双向无限的序列构成,序列中的每个元素都来自 S。 概率测度 μ :这是最关键的一步。我们不能像伯努利移位那样给所有符号赋予独立的等概率。我们需要定义一个测度 μ,使得序列中符号出现的概率规律正好符合给定的马尔可夫链。 具体如何定义?我们需要两个东西: 平稳分布 π :作为马尔可夫链的“平衡状态”。 转移概率矩阵 P 。 对于一个有限的序列块,比如 (x₀, x₁, ..., x_ n),我们定义它对应的柱集的测度为: μ({序列: 第0位是x₀, 第1位是x₁, ..., 第n位是x_ n}) = π(x₀) * P(x₀, x₁) * P(x₁, x₂) * ... * P(x_ {n-1}, x_ n) 这个定义直观上很好理解:π(x₀) 是初始状态是 x₀ 的概率,之后每一步都乘以相应的转移概率。通过测度论的方法,我们可以将这种定义延拓到整个序列空间 Σ 上,得到一个完整的概率测度 μ。 动力系统 :在这个赋予了测度 μ 的空间 (Σ, B(Σ), μ) 上,我们依然使用 移位算子 σ 作为时间演化规则。 这样,四元组 (Σ, B(Σ), μ, σ) 就构成了一个 保测动力系统 ,我们称之为 马尔可夫移位 。这个系统精确地编码了原马尔可夫链的统计规律。 第四步:核心特性与分类 马尔可夫移位继承了其背后马尔可夫链的性质。 遍历性 :一个马尔可夫移位是 遍历的 ,当且仅当它所对应的马尔可夫链是 不可约的 (即所有状态都是互通的)。不可约性保证了系统无法被分解成两个互不影响的、具有正测度的部分,这正是动力系统中遍历性的体现。 混合性 :一个马尔可夫移位是 混合的 (一种比遍历性更强的性质),当且仅当它所对应的马尔可夫链是 不可约且非周期的 。非周期性保证了系统在长时间后“忘记”其初始状态,这对应于动力系统中,任意两个事件在长时间后变得近乎独立。 与伯努利移位的关系 :伯努利移位可以看作是一种特殊的马尔可夫移位,其转移概率矩阵的每一行都相同(即下一状态的概率分布与当前状态无关)。换句话说,伯努利移位对应的是一个独立同分布的随机过程,它是“最随机”的马尔可夫移位。 总结 马尔可夫移位是一个强大的框架,它将概率论中研究的马尔可夫过程,完美地嵌入到了遍历理论的动力系统语言中。这使得我们可以运用遍历理论的强大工具(如各种遍历定理、熵理论)来研究马尔可夫链的长期统计行为。通过判断马尔可夫链是否不可约、是否非周期,我们可以立即得知其对应的马尔可夫移位是否遍历、是否混合。