可测空间上的马尔可夫核
字数 3302 2025-12-18 16:26:36

可测空间上的马尔可夫核

我们现在开始讲解“可测空间上的马尔可夫核”。这是一个在测度论、概率论及随机过程分析中非常重要的概念,它提供了一种描述从一个状态随机转移到另一个状态的方式。

第一步:从基本定义出发——什么是马尔可夫核?

想象一下,你有一个系统,它在不同状态之间随机跳转。为了数学化描述这种“跳转规律”,我们需要两个关键要素:

  1. 状态空间 (X, 𝒳):一个可测空间,其中 X 是所有可能状态的集合,𝒳 是 X 上的 σ-代数(可测集族),用于界定哪些状态子集是可以被概率描述的。
  2. 转移机制:对于当前所处的状态 x ∈ X,我们需要一种方式来说明下一个状态会落在任意一个可测集 A ∈ 𝒳 中的可能性有多大。

一个 马尔可夫核(或随机核、转移核),正是精确定义这个转移机制的数学对象。

形式化定义
设 (X, 𝒳) 和 (Y, 𝒴) 是两个可测空间。一个从 (X, 𝒳) 到 (Y, 𝒴) 的马尔可夫核 K 是一个映射:
K: X × 𝒴 → [0, 1]
它满足以下两个条件:

  1. 对每个固定 x ∈ X,集合函数 K(x, ·):𝒴 → [0, 1] 是 (Y, 𝒴) 上的一个概率测度。这意味着 K(x, ∅)=0,K(x, Y)=1,并且对 𝒴 中任意一列互不相交的集合 {A_n},有 K(x, ∪_n A_n) = Σ_n K(x, A_n)。
  2. 对每个固定 A ∈ 𝒴,函数 x ↦ K(x, A) 是一个 (X, 𝒳)-可测函数。这意味着,对于任何概率测度 P 定义在 (X, 𝒳) 上,我们可以谈论随机变量 K(·, A) 的期望。

简单来说,K(x, A) 表示“当系统当前处于状态 x 时,下一步转移到集合 A 中的概率”。第一个条件确保了它是一个合格的概率分配,第二个条件确保了当我们把当前状态 x 本身视为随机时,转移概率 K(·, A) 是一个有良好定义的随机变量。

特殊情形:当 (X, 𝒳) = (Y, 𝒴) 时,我们称之为从 X 到自身的马尔可夫核,它描述了一个马尔可夫链的一步转移规律。

第二步:与相关概念的联系与区别

为了深入理解,让我们区分几个容易混淆的概念:

  • 与测度的区别:一个测度是定义在 σ-代数上的集函数。马尔可夫核是一个双参数对象:第一个参数是点 x,第二个参数是集合 A。对于固定的 x,它才是一个测度。
  • 与条件概率的关系:如果 (Ω, ℱ, P) 是一个概率空间,ξ: Ω→X 和 η: Ω→Y 是两个随机元,那么条件分布 P(η ∈ · | ξ = x) 在满足正则性条件时,恰好构成了一个从 X 到 Y 的马尔可夫核。因此,马尔可夫核是条件分布的推广和抽象。
  • 与函数的关系:如果核 K 满足对每个 A ∈ 𝒴,存在一个可测函数 f_A: X → [0, 1] 使得 K(x, A) = f_A(x) 对所有 x 成立,那么核 K 就是由一个函数族决定的。但更重要的是,它将对每个 x 的测度结构和对每个 A 的可测性结构结合了起来。

第三步:马尔可夫核的基本运算——复合与作用

马尔可夫核之所以强大,是因为我们可以像操作函数或矩阵一样对它们进行运算。

  1. 核作用于测度
    假设 μ 是 (X, 𝒳) 上的一个概率测度(可以看作初始状态分布),K 是从 X 到 Y 的马尔可夫核。我们可以定义一个新的测度 μK,它是 (Y, 𝒴) 上的概率测度,定义为:
    (μK)(B) = ∫_X K(x, B) μ(dx),对于任意 B ∈ 𝒴。
    这可以理解为:先按分布 μ 随机选取一个初始状态 x,然后根据核 K(x, ·) 随机跳转,最终落在 B 中的总概率。

  2. 核作用于可测函数
    设 f: Y → ℝ 是一个有界 𝒴-可测函数,K 是从 X 到 Y 的马尔可夫核。我们可以定义一个新的函数 Kf: X → ℝ,它为:
    (Kf)(x) = ∫_Y f(y) K(x, dy),对于任意 x ∈ X。
    这个新函数 (Kf) 是 (X, 𝒳)-可测的。它表示从状态 x 出发,跳转一次后,函数 f 的期望值。

  3. 核的复合
    设 K₁ 是从 X 到 Y 的核,K₂ 是从 Y 到 Z 的核。我们可以定义它们的复合核 K₁∘K₂(通常记为 K₁K₂),它是一个从 X 到 Z 的核,定义为:
    (K₁K₂)(x, C) = ∫_Y K₂(y, C) K₁(x, dy),对于任意 x ∈ X, C ∈ 𝒵。
    这个定义与矩阵乘法非常相似:要得到从 x 两步后到达 C 的概率,我们先将 x 转移到某个中间状态 y(概率由 K₁ 给出),再从 y 转移到 C(概率由 K₂ 给出),并对所有可能的中间状态 y 求和(积分)。复合核的存在性和性质(可测性、概率性)由富比尼定理和可测性的标准论证保证。

第四步:理论深化——从算子视角看马尔可夫核

通过上面的运算,我们可以看到马尔可夫核在两个重要的空间之间诱导了线性算子:

  • 在测度空间上:核 K 将一个概率测度 μ 映射为另一个概率测度 μK。这个映射是线性的(在测度的线性组合意义下)且是正的。
  • 在函数空间上:核 K 将一个有界可测函数 f 映射为另一个有界可测函数 Kf。这个映射也是线性的、正的,并且是一个压缩映射(如果 f 是有界的)。事实上,它把常值函数 1 映射为常值函数 1。

这些算子视角在分析马尔可夫链的长期行为(如不变测度、遍历性)时至关重要。不变测度 μ 就是满足方程 μK = μ 的测度,这意味着以 μ 为初始分布,经过一步转移后,状态分布仍然是 μ。

第五步:与已学知识的衔接

我们来看马尔可夫核如何依赖于并拓展你已经掌握的实变函数知识:

  • 可测性(核心):定义中要求 x ↦ K(x, A) 对每个 A 可测,这直接应用了“可测函数”的概念。验证一个具体的核是否满足条件,本质上就是验证一个族的可测性。
  • 积分理论(基石):核的运算定义(作用于测度、函数、核的复合)全部依赖于勒贝格积分。例如,(μK)(B) 的定义 ∫_X K(x, B) μ(dx) 中,被积函数关于 x 的可测性由核的定义保证,积分本身是勒贝格积分。
  • 富比尼定理(关键工具):在证明复合核 (K₁K₂)(x, C) 确实对每个 x 是一个测度(即满足可列可加性),以及证明作用于函数后的结果 (Kf)(x) 仍然是可测函数时,富比尼定理是证明的核心工具,它允许我们交换积分次序。
  • 函数空间:考虑核在 L^p 空间(特别地,L^∞ 和 L^1)上诱导的算子,是研究马尔可夫过程的重要框架。

第六步:一个经典例子——离散状态马尔可夫链

为了具象化,考虑最简单也是最经典的例子:
设 X = Y = ℕ(自然数集),𝒳 = 𝒴 为 ℕ 的幂集(所有子集都可测)。一个从 ℕ 到 ℕ 的马尔可夫核完全由一个无穷矩阵 (p_{ij}){i,j∈ℕ} 决定,其中 p{ij} = K(i, {j}) 表示从状态 i 转移到状态 j 的概率。这里:

  1. 对每个固定的 i, {p_{ij}}{j∈ℕ} 是一个概率分布(即 p{ij} ≥ 0,且 Σ_j p_{ij} = 1)。这对应于 K(i, ·) 是一个概率测度。
  2. 对每个固定的 j,函数 i ↦ p_{ij} 是一个 ℕ 上的任意函数(在离散可测结构下总是可测的)。

核作用于测度 μ(一个概率分布列 {μ_i})的结果是: (μK)j = Σ_i μ_i p{ij}。
核作用于函数 f(一个序列 {f_j})的结果是: (Kf)i = Σ_j p{ij} f_j。
核的复合就是矩阵乘法: (K₁K₂){ik} = Σ_j (p₁){ij} (p₂)_{jk}。

这个例子清晰地展示了马尔可夫核是如何推广了有限状态马尔可夫链的转移矩阵概念,以适应一般可测状态空间(如实数轴、函数空间、流形等)的。

可测空间上的马尔可夫核 我们现在开始讲解“可测空间上的马尔可夫核”。这是一个在测度论、概率论及随机过程分析中非常重要的概念,它提供了一种描述从一个状态随机转移到另一个状态的方式。 第一步:从基本定义出发——什么是马尔可夫核? 想象一下,你有一个系统,它在不同状态之间随机跳转。为了数学化描述这种“跳转规律”,我们需要两个关键要素: 状态空间 (X, 𝒳) :一个可测空间,其中 X 是所有可能状态的集合,𝒳 是 X 上的 σ-代数(可测集族),用于界定哪些状态子集是可以被概率描述的。 转移机制 :对于当前所处的状态 x ∈ X,我们需要一种方式来说明下一个状态会落在任意一个可测集 A ∈ 𝒳 中的可能性有多大。 一个 马尔可夫核(或随机核、转移核) ,正是精确定义这个转移机制的数学对象。 形式化定义 : 设 (X, 𝒳) 和 (Y, 𝒴) 是两个可测空间。一个从 (X, 𝒳) 到 (Y, 𝒴) 的马尔可夫核 K 是一个映射: K: X × 𝒴 → [ 0, 1 ] 它满足以下两个条件: 对每个固定 x ∈ X ,集合函数 K(x, ·):𝒴 → [ 0, 1] 是 (Y, 𝒴) 上的一个 概率测度 。这意味着 K(x, ∅)=0,K(x, Y)=1,并且对 𝒴 中任意一列互不相交的集合 {A_ n},有 K(x, ∪_ n A_ n) = Σ_ n K(x, A_ n)。 对每个固定 A ∈ 𝒴 ,函数 x ↦ K(x, A) 是一个 (X, 𝒳)-可测函数 。这意味着,对于任何概率测度 P 定义在 (X, 𝒳) 上,我们可以谈论随机变量 K(·, A) 的期望。 简单来说,K(x, A) 表示“当系统当前处于状态 x 时,下一步转移到集合 A 中的概率”。第一个条件确保了它是一个合格的概率分配,第二个条件确保了当我们把当前状态 x 本身视为随机时,转移概率 K(·, A) 是一个有良好定义的随机变量。 特殊情形 :当 (X, 𝒳) = (Y, 𝒴) 时,我们称之为 从 X 到自身的马尔可夫核 ,它描述了一个马尔可夫链的一步转移规律。 第二步:与相关概念的联系与区别 为了深入理解,让我们区分几个容易混淆的概念: 与测度的区别 :一个测度是定义在 σ-代数上的集函数。马尔可夫核是一个 双参数 对象:第一个参数是点 x,第二个参数是集合 A。对于固定的 x,它才是一个测度。 与条件概率的关系 :如果 (Ω, ℱ, P) 是一个概率空间,ξ: Ω→X 和 η: Ω→Y 是两个随机元,那么条件分布 P(η ∈ · | ξ = x) 在满足正则性条件时,恰好构成了一个从 X 到 Y 的马尔可夫核。因此,马尔可夫核是条件分布的推广和抽象。 与函数的关系 :如果核 K 满足对每个 A ∈ 𝒴,存在一个可测函数 f_ A: X → [ 0, 1] 使得 K(x, A) = f_ A(x) 对所有 x 成立,那么核 K 就是由一个函数族决定的。但更重要的是,它将对每个 x 的测度结构和对每个 A 的可测性结构结合了起来。 第三步:马尔可夫核的基本运算——复合与作用 马尔可夫核之所以强大,是因为我们可以像操作函数或矩阵一样对它们进行运算。 核作用于测度 : 假设 μ 是 (X, 𝒳) 上的一个概率测度(可以看作初始状态分布),K 是从 X 到 Y 的马尔可夫核。我们可以定义一个新的测度 μK,它是 (Y, 𝒴) 上的概率测度,定义为: (μK)(B) = ∫_ X K(x, B) μ(dx),对于任意 B ∈ 𝒴。 这可以理解为:先按分布 μ 随机选取一个初始状态 x,然后根据核 K(x, ·) 随机跳转,最终落在 B 中的总概率。 核作用于可测函数 : 设 f: Y → ℝ 是一个有界 𝒴-可测函数,K 是从 X 到 Y 的马尔可夫核。我们可以定义一个新的函数 Kf: X → ℝ,它为: (Kf)(x) = ∫_ Y f(y) K(x, dy),对于任意 x ∈ X。 这个新函数 (Kf) 是 (X, 𝒳)-可测的。它表示从状态 x 出发,跳转一次后,函数 f 的期望值。 核的复合 : 设 K₁ 是从 X 到 Y 的核,K₂ 是从 Y 到 Z 的核。我们可以定义它们的 复合核 K₁∘K₂ (通常记为 K₁K₂),它是一个从 X 到 Z 的核,定义为: (K₁K₂)(x, C) = ∫_ Y K₂(y, C) K₁(x, dy),对于任意 x ∈ X, C ∈ 𝒵。 这个定义与矩阵乘法非常相似:要得到从 x 两步后到达 C 的概率,我们先将 x 转移到某个中间状态 y(概率由 K₁ 给出),再从 y 转移到 C(概率由 K₂ 给出),并对所有可能的中间状态 y 求和(积分)。复合核的存在性和性质(可测性、概率性)由富比尼定理和可测性的标准论证保证。 第四步:理论深化——从算子视角看马尔可夫核 通过上面的运算,我们可以看到马尔可夫核在两个重要的空间之间诱导了线性算子: 在测度空间上 :核 K 将一个概率测度 μ 映射为另一个概率测度 μK。这个映射是线性的(在测度的线性组合意义下)且是正的。 在函数空间上 :核 K 将一个有界可测函数 f 映射为另一个有界可测函数 Kf。这个映射也是线性的、正的,并且是一个 压缩映射 (如果 f 是有界的)。事实上,它把常值函数 1 映射为常值函数 1。 这些算子视角在分析马尔可夫链的长期行为(如不变测度、遍历性)时至关重要。不变测度 μ 就是满足方程 μK = μ 的测度,这意味着以 μ 为初始分布,经过一步转移后,状态分布仍然是 μ。 第五步:与已学知识的衔接 我们来看马尔可夫核如何依赖于并拓展你已经掌握的实变函数知识: 可测性(核心) :定义中要求 x ↦ K(x, A) 对每个 A 可测,这直接应用了“可测函数”的概念。验证一个具体的核是否满足条件,本质上就是验证一个族的可测性。 积分理论(基石) :核的运算定义(作用于测度、函数、核的复合)全部依赖于勒贝格积分。例如,(μK)(B) 的定义 ∫_ X K(x, B) μ(dx) 中,被积函数关于 x 的可测性由核的定义保证,积分本身是勒贝格积分。 富比尼定理(关键工具) :在证明复合核 (K₁K₂)(x, C) 确实对每个 x 是一个测度(即满足可列可加性),以及证明作用于函数后的结果 (Kf)(x) 仍然是可测函数时,富比尼定理是证明的核心工具,它允许我们交换积分次序。 函数空间 :考虑核在 L^p 空间(特别地,L^∞ 和 L^1)上诱导的算子,是研究马尔可夫过程的重要框架。 第六步:一个经典例子——离散状态马尔可夫链 为了具象化,考虑最简单也是最经典的例子: 设 X = Y = ℕ(自然数集),𝒳 = 𝒴 为 ℕ 的幂集(所有子集都可测)。一个从 ℕ 到 ℕ 的马尔可夫核完全由一个无穷矩阵 (p_ {ij}) {i,j∈ℕ} 决定,其中 p {ij} = K(i, {j}) 表示从状态 i 转移到状态 j 的概率。这里: 对每个固定的 i, {p_ {ij}} {j∈ℕ} 是一个概率分布(即 p {ij} ≥ 0,且 Σ_ j p_ {ij} = 1)。这对应于 K(i, ·) 是一个概率测度。 对每个固定的 j,函数 i ↦ p_ {ij} 是一个 ℕ 上的任意函数(在离散可测结构下总是可测的)。 核作用于测度 μ(一个概率分布列 {μ_ i})的结果是: (μK) j = Σ_ i μ_ i p {ij}。 核作用于函数 f(一个序列 {f_ j})的结果是: (Kf) i = Σ_ j p {ij} f_ j。 核的复合就是矩阵乘法: (K₁K₂) {ik} = Σ_ j (p₁) {ij} (p₂)_ {jk}。 这个例子清晰地展示了马尔可夫核是如何推广了有限状态马尔可夫链的转移矩阵概念,以适应一般可测状态空间(如实数轴、函数空间、流形等)的。