遍历熵
遍历熵是遍历理论中用于度量动力系统复杂程度或随机性的重要概念。它由安德烈·科尔莫戈罗夫和雅科夫·西奈引入,因此常被称为科尔莫戈罗夫-西奈熵或度量熵。
1. 基本思想
想象两个动力系统:一个简单的周期运动(如完美摆锤)和一个复杂的混沌系统(如湍流)。遍历熵试图用一个数值来量化这种直观的“复杂程度”。熵值越高,表明系统的行为越不可预测,信息产生率越高。
2. 预备概念:可测分割
在理解遍历熵之前,需要先掌握“可测分割”的概念。设 (X, B, μ) 是一个概率空间。一个有限可测分割 ξ 是将空间 X 划分成有限个互不相交的可测子集 A₁, A₂, ..., A_k 的集合,这些子集的并集是完整的 X。每个子集 A_i 称为分割的一个“原子”。这可以理解为以有限的“分辨率”来观察系统。
3. 分割的熵
对于一个给定的分割 ξ = {A₁, ..., A_k},我们定义其熵 H(ξ) 为:
H(ξ) = - Σ_{i=1}^k μ(A_i) log(μ(A_i))
(约定 0 log 0 = 0)
这个熵来源于香农信息论,它度量的是当我们随机选取空间中的一个点(遵循分布 μ)时,我们对于“这个点落在哪个分割原子中”的不确定性。如果所有原子概率均等,不确定性最大,熵最高;如果某个原子概率为1,其余为0,则不确定性为零,熵为0。
4. 分割的细化与共同分割
设 ξ 和 η 是两个有限分割。它们的“共同分割” ξ ∨ η 是由所有形如 A ∩ B(其中 A ∈ ξ, B ∈ η)的非空交集构成的分割。这相当于同时使用两个分割的“分辨率”来观察系统,得到了一个更精细的划分。
5. 保测变换下的分割演化
现在引入动力系统。设 T: X → X 是一个保测变换。对于一个分割 ξ,我们可以考虑它在 T 作用下的原像 T⁻¹ξ = {T⁻¹A: A ∈ ξ}。这代表了经过一步演化后,点相对于原始分割 ξ 的位置。类似地,我们可以考虑从时间 0 到时间 n-1 的演化所给出的共同分割:
ξ ∨ T⁻¹ξ ∨ T⁻²ξ ∨ ... ∨ T⁻(n-1)ξ
这个共同分割的每个原子,精确地描述了在最初 n 步迭代中,系统轨道的“宏观状态”序列(即它在每一步属于 ξ 中的哪个原子)。
6. 遍历熵的定义
遍历熵被定义为系统在长时间演化下,信息产生率的平均极限。具体地,对于保测系统 (X, B, μ, T) 和一个有限分割 ξ,我们定义系统 T 关于分割 ξ 的熵为:
h(T, ξ) = lim_{n→∞} (1/n) H( ξ ∨ T⁻¹ξ ∨ ... ∨ T⁻(n-1)ξ )
这个极限的存在性由次可加性序列的性质保证。h(T, ξ) 可以解释为在已知系统长期平均行为的情况下,每单位时间由分割 ξ 所揭示的“新信息”量。
7. 科尔莫戈罗夫-西奈熵
最后,系统的遍历熵(或称度量熵)被定义为对所有可能有限分割 ξ 取上确界:
h(T) = sup{ h(T, ξ) : ξ 是有限可测分割 }
这个值 h(T) 是系统本身的不变量,即在保测同构意义下保持不变。它是对整个系统复杂性的终极度量。一个系统是遍历的,当且仅当对于生成分割(其轨道能区分几乎所有点),有 h(T) = h(T, ξ)。