保测变换的熵
熵是遍历理论中度量动力系统复杂性的关键数值不变量。它描述了系统在长时间演化下信息产生或不确定性的平均速率。
第一步:理解信息源与不确定性
考虑一个有限符号集 \(\mathcal{A} = \{a_1, \dots, a_r\}\)(如字母表),系统在离散时间生成符号序列。若每个符号以概率 \(p_i\) 独立出现,其不确定性由香农熵 \(H = -\sum p_i \log p_i\) 量化。熵越高,序列的随机性越强。
第二步:动力系统的划分与轨道编码
设 \((X, \mathcal{B}, \mu, T)\) 为保测系统,\(\alpha = \{A_1, \dots, A_r\}\) 是 \(X\) 的有限可测划分(即 \(A_i\) 互不相交且覆盖 \(X\))。对每个点 \(x \in X\),其轨道 \(x, Tx, T^2x, \dots\) 通过划分 \(\alpha\) 被编码为符号序列:若 \(T^n x \in A_{i_n}\),则编码为 \(i_0 i_1 i_2 \dots\)。这样,系统动态转化为符号序列的生成过程。
第三步:划分熵与平均信息量
定义划分 \(\alpha\) 的熵为 \(H(\alpha) = -\sum_{i=1}^r \mu(A_i) \log \mu(A_i)\)。考虑动态演化,将划分 \(\alpha\) 与它的前 \(n-1\) 次迭代细化得到 \(\alpha^n = \alpha \vee T^{-1}\alpha \vee \dots \vee T^{-(n-1)}\alpha\),其元素对应长度为 \(n\) 的轨道编码块。熵 \(H(\alpha^n)\) 度量了长度为 \(n\) 的轨道段的总不确定性。
第四步:科尔莫戈罗夫-西奈熵的定义
系统关于划分 \(\alpha\) 的熵率为极限 \(h(T, \alpha) = \lim_{n \to \infty} \frac{1}{n} H(\alpha^n)\),该极限存在且等于下确界。保测变换 \(T\) 的科尔莫戈罗夫-西奈熵定义为对所有有限划分取上确界:
\[h(T) = \sup_{\alpha} h(T, \alpha). \]
熵 \(h(T)\) 是系统的内在性质,不依赖于特定划分的选择。
第五步:熵的解释与性质
- 零熵系统(如旋转)具有规则轨道,符号序列可预测。
- 正熵系统(如伯努利移位)具有高复杂性,轨道表现出随机性。
- 熵是共轭不变量:若两个系统共轭,则熵相等。
- 熵可加:对于直积系统 \(T_1 \times T_2\),有 \(h(T_1 \times T_2) = h(T_1) + h(T_2)\)。
第六步:计算示例
- 无理圆周旋转 \(T(x) = x + \theta \mod 1\):对任意有限划分 \(\alpha\),有 \(h(T, \alpha) = 0\),故 \(h(T) = 0\)。
- 伯努利移位 \(B(p_1, \dots, p_r)\):熵为 \(h(B) = -\sum p_i \log p_i\),达到有限状态系统的最大不确定性。
熵将动力系统的确定性演化与信息论连接,为分类系统提供了定量工具。