遍历理论中的大偏差原理
大偏差原理是概率论和统计力学中的一个核心理论,在遍历理论中,它用于描述保测动力系统中可观测量的时间平均远离其空间平均(即期望值)的指数衰减速率。简单来说,它定量地描述了“罕见事件”发生的可能性。
第一步:基本思想与动机
考虑一个保测动力系统 \((X, \mathcal{B}, \mu, T)\) 和一个可积函数(可观测量) \(f: X \to \mathbb{R}\)。根据伯克霍夫平均遍历定理,对于几乎所有的起点 \(x\),时间平均 \(\frac{1}{n} \sum_{k=0}^{n-1} f(T^k x)\) 会收敛于空间平均 \(\int_X f \, d\mu\)。
但遍历定理并没有告诉我们收敛的“速度”有多快。大偏差原理关心的是:时间平均 \(S_n f(x) / n\) (其中 \(S_n f(x) = \sum_{k=0}^{n-1} f(T^k x)\))偏离其极限值 \(\bar{f} = \int f d\mu\) 一个有限量(比如 \(|S_n f / n - \bar{f}| > \delta\))的概率有多大。对于遍历系统,这种偏差是罕见事件。大偏差原理的核心结论是,这种概率以指数速度衰减,即:
\[\mu \left\{ x: \left| \frac{1}{n} S_n f(x) - \bar{f} \right| > \delta \right\} \approx e^{-n I(\delta)}, \]
其中函数 \(I(\cdot)\) 被称为速率函数。它精确地刻画了偏差的指数衰减速率。
第二步:速率函数与累积生成函数
速率函数 \(I(a)\) 并不是凭空猜测的,它可以通过系统的某种“谱”性质来定义。关键的工具是累积生成函数(或对数矩生成函数)。
对于可观测量 \(f\),我们定义其累积生成函数为:
\[\lambda_f(\theta) = \lim_{n \to \infty} \frac{1}{n} \log \int_X e^{\theta S_n f(x)} d\mu(x), \quad \theta \in \mathbb{R}. \]
这个极限在遍历系统中通常存在(例如,对于遍历的马尔可夫链或更一般的满足某种混沌性的系统)。\(\lambda_f(\theta)\) 衡量了系统“产生”大值 \(S_n f\) 的能力。
速率函数 \(I(a)\) 正是累积生成函数 \(\lambda_f(\theta)\) 的勒让德变换:
\[I(a) = \sup_{\theta \in \mathbb{R}} \left[ \theta a - \lambda_f(\theta) \right]. \]
勒让德变换是一个凸对偶操作。如果 \(\lambda_f(\theta)\) 是光滑的凸函数,那么 \(I(a)\) 也是一个非负的凸函数,并且在 \(a = \bar{f}\) 处达到最小值 \(I(\bar{f}) = 0 \。 \( I(a)\) 的值越大,表示观测到时间平均值为 \(a\) 的事件越“罕见”。
第三步:大偏差原理的精确数学表述
一个序列的随机变量 \(\{Y_n\}\) 满足大偏差原理,如果其概率分布以指数速率衰减,并且衰减速率由速率函数 \(I\) 控制。
更形式化地,对于动力系统中的时间平均 \(A_n = \frac{1}{n} S_n f\),我们说序列 \(\{A_n\}\) 满足大偏差原理,如果对于任意博雷尔集 \(\Gamma \subset \mathbb{R}\),有以下不等式成立:
- 上界: \(\limsup_{n \to \infty} \frac{1}{n} \log \mu(A_n \in \Gamma) \leq -\inf_{a \in \overline{\Gamma}} I(a)\)。
- 下界: \(\liminf_{n \to \infty} \frac{1}{n} \log \mu(A_n \in \Gamma) \geq -\inf_{a \in \Gamma^\circ} I(a)\)。
其中 \(\overline{\Gamma}\) 是 \(\Gamma\) 的闭包, \(\Gamma^\circ\) 是 \(\Gamma\) 的内部。
这个表述意味着,概率 \(\mu(A_n \in \Gamma)\) 的主要衰减行为由 \(\Gamma\) 中使速率函数 \(I(a)\) 最小的点(最可能发生的罕见事件)决定。
第四步:在遍历理论中的应用与实例
大偏差原理在遍历理论中有深远应用:
- 度量熵的另一种刻画: 对于伯努利移位等系统,科尔莫戈罗夫-西奈熵可以通过大偏差原理得到解释,它关联于轨道段分布的大偏差行为。
- 多分形分析: 用于研究动力系统中不同点处时间平均行为的“分形”谱,揭示了系统在不同尺度上的复杂性。
- 稳定性与涨落定理: 在物理系统中(如非平衡统计力学),大偏差原理用于研究熵产生等量的涨落,并导出深刻的对称性(如涨落定理)。
一个经典的实例是独立同分布随机变量。设 \(\{X_k\}\) 是i.i.d.随机变量,\(S_n = \sum_{k=1}^n X_k\)。那么累积生成函数是 \(\lambda(\theta) = \log E[e^{\theta X_1}]\),速率函数是其勒让德变换。对于遍历的、足够混沌的动力系统(如双曲系统、某些马尔可夫过程),其时间平均也满足类似的大偏差原理,这体现了确定性系统中内在的随机性。