随机变量的变换的Le Cam理论
字数 1021 2025-11-15 11:14:33
随机变量的变换的Le Cam理论
Le Cam理论是统计渐近理论的重要分支,主要研究统计模型之间的近似性和统计推断的极限理论。下面将分步骤说明该理论的核心内容:
-
理论基础:统计模型的距离
- 定义两个统计模型间的距离:考虑参数空间Θ上的两个统计模型{P_θ : θ∈Θ}和{Q_θ : θ∈Θ},其间的Le Cam距离定义为:
Δ(P, Q) = inf sup_{θ∈Θ} ||P_θ - Q_θ||
其中下确界取遍所有使P_θ和Q_θ定义在同一概率空间上的耦合,||·||为总变差范数 - 关键性质:当Δ(P, Q)→0时,两个模型在统计意义上渐近不可区分
- 定义两个统计模型间的距离:考虑参数空间Θ上的两个统计模型{P_θ : θ∈Θ}和{Q_θ : θ∈Θ},其间的Le Cam距离定义为:
-
局部渐近正态性(LAN)
- 定义:设X₁,...,Xₙ来自分布P_{θ₀+u/√n},若对数似然比可展开为:
log(dP_{θ₀+u/√n}/dP_{θ₀}) = u'Δₙ - (1/2)u'I(θ₀)u + o_P(1)
其中Δₙ ⇝ N(0, I(θ₀)),则称模型在θ₀处具有LAN性质 - 意义:LAN保证了最大似然估计等统计量的渐近正态性
- 定义:设X₁,...,Xₙ来自分布P_{θ₀+u/√n},若对数似然比可展开为:
-
收敛定理与极限实验
- 主要结论:满足LAN条件的正则模型,其极限实验等价于高斯移位模型:
Y = I(θ₀)^{1/2}u + ε, ε ∼ N(0, I_k) - 应用:任何在原始模型中可定义的统计决策问题,其渐近风险下界由对应的高斯模型决定
- 主要结论:满足LAN条件的正则模型,其极限实验等价于高斯移位模型:
-
Hájek-Le Cam卷积定理
- 内容:设θ̂ₙ是θ的正则估计量,则存在随机变量W使得:
√n(θ̂ₙ - θ) ⇝ Z + W
其中Z∼N(0, I(θ)⁻¹),W与Z独立 - 推论:正则估计量的渐近方差矩阵满足Cramér-Rao下界
- 内容:设θ̂ₙ是θ的正则估计量,则存在随机变量W使得:
-
局部渐近最小极大定理
- 表述:对任意损失函数l(·),有:
lim_{c→∞} liminf_{n→∞} inf_{θ̂ₙ} sup_{|u|<c} E_{θ₀+u/√n}[l(√n(θ̂ₙ-θ₀-u/√n))]
= inf_{δ} E[l(δ(Y)-u)]
其中下确界取遍高斯移位模型中所有决策规则δ - 意义:建立了有限样本问题与极限实验风险的联系
- 表述:对任意损失函数l(·),有:
-
应用场景
- 模型选择:通过比较Le Cam距离判断模型的近似程度
- 渐近有效性:证明MLE等估计量的渐近最优性
- 假设检验:推导检验的局部渐近势函数
- 高维统计:推广至稀疏高维模型的极限理论
该理论通过将复杂统计模型近似为更简单的高斯模型,为研究统计推断的渐近性质提供了统一框架。