随机变量的变换的Bahadur表示
字数 2305 2025-12-06 21:50:41

随机变量的变换的Bahadur表示

我将循序渐进地讲解Bahadur表示的相关知识,从直观概念到精确的数学表述和意义。

第一步:Bahadur表示要解决的核心问题
在统计推断中,我们经常关注样本分位数(如中位数)这样的统计量。样本分位数是通过排序数据得到的,其表达式是非光滑的,这使得直接研究它的理论性质(如渐近分布)比较困难。Bahadur表示的核心思想,就是用光滑的、易于处理的表达式来逼近这个非光滑的统计量,从而简化其渐近理论的分析。具体来说,它用经验分布函数及其总体分布函数来表示样本分位数。

第二步:建立必要的预备知识
为了准确理解Bahadur表示,我们需要明确几个关键概念:

  1. 总体p分位数ξ_p: 对于一个连续分布函数F(x),其总体p分位数ξ_p满足 F(ξ_p) = p,其中0<p<1。例如,中位数对应p=0.5。
  2. 经验分布函数F_n(x): 给定独立同分布的样本X1, X2, ..., Xn,经验分布函数定义为 F_n(x) = (1/n) * Σ_{i=1}^n I(X_i ≤ x),其中I(·)是指示函数。它计算了样本中小于等于x的比例,是F(x)的一个自然估计。
  3. 样本p分位数ξ̂_n: 通常定义为 ξ̂_n = F_n^{-1}(p) = inf{x: F_n(x) ≥ p}。它是对总体分位数ξ_p的估计。

第三步:Bahadur表示的直观想法与初步近似
样本分位数ξ̂_n可以看作方程 F_n(x) = p 的解。而总体分位数ξ_p是方程 F(x) = p 的解。一个最初步的线性近似(也称为“一阶近似”或“Bahadur表示的主要项”)可以通过在ξ_p处对F_n进行展开得到:
考虑 F_n(ξ̂_n) ≈ F(ξ_p) + f(ξ_p)(ξ̂_n - ξ_p),其中f是F的概率密度函数。同时,我们知道 F_n(ξ̂_n) ≈ p(由定义)。而F(ξ_p) = p。
将F_n(ξ̂_n) ≈ p 和 F(ξ_p) = p 代入上述近似式,得到:
p ≈ p + f(ξ_p)(ξ̂_n - ξ_p)
从而得到一阶近似: ξ̂_n - ξ_p ≈ [p - F_n(ξ_p)] / f(ξ_p)
这个近似已经很有用,它将分位数的偏差表示成了经验分布函数在固定点ξ_p处的偏差的线性函数。

第四步:精确的Bahadur表示及其表达式
R. R. Bahadur在1966年的经典论文中给出了更精确的表示。完整的Bahadur表示是一个几乎必然成立的等式:
ξ̂_n = ξ_p + [p - F_n(ξ_p)] / f(ξ_p) + R_n
其中,余项R_n具有非常高的精度。Bahadur证明了,在总体分布函数F足够光滑(例如,在ξ_p处密度f(ξ_p)>0且连续)的条件下,余项R_n满足:
R_n = o(n^{-3/4} (log n)^{1/2}) 几乎必然成立。
有时,这个结果也写作 R_n = O(n^{-3/4} (log n)^{1/2}) 几乎必然。这意味着余项以极快的速度收敛到0,比中心极限定理中的典型阶数n^{-1/2}还要快。

第五步:Bahadur表示的意义与重要性

  1. 渐近理论: 这是Bahadur表示最主要的作用。由表示式 ξ̂_n - ξ_p ≈ [p - F_n(ξ_p)] / f(ξ_p),我们可以直接推导出样本分位数的渐近正态性。因为F_n(ξ_p)是n个独立伯努利随机变量I(X_i ≤ ξ_p)的平均值,其期望为p,方差为p(1-p)。由中心极限定理,√n [F_n(ξ_p) - p] 依分布收敛于 N(0, p(1-p))。因此,应用Slutsky定理和连续映射定理,可得:
    √n (ξ̂_n - ξ_p) →_d N( 0, p(1-p) / [f(ξ_p)]^2 )
  2. 高效计算与近似: 这个表示将非光滑的样本分位数与线性的经验过程F_n(ξ_p)联系起来,在统计模拟和计算中,有时可以利用此关系进行近似计算或方差估计。
  3. 强逼近: Bahadur表示的强大之处在于其给出了一个几乎必然成立的等式,并且余项阶数精确。这比仅仅证明依分布收敛要强得多,它允许我们在几乎每条样本路径上控制近似误差,这对于研究统计量的精确渐近行为(如重对数律)至关重要。
  4. 统计推断基础: 基于此表示和由此导出的渐近方差,我们可以构造分位数的置信区间,并进行假设检验。

第六步:推广与相关概念
Bahadur表示的思想可以推广到更一般的统计量上:

  • 光滑函数模型: 对于依赖于经验分布函数的“光滑”统计量(如L-统计量),有类似的线性表示(即影响函数表示)。
  • 回归分位数: Roger Koenker和Gilbert Bassett将分位数的概念推广到线性回归模型中,称为分位数回归。相应地,也存在回归分位数系数的Bahadur表示,用于研究其渐近性质。
  • 样本分位数过程的表示: 如果将p视为在(0,1)上变化的参数,那么{√n(ξ̂_n(p) - ξ_p)}作为一个随机过程(分位数过程),其极限分布可以用布朗桥来描述。Bahadur表示为建立这种过程的弱收敛性提供了关键工具。

综上所述,Bahadur表示是连接非光滑的样本分位数统计量与线性的经验分布函数的一个精妙桥梁,它以极高的精度揭示了样本分位数的深层结构,是分位数渐近理论中的一个基石性结果。

随机变量的变换的Bahadur表示 我将循序渐进地讲解Bahadur表示的相关知识,从直观概念到精确的数学表述和意义。 第一步:Bahadur表示要解决的核心问题 在统计推断中,我们经常关注样本分位数(如中位数)这样的统计量。样本分位数是通过排序数据得到的,其表达式是非光滑的,这使得直接研究它的理论性质(如渐近分布)比较困难。Bahadur表示的核心思想,就是用光滑的、易于处理的表达式来逼近这个非光滑的统计量,从而简化其渐近理论的分析。具体来说,它用经验分布函数及其总体分布函数来表示样本分位数。 第二步:建立必要的预备知识 为了准确理解Bahadur表示,我们需要明确几个关键概念: 总体p分位数ξ_ p : 对于一个连续分布函数F(x),其总体p分位数ξ_ p满足 F(ξ_ p) = p,其中0<p <1。例如,中位数对应p=0.5。 经验分布函数F_ n(x) : 给定独立同分布的样本X1, X2, ..., Xn,经验分布函数定义为 F_ n(x) = (1/n) * Σ_ {i=1}^n I(X_ i ≤ x),其中I(·)是指示函数。它计算了样本中小于等于x的比例,是F(x)的一个自然估计。 样本p分位数ξ̂_ n : 通常定义为 ξ̂_ n = F_ n^{-1}(p) = inf{x: F_ n(x) ≥ p}。它是对总体分位数ξ_ p的估计。 第三步:Bahadur表示的直观想法与初步近似 样本分位数ξ̂_ n可以看作方程 F_ n(x) = p 的解。而总体分位数ξ_ p是方程 F(x) = p 的解。一个最初步的线性近似(也称为“一阶近似”或“Bahadur表示的主要项”)可以通过在ξ_ p处对F_ n进行展开得到: 考虑 F_ n(ξ̂_ n) ≈ F(ξ_ p) + f(ξ_ p)(ξ̂_ n - ξ_ p),其中f是F的概率密度函数。同时,我们知道 F_ n(ξ̂_ n) ≈ p(由定义)。而F(ξ_ p) = p。 将F_ n(ξ̂_ n) ≈ p 和 F(ξ_ p) = p 代入上述近似式,得到: p ≈ p + f(ξ_ p)(ξ̂_ n - ξ_ p) 从而得到一阶近似: ξ̂_ n - ξ_ p ≈ [ p - F_ n(ξ_ p)] / f(ξ_ p) 这个近似已经很有用,它将分位数的偏差表示成了经验分布函数在固定点ξ_ p处的偏差的线性函数。 第四步:精确的Bahadur表示及其表达式 R. R. Bahadur在1966年的经典论文中给出了更精确的表示。完整的Bahadur表示是一个几乎必然成立的等式: ξ̂_ n = ξ_ p + [ p - F_ n(ξ_ p)] / f(ξ_ p) + R_ n 其中,余项R_ n具有非常高的精度。Bahadur证明了,在总体分布函数F足够光滑(例如,在ξ_ p处密度f(ξ_ p)>0且连续)的条件下,余项R_ n满足: R_ n = o(n^{-3/4} (log n)^{1/2}) 几乎必然成立。 有时,这个结果也写作 R_ n = O(n^{-3/4} (log n)^{1/2}) 几乎必然。这意味着余项以极快的速度收敛到0,比中心极限定理中的典型阶数n^{-1/2}还要快。 第五步:Bahadur表示的意义与重要性 渐近理论 : 这是Bahadur表示最主要的作用。由表示式 ξ̂_ n - ξ_ p ≈ [ p - F_ n(ξ_ p)] / f(ξ_ p),我们可以直接推导出样本分位数的渐近正态性。因为F_ n(ξ_ p)是n个独立伯努利随机变量I(X_ i ≤ ξ_ p)的平均值,其期望为p,方差为p(1-p)。由中心极限定理,√n [ F_ n(ξ_ p) - p ] 依分布收敛于 N(0, p(1-p))。因此,应用Slutsky定理和连续映射定理,可得: √n (ξ̂_ n - ξ_ p) →_ d N( 0, p(1-p) / [ f(ξ_ p) ]^2 ) 高效计算与近似 : 这个表示将非光滑的样本分位数与线性的经验过程F_ n(ξ_ p)联系起来,在统计模拟和计算中,有时可以利用此关系进行近似计算或方差估计。 强逼近 : Bahadur表示的强大之处在于其给出了一个几乎必然成立的等式,并且余项阶数精确。这比仅仅证明依分布收敛要强得多,它允许我们在几乎每条样本路径上控制近似误差,这对于研究统计量的精确渐近行为(如重对数律)至关重要。 统计推断基础 : 基于此表示和由此导出的渐近方差,我们可以构造分位数的置信区间,并进行假设检验。 第六步:推广与相关概念 Bahadur表示的思想可以推广到更一般的统计量上: 光滑函数模型 : 对于依赖于经验分布函数的“光滑”统计量(如L-统计量),有类似的线性表示(即影响函数表示)。 回归分位数 : Roger Koenker和Gilbert Bassett将分位数的概念推广到线性回归模型中,称为分位数回归。相应地,也存在回归分位数系数的Bahadur表示,用于研究其渐近性质。 样本分位数过程的表示 : 如果将p视为在(0,1)上变化的参数,那么{√n(ξ̂_ n(p) - ξ_ p)}作为一个随机过程(分位数过程),其极限分布可以用布朗桥来描述。Bahadur表示为建立这种过程的弱收敛性提供了关键工具。 综上所述, Bahadur表示 是连接非光滑的样本分位数统计量与线性的经验分布函数的一个精妙桥梁,它以极高的精度揭示了样本分位数的深层结构,是分位数渐近理论中的一个基石性结果。