随机变量的顺序统计量
-
基本概念
顺序统计量是指从一组随机样本中按照数值大小重新排列后得到的统计量。假设我们有n个独立同分布的随机变量X₁, X₂, ..., Xₙ,将它们按从小到大的顺序重新排列为X₍₁₎ ≤ X₍₂₎ ≤ ... ≤ X₍ₙ₎,其中X₍ₖ₎称为第k个顺序统计量。特别地,X₍₁₎是最小值,X₍ₙ₎是最大值,X₍₍ⁿ⁺¹⁾∕₂₎(当n为奇数时)或相邻两个顺序统计量的均值(当n为偶数时)是中位数。 -
单个顺序统计量的分布
对于连续型随机变量,其概率密度函数为f(x),累积分布函数为F(x)。第k个顺序统计量X₍ₖ₎的概率密度函数为:
fₖ(x) = n! / [(k-1)! (n-k)!] · [F(x)]ᵏ⁻¹ · [1-F(x)]ⁿ⁻ᵏ · f(x)
推导思路:X₍ₖ₎落在x附近小区间内的概率,等价于样本中恰好有k-1个观测值小于x,1个观测值落在x附近,n-k个观测值大于x,通过多项分布公式计算并取极限得到。 -
极值统计量的分布
最小值的分布函数为P(X₍₁₎ ≤ x) = 1 - [1-F(x)]ⁿ,最大值的分布函数为P(X₍ₙ₎ ≤ x) = [F(x)]ⁿ。对应的概率密度函数分别为nf(x)[1-F(x)]ⁿ⁻¹和nf(x)[F(x)]ⁿ⁻¹。极值统计量在极值理论中有重要应用,例如在金融风险管理和气象学中用于分析极端事件。 -
多个顺序统计量的联合分布
任意两个顺序统计量X₍ᵢ₎和X₍ⱼ₎(1 ≤ i < j ≤ n)的联合概率密度函数为:
fᵢ,ⱼ(x,y) = n! / [(i-1)! (j-i-1)! (n-j)!] · [F(x)]ⁱ⁻¹ · [F(y)-F(x)]ʲ⁻ⁱ⁻¹ · [1-F(y)]ⁿ⁻ʲ · f(x)f(y) (x ≤ y)
推广到任意多个顺序统计量的联合分布,其形式类似于多项分布的概率质量函数乘以各点的概率密度。 -
顺序统计量的应用
顺序统计量在非参数统计、可靠性分析等领域有广泛应用。例如,样本中位数是总体中位数的稳健估计量;在生存分析中,产品寿命的顺序统计量可用于估计失效时间;在统计假设检验中,Wilcoxon符号秩检验等非参数检验方法基于顺序统计量构造。