随机变量的分位数
-
基本概念:从分位数到随机变量
分位数是一个描述概率分布位置的概念。一个非常熟悉的特例是中位数,它将一个数据集或一个概率分布分成两个相等的部分:恰好有50%的数据小于或等于中位数,50%的数据大于或等于中位数。类似地,我们可以定义四分位数(将数据分为四等份)、百分位数等。在概率论中,我们将这个概念推广到任何随机变量上。对于一个随机变量X,它的分位数提供了一个框架,让我们能够讨论X的取值落在某个特定值以下的概率。 -
分位数的精确定义
设X是一个随机变量,其累积分布函数为 F(x) = P(X ≤ x)。对于任意一个概率水平 p (0 < p < 1),我们定义X的p分位数(或称第100p百分位数)为满足以下条件的任意数q_p:
P(X ≤ q_p) ≥ p 且 P(X ≥ q_p) ≥ 1 - p
一个更常用、更简洁的等价定义是通过CDF的广义逆函数给出的:
q_p = inf { x ∈ ℝ : F(x) ≥ p }
这个定义的意思是:p分位数q_p是使得累积分布函数F(x)首次达到或超过p的最小实数x。这个定义对于离散型、连续型乃至混合型随机变量都是通用的。 -
连续型随机变量的特殊情况
当随机变量X是连续型,并且其概率密度函数f(x)在定义域内连续且恒为正时,其CDF F(x)是一个严格单调递增的连续函数。在这种情况下,p分位数q_p是唯一确定的,并且可以通过解一个简单的方程得到:
F(q_p) = p
这意味着,对于连续型随机变量,分位数函数(Quantile Function)就是累积分布函数(CDF)的反函数,即 q_p = F^{-1}(p)。例如,标准正态分布N(0,1)的0.975分位数(即97.5%分位数)约为1.96,因为Φ(1.96) ≈ 0.975。 -
离散型随机变量的分位数
对于离散型随机变量,情况稍有不同。因为其CDF F(x)是一个阶梯函数,而非连续函数。对于某些p值,可能不存在一个x使得F(x)恰好等于p。此时,根据广义逆函数的定义,p分位数q_p是满足F(x) ≥ p的最小x值。例如,考虑一个掷骰子的随机变量X,其取值为1到6,概率各为1/6。它的CDF在整数点处跳跃。对于p=0.5(中位数),我们寻找满足F(x) ≥ 0.5的最小x。F(3)=0.5,所以q_0.5=3。但对于p=0.9,F(5)=5/6≈0.833 < 0.9,而F(6)=1 ≥ 0.9,所以q_0.9=6。离散型随机变量的分位数可能不唯一,但广义逆的定义总能给出一个确定的值。 -
分位数的性质与应用
分位数具有几个重要性质和应用:- 单调性:分位数函数q(p)是关于p的单调非递减函数。
- 稳健性:与均值、方差等矩量相比,中位数等分位数对数据中的极端值(异常值)不敏感,因此被称为稳健统计量。
- 构建区间:分位数可以用来构造统计区间。例如,对于一组数据,其样本的2.5%分位数和97.5%分位数之间的区间包含了中间95%的数据,这可以作为总体分布的一个区间估计。
- 定义分布:分位数可以用来定义一些重要的概率分布,如柯西分布,其性质(如均值不存在)通过分位数来描述更为方便。
- 假设检验:在非参数统计中,分位数被用于构造如符号检验等检验方法。
- 金融风险:在金融领域,在险价值(VaR) 就是一个分位数概念,它表示在给定置信水平下,某一金融资产在未来特定时期内的最大可能损失。例如,95%置信水平下的日VaR,就是该资产日收益率分布的5%分位数。