随机变量的变换的分布函数方法
1. 基本概念与动机
在概率论中,我们经常需要求解一个随机变量经过某种函数变换后,得到的新随机变量的概率分布。例如,已知电阻R的分布,求其电导Y=1/R的分布;已知圆的半径X的分布,求其面积Y=πX²的分布。解决这类问题的一种基础且直观的方法就是“分布函数方法”。其核心思想是:通过定义新随机变量的累积分布函数,并将其与原随机变量的分布联系起来。
2. 方法的核心步骤
该方法适用于求解一维随机变量变换的分布,其逻辑链条清晰严谨,可分为以下四步:
-
第一步:定义新随机变量及其分布函数
设X是一个随机变量,其累积分布函数为F_X(x)。令Y = g(X)是X的一个函数变换(g是一个已知的、可测的函数)。我们的目标是求出Y的累积分布函数,记为F_Y(y)。根据累积分布函数的定义,有:
F_Y(y) = P(Y ≤ y) = P(g(X) ≤ y) -
第二步:将事件转化为关于原随机变量X的事件
这是最关键的一步。概率P(g(X) ≤ y)表示的是,所有使得函数g(X)的值小于等于y的X的取值所构成的集合的概率。因此,我们需要在X的取值空间(样本空间)上,找出满足不等式g(x) ≤ y的所有x的集合,记这个集合为A_y。即:
A_y = { x | g(x) ≤ y }
于是,F_Y(y) = P(X ∈ A_y) -
第三步:利用原随机变量X的分布计算概率
一旦确定了集合A_y,我们就可以利用已知的随机变量X的分布来计算概率P(X ∈ A_y)。- 如果X是连续型随机变量,其概率密度函数为f_X(x),那么该概率可以通过对集合A_y进行积分求得:
F_Y(y) = ∫_{A_y} f_X(x) dx - 如果X是离散型随机变量,其概率质量函数为P_X(x),那么该概率就是集合A_y中所有点对应的概率之和:
F_Y(y) = Σ_{x_i ∈ A_y} P_X(x_i)
- 如果X是连续型随机变量,其概率密度函数为f_X(x),那么该概率可以通过对集合A_y进行积分求得:
-
第四步:最终确定新随机变量的分布
通过以上步骤,我们得到了Y的累积分布函数F_Y(y)。如果还需要Y的概率密度函数(当Y是连续型时)或概率质量函数(当Y是离散型时),可以对F_Y(y)进行求导或直接观察得到。
3. 关键难点与处理:确定集合A_y
第二步中确定集合A_y = { x | g(x) ≤ y }是整个方法的难点。这个集合的形状完全取决于变换函数g(x)的性质(如单调性)。我们来看两种最常见且最重要的情形:
-
情形一:g(x)是严格单调递增函数
如果g是严格单调递增的,那么不等式g(x) ≤ y等价于x ≤ g⁻¹(y)。这里g⁻¹是g的反函数。
因此,A_y = { x | x ≤ g⁻¹(y) } = (-∞, g⁻¹(y)]。
那么,Y的分布函数为:
F_Y(y) = P(X ≤ g⁻¹(y)) = F_X(g⁻¹(y)) -
情形二:g(x)是严格单调递减函数
如果g是严格单调递减的,那么不等式g(x) ≤ y等价于x ≥ g⁻¹(y)。
因此,A_y = { x | x ≥ g⁻¹(y) } = [g⁻¹(y), +∞)。
那么,Y的分布函数为:
F_Y(y) = P(X ≥ g⁻¹(y)) = 1 - P(X < g⁻¹(y)) = 1 - F_X(g⁻¹(y)) (注意,对于连续型随机变量,P(X = g⁻¹(y)) = 0,所以P(X ≥ g⁻¹(y)) = 1 - F_X(g⁻¹(y)))
4. 实例演示:线性变换
假设随机变量X服从标准正态分布,即X ~ N(0, 1),其概率密度函数为φ(x),分布函数为Φ(x)。令Y = aX + b,其中a > 0(保证单调递增)。
- 应用分布函数方法:
F_Y(y) = P(Y ≤ y) = P(aX + b ≤ y) = P(X ≤ (y - b)/a) - 由于a>0,变换是单调递增的,集合A_y = { x | x ≤ (y-b)/a }。
- 所以,F_Y(y) = P(X ≤ (y - b)/a) = Φ((y - b)/a)
- 为了得到Y的概率密度函数f_Y(y),我们对F_Y(y)关于y求导:
f_Y(y) = d/dy [Φ((y - b)/a)] = φ((y - b)/a) * (1/a) = (1/(a√(2π))) * exp( -((y - b)/a)² / 2 )
这正是正态分布N(b, a²)的概率密度函数。这个例子验证了正态随机变量的线性变换仍服从正态分布。
5. 方法的适用范围与局限性
- 优点:分布函数法原理直观,适用范围广,对变换函数g(x)的要求较低(只需可测),不仅适用于单调变换,也适用于非单调变换(此时需要将集合A_y可能分解成几个不相交区间的并集再分别计算概率)。
- 局限性:对于非单调变换,确定集合A_y可能会变得复杂,计算积分也可能繁琐。在实际应用中,如果变换函数g(x)满足更严格的条件(如处处可导且导数不为零),我们通常会采用更高效的“变量变换公式(雅可比行列式法)”。分布函数法是理解所有变换方法的基础。