随机变量的变换的概率母函数方法
概率母函数是处理离散随机变量分布的有力工具,尤其适用于随机变量的变换。我们将逐步探讨如何利用概率母函数来求解变换后随机变量的分布。
第一步:回顾概率母函数的定义与核心性质
- 定义:对于一个取非负整数值的随机变量 \(X\),其概率母函数(PGF)定义为:
\[ G_X(s) = E[s^X] = \sum_{k=0}^{\infty} P(X=k) s^k \]
其中,\(s\) 是一个使得该级数收敛的实数(通常在 \(|s| \leq 1\) 时收敛)。
- 核心性质:
- 分布恢复:概率母函数唯一地决定了随机变量的分布。具体地,概率质量函数可以通过求导得到:
\[ P(X=k) = \frac{G_X^{(k)}(0)}{k!} \]
其中 \(G_X^{(k)}(0)\) 是 \(G_X(s)\) 在 \(s=0\) 处的 \(k\) 阶导数。
- 矩的生成:随机变量 \(X\) 的期望和方差可以通过概率母函数的导数在 \(s=1\) 处的值求得:
\[ E[X] = G'_X(1) \]
\[ Var(X) = G''_X(1) + G'_X(1) - [G'_X(1)]^2 \]
- 独立随机变量和:如果 \(X\) 和 \(Y\) 是相互独立的非负整数值随机变量,那么它们的和 \(Z = X + Y\) 的概率母函数是各自概率母函数的乘积:
\[ G_Z(s) = G_X(s) \cdot G_Y(s) \]
第二步:概率母函数方法处理随机变量变换的基本原理
我们的目标是:已知随机变量 \(X\) 的概率母函数 \(G_X(s)\),求一个新的随机变量 \(Y = g(X)\) 的概率母函数 \(G_Y(s)\),其中 \(g(\cdot)\) 是一个给定的函数。
- 直接法(基于期望定义):
根据概率母函数的定义,\(Y\) 的概率母函数为:
\[ G_Y(s) = E[s^{Y}] = E[s^{g(X)}] \]
关键在于,\(s^{g(X)}\) 本身是随机变量 \(X\) 的一个函数。因此,计算 \(G_Y(s)\) 就转化为计算函数 \(s^{g(X)}\) 关于 \(X\) 的分布的期望。
- 计算期望:
\[ G_Y(s) = E[s^{g(X)}] = \sum_{k=0}^{\infty} P(X=k) \cdot s^{g(k)} \]
这个求和式直接给出了 \(Y\) 的概率母函数。只要我们知道 \(X\) 的概率质量函数 \(P(X=k)\),并将 \(s^{g(k)}\) 作为权重对 \(k\) 进行求和即可。
第三步:通过具体例子深入理解
例1:线性变换 \(Y = aX + b\)
假设 \(X\) 是一个非负整数值随机变量,其概率母函数为 \(G_X(s)\)。令 \(Y = aX + b\),其中 \(a\) 和 \(b\) 是整数,且 \(a > 0\),以确保 \(Y\) 也是非负整数。
- 应用直接法:
\[ G_Y(s) = E[s^{Y}] = E[s^{aX + b}] = E[s^{aX} \cdot s^b] = s^b \cdot E[(s^a)^X] \]
- 识别形式:注意到 \(E[(s^a)^X]\) 正是 \(G_X(s^a)\),因为 \(G_X(t) = E[t^X]\)。这里 \(t = s^a\)。
- 最终结果:
\[ G_Y(s) = s^b \cdot G_X(s^a) \]
例如,若 \(Y = 2X\),则 \(G_Y(s) = G_X(s^2)\)。若 \(Y = X + 1\),则 \(G_Y(s) = s \cdot G_X(s)\)。
例2:非线性变换 \(Y = X^2\)
令 \(Y = X^2\),其中 \(X\) 是非负整数值随机变量。
- 应用直接法:
\[ G_Y(s) = E[s^{Y}] = E[s^{X^2}] = \sum_{k=0}^{\infty} P(X=k) \cdot s^{k^2} \]
- 分析:这个表达式就是 \(Y\) 的概率母函数。它无法进一步简化为一个像 \(G_X(f(s))\) 这样简洁的封闭形式。要得到 \(Y\) 的分布,我们需要直接计算这个求和式,或者利用 \(G_Y(s)\) 的导数在 \(s=0\) 处的值来提取概率质量函数。
第四步:方法的优势与局限性
-
优势:
- 简洁性:对于线性变换或独立随机变量和的变换,概率母函数方法能给出非常简洁的结果。
- 求和便利:处理独立随机变量和时,概率母函数的乘积性质极大地简化了计算。
-
分布确定:一旦得到 \(G_Y(s)\),就可以通过求导唯一地确定 \(Y\) 的整个概率分布。
-
局限性:
- 离散性限制:概率母函数主要适用于取值为非负整数的随机变量。对于连续随机变量或取值为其他离散值的随机变量,需要使用特征函数或矩母函数。
-
非线性变换:对于复杂的非线性变换 \(g(X)\),最终得到的 \(G_Y(s)\) 的表达式可能很复杂,没有简单的封闭形式,需要数值计算。
总结
概率母函数方法为求解离散随机变量变换后的分布提供了一个系统且强大的框架。其核心在于利用概率母函数的定义,将问题转化为计算一个关于原随机变量的函数的期望。这种方法在处理线性变换和独立和时尤为有效,并能唯一确定变换后的分布。