随机变量的变换
字数 3751 2025-10-28 20:05:42
随机变量的变换
-
基本概念与动机
随机变量的变换是指通过一个确定的函数 \(g\) 将一个随机变量 \(X\) 映射为另一个新的随机变量 \(Y = g(X)\)。这是概率论中的一个核心工具,其目的在于:当我们已知原随机变量 \(X\) 的概率分布(概率密度函数或概率质量函数),如何推导出变换后随机变量 \(Y\) 的分布。这在统计学、信号处理、金融工程等领域有广泛应用,例如,当我们对数据进行标准化(\(Y = (X - \mu)/\sigma\))或进行非线性转换时。 -
离散型随机变量的变换
当 \(X\) 是离散型随机变量时,问题相对简单。设 \(X\) 的概率质量函数为 \(P(X = x_i) = p_i\)。对于变换 \(Y = g(X)\):
- \(Y\) 也是一个离散型随机变量。
- \(Y\) 取某个值 \(y\) 的概率,等于所有使得 \(g(x_i) = y\) 的 \(x_i\) 对应的概率之和。
- 公式表示为:\(P(Y = y) = \sum_{\{i: g(x_i) = y\}} P(X = x_i)\)。
- 例子:若 \(X\) 的取值为 {-1, 0, 1},且概率均为 1/3。令 \(Y = X^2\)。则 \(Y\) 的取值为 {0, 1}。计算过程为:\(P(Y=0) = P(X=0) = 1/3\),\(P(Y=1) = P(X=-1) + P(X=1) = 1/3 + 1/3 = 2/3\)。
- 连续型随机变量的变换:CDF法(通用方法)
当 \(X\) 是连续型随机变量时,最通用、最基础的方法是使用累积分布函数。目标是求 \(Y = g(X)\) 的概率密度函数 \(f_Y(y)\)。- 步骤 1: 求 Y 的累积分布函数(CDF)。
\(F_Y(y) = P(Y \le y) = P(g(X) \le y)\)。
- 步骤 1: 求 Y 的累积分布函数(CDF)。
- 步骤 2: 将事件 \(\{g(X) \le y\}\) 用关于 X 的事件表示。
这需要根据函数 \(g\) 的具体形式(单调性)来处理。然后利用已知的 \(X\) 的分布来计算这个概率。- 步骤 3: 对 CDF 求导得到 PDF。
\(f_Y(y) = \frac{d}{dy} F_Y(y)\)。
- 步骤 3: 对 CDF 求导得到 PDF。
- 例子:设 \(X \sim Uniform(0, 1)\),其 PDF 为 \(f_X(x) = 1\) 对于 \(0 < x < 1\)。令 \(Y = -\ln(X)\)。求 \(f_Y(y)\)。
-
\(F_Y(y) = P(Y \le y) = P(-\ln(X) \le y) = P(\ln(X) \ge -y) = P(X \ge e^{-y})\)。
-
由于 \(X \sim Uniform(0,1)\),\(P(X \ge a) = 1 - a\)(当 \(0 < a < 1\))。所以 \(F_Y(y) = 1 - e^{-y}\)。(注意:此式成立要求 \(e^{-y}\) 在 (0,1) 区间内,即 \(y > 0\))。
-
求导:\(f_Y(y) = \frac{d}{dy}(1 - e^{-y}) = e^{-y}\),对于 \(y > 0\)。我们发现 \(Y\) 服从指数分布。
-
连续型随机变量的变换:公式法(单调函数情形)
当变换函数 \(g\) 是严格单调可微函数时,存在一个更直接的公式,无需每次都推导 CDF。
- 定理:设 \(X\) 是连续随机变量,PDF 为 \(f_X(x)\)。设 \(Y = g(X)\),且 \(g\) 是一个可微的严格单调函数(在整个 \(X\) 的取值范围上)。则 \(Y\) 的 PDF 为:
\(f_Y(y) = f_X(g^{-1}(y)) \cdot \left| \frac{d}{dy} g^{-1}(y) \right|\)。
其中 \(g^{-1}\) 是 \(g\) 的反函数。绝对值符号保证了概率密度非负。- 推导思路:此公式本质上是 CDF 求导法与微积分中反函数求导和变量变换法则的结合。绝对值来源于单调递增和单调递减情况下求导符号的不同。
- 例子(重温):\(X \sim Uniform(0,1)\),\(Y = -\ln(X)\)。函数 \(g(x) = -\ln(x)\) 在 (0,1) 上是严格单调递减的。
- 反函数:由 \(y = -\ln(x)\) 得 \(x = e^{-y}\),所以 \(g^{-1}(y) = e^{-y}\)。
- 求导:\(\frac{d}{dy} g^{-1}(y) = -e^{-y}\)。
- 取绝对值:\(\left| -e^{-y} \right| = e^{-y}\)。
- 代入公式:\(f_Y(y) = f_X(e^{-y}) \cdot e^{-y} = 1 \cdot e^{-y} = e^{-y}\),对于 \(y > 0\)(因为当 \(y>0\) 时,\(x=e^{-y} \in (0,1)\),此时 \(f_X(x)=1\))。结果与 CDF 法一致。
- 多元随机变量的变换(雅可比行列式)
此概念可推广到多个随机变量的情形。设有一个随机向量 \(\mathbf{X} = (X_1, ..., X_n)\),其联合概率密度函数为 \(f_{\mathbf{X}}(\mathbf{x})\)。考虑变换 \(\mathbf{Y} = g(\mathbf{X})\),即 \((Y_1, ..., Y_n) = (g_1(X_1,...,X_n), ..., g_n(X_1,...,X_n))\)。
- 核心工具:雅可比行列式。假设变换 \(g\) 是从 \(\mathbb{R}^n\) 到 \(\mathbb{R}^n\) 的一一映射(可逆),且可微。雅可比矩阵 \(J\) 是一个 n×n 矩阵,其第 (i, j) 元素为 \(\frac{\partial y_i}{\partial x_j}\)。雅可比行列式 \(|J|\) 是这个矩阵的行列式。
- 变换公式:变换后向量 \(\mathbf{Y}\) 的联合概率密度函数为:
\(f_{\mathbf{Y}}(\mathbf{y}) = f_{\mathbf{X}}(g^{-1}(\mathbf{y})) \cdot \left| J^{-1} \right|\)。
其中 \(J^{-1}\) 是反函数 \(g^{-1}\) 的雅可比矩阵,其行列式 \(|J^{-1}|\) 是原雅可比行列式 \(|J|\) 的倒数,即 \(|J^{-1}| = 1 / |J|\)。因此公式也常写作 \(f_{\mathbf{Y}}(\mathbf{y}) = f_{\mathbf{X}}(\mathbf{x}) \cdot \left| \frac{\partial \mathbf{x}}{\partial \mathbf{y}} \right|\)。 - 例子:极坐标变换。设 \((X, Y)\) 是平面上的点,已知其联合 PDF \(f_{XY}(x, y)\)。变换为极坐标:\(R = \sqrt{X^2 + Y^2}\),\(\Theta = \arctan(Y/X)\)。其反变换为 \(X = R\cos\Theta\),\(Y = R\sin\Theta\)。计算反变换的雅可比行列式:
\(J = \begin{vmatrix} \frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta} \\ \frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta} \end{vmatrix} = \begin{vmatrix} \cos\theta & -r\sin\theta \\ \sin\theta & r\cos\theta \end{vmatrix} = r\cos^2\theta + r\sin^2\theta = r\)。
因此,\((R, \Theta)\) 的联合 PDF 为 \(f_{R\Theta}(r, \theta) = f_{XY}(r\cos\theta, r\sin\theta) \cdot r\),其中 \(r \ge 0, 0 \le \theta < 2\pi\)。这个额外的因子 \(r\) 在二维模拟和积分中至关重要。