随机变量的变换的变换定理
变换定理是处理随机变量变换的核心工具,它提供了当随机变量经过一个函数变换后,其概率密度函数(对于连续型随机变量)或概率质量函数(对于离散型随机变量)的通用计算方法。
第一步:理解问题背景
假设我们有一个随机变量 \(X\),并且我们知道它的概率分布(例如,其概率密度函数 \(f_X(x)\))。现在我们定义一个新的随机变量 \(Y\),它是 \(X\) 的一个函数:\(Y = g(X)\)。我们的目标是找出 \(Y\) 的概率分布,即其概率密度函数 \(f_Y(y)\)。
第二步:离散型随机变量的情况(作为简单起点)
如果 \(X\) 是离散型随机变量,其概率质量函数为 \(P(X = x_i)\),那么问题相对简单。对于变换 \(Y = g(X)\),\(Y\) 的概率质量函数可以通过直接求和得到:
\[P(Y = y_j) = \sum_{\{i: g(x_i) = y_j\}} P(X = x_i) \]
即,将所有使得 \(g(x_i) = y_j\) 的 \(x_i\) 对应的概率相加。这种情况比较直观,变换定理主要针对更复杂的连续型随机变量。
第三步:连续型随机变量的核心思想
对于连续型随机变量,我们不能简单地对概率密度函数进行求和,因为任意一点的概率都是零。变换定理的核心思想是:事件发生的概率在变换前后应该保持不变,尽管描述该事件的区间可能会发生变化。
更具体地说,我们考虑一个微小区间。如果 \(X\) 落在区间 \([x, x+dx]\) 内,那么其概率近似为 \(f_X(x) |dx|\)。经过变换 \(Y = g(X)\) 后,\(Y\) 会落在由函数 \(g\) 映射出的某个区间内。变换定理通过建立这两个区间概率相等的原则,来推导出 \(f_Y(y)\)。
第四步:严格推导与公式(当 \(g\) 是单调函数时)
为了使推导严谨,我们考虑变换 \(g\) 是可逆(即一一对应)的情况。这通常意味着 \(g\) 是严格单调的。我们分两种情况进行讨论:
- \(g\) 是严格单调递增函数:
在这种情况下,反函数 \(g^{-1}\) 存在且也是递增的。事件 \(\{Y \le y\}\) 等价于事件 \(\{X \le g^{-1}(y)\}\)。因此,\(Y\) 的累积分布函数为:
\[ F_Y(y) = P(Y \le y) = P(X \le g^{-1}(y)) = F_X(g^{-1}(y)) \]
为了得到概率密度函数 \(f_Y(y)\),我们对累积分布函数 \(F_Y(y)\) 关于 \(y\) 求导。运用链式法则:
\[ f_Y(y) = \frac{d}{dy} F_Y(y) = \frac{d}{dy} F_X(g^{-1}(y)) = f_X(g^{-1}(y)) \cdot \frac{d}{dy} [g^{-1}(y)] \]
由于 \(g\) 是递增函数,其反函数的导数 \(\frac{d}{dy} [g^{-1}(y)]\) 为正数。
- \(g\) 是严格单调递减函数:
在这种情况下,事件 \(\{Y \le y\}\) 等价于事件 \(\{X \ge g^{-1}(y)\}\)。因此:
\[ F_Y(y) = P(Y \le y) = P(X \ge g^{-1}(y)) = 1 - F_X(g^{-1}(y)) \]
再次求导:
\[ f_Y(y) = \frac{d}{dy} [1 - F_X(g^{-1}(y))] = -f_X(g^{-1}(y)) \cdot \frac{d}{dy} [g^{-1}(y)] \]
由于 \(g\) 是递减函数,其反函数的导数 \(\frac{d}{dy} [g^{-1}(y)]\) 为负数。因此,右边的负号与这个负导数相乘,结果仍为正数。
第五步:统一公式与雅可比因子
综合以上单调递增和递减两种情况,我们可以得到一个统一的变换定理公式:
\[f_Y(y) = f_X(g^{-1}(y)) \cdot \left| \frac{d}{dy} [g^{-1}(y)] \right| \]
其中,\(\left| \frac{d}{dy} [g^{-1}(y)] \right|\) 项被称为雅可比因子(Jacobian factor)。它的作用是"补偿"由于变换 \(g\) 导致的空间拉伸或压缩,从而保证概率的总和(或积分)始终为1。绝对值确保了概率密度函数始终是非负的。
第六步:扩展到多维情况(简介)
变换定理可以推广到多个随机变量的变换。假设有随机向量 \(\mathbf{X} = (X_1, ..., X_n)\),其联合概率密度函数为 \(f_{\mathbf{X}}(\mathbf{x})\)。定义一个新的随机向量 \(\mathbf{Y} = (Y_1, ..., Y_n) = g(\mathbf{X})\),其中 \(g\) 是一个从 \(\mathbb{R}^n\) 到 \(\mathbb{R}^n\) 的可逆变换(即存在反函数 \(g^{-1}\),且其偏导数存在)。
那么,\(\mathbf{Y}\) 的联合概率密度函数为:
\[f_{\mathbf{Y}}(\mathbf{y}) = f_{\mathbf{X}}(g^{-1}(\mathbf{y})) \cdot \left| J \right| \]
其中,\(J\) 是变换 \(g^{-1}\) 的雅可比行列式(Jacobian determinant),它代表了多维空间中的"体积"缩放因子。绝对值同样保证了概率密度的非负性。
总结
随机变量的变换定理是一个系统性工具,它通过以下方式求解新随机变量的分布:
- 利用累积分布函数的等价关系(在单调情况下)。
- 求导得到概率密度函数。
- 引入雅可比因子(一维是绝对值导数,多维是雅可比行列式的绝对值) 来修正因变量变换引起的概率"密度"变化。
这个定理是连接不同随机变量分布之间的桥梁,在统计推导和随机模拟中至关重要。