随机变量的变换的积分变换方法
我们从一个具体的例子开始。假设你有一个随机变量 \(X\),其概率密度函数为 \(f_X(x)\)。现在,你定义了一个新的随机变量 \(Y = g(X)\),其中 \(g\) 是一个已知的函数(例如,\(Y = X^2\) 或 \(Y = e^X\))。我们的目标是求出这个新随机变量 \(Y\) 的概率密度函数 \(f_Y(y)\)。
第一步:回顾基础——累积分布函数方法
求解 \(Y\) 的分布,最根本的方法是使用累积分布函数方法。具体步骤如下:
- 写出 \(Y\) 的累积分布函数定义:\(F_Y(y) = P(Y \le y)\)。
- 将事件 \(\{Y \le y\}\) 用原始随机变量 \(X\) 来表示:\(F_Y(y) = P(g(X) \le y)\)。
- 求解这个关于 \(X\) 的不等式,找到使得 \(g(X) \le y\) 成立的 \(X\) 的取值范围。我们把这个范围记作 \(A_y\)(例如,\(A_y = \{x: g(x) \le y\}\))。
- 通过对 \(X\) 的概率密度函数在区域 \(A_y\) 上积分来计算这个概率:\(F_Y(y) = \int_{A_y} f_X(x) \, dx\)。
- 最后,对 \(F_Y(y)\) 关于 \(y\) 求导,即可得到 \(Y\) 的概率密度函数:\(f_Y(y) = \frac{d}{dy} F_Y(y)\)。
这个方法非常通用,但有时求解不等式和积分会比较复杂。积分变换方法提供了一种更直接、更优雅的求解途径,特别是在处理单调函数时。
第二步:引入核心思想——积分变换的直观理解
积分变换方法的核心思想是“概率守恒”。想象一下,随机变量 \(X\) 的取值在 \(x\) 轴上,其概率密度 \(f_X(x)\) 表示概率在 \(x\) 轴上的“密度”。当我们通过函数 \(Y = g(X)\) 进行变换时,相当于把 \(x\) 轴上的点映射到了 \(y\) 轴上。
概率守恒原理告诉我们,在变换前后,落在任意区间内的总概率是不变的。更精确地说,对于 \(X\) 的一个极小区间 \([x, x+dx]\),它被变换到 \(Y\) 的一个极小区间 \([y, y+dy]\)。这两个区间所蕴含的概率应该相等:
\[P(x \le X \le x+dx) = P(y \le Y \le y+dy) \]
用概率密度函数表示为:
\[f_X(x) |dx| = f_Y(y) |dy| \]
这里取绝对值是为了保证概率的非负性。这个等式是积分变换方法最基础的公式。
第三步:关键推导——变量变换公式
从基础公式 \(f_X(x) |dx| = f_Y(y) |dy|\) 出发,我们可以解出 \(f_Y(y)\):
\[f_Y(y) = f_X(x) \left| \frac{dx}{dy} \right| \]
但是,这个表达式中右边还含有 \(x\),而我们需要的是一个关于 \(y\) 的函数。由于 \(y = g(x)\),如果函数 \(g\) 是可逆的(即存在反函数 \(x = g^{-1}(y)\)),我们就可以将 \(x\) 用 \(y\) 来表示。
由此,我们得到一元随机变量变换的定理(变量变换公式):
如果 \(Y = g(X)\),且 \(g\) 是一个严格单调可微函数,其反函数为 \(x = h(y) = g^{-1}(y)\),那么 \(Y\) 的概率密度函数为:
\[f_Y(y) = f_X(\, h(y) \,) \cdot \left| h'(y) \right| \]
或者等价地写为:
\[f_Y(y) = f_X(\, g^{-1}(y) \,) \cdot \left| \frac{d}{dy} g^{-1}(y) \right| \]
其中,\(\left| h'(y) \right|\) 或 \(\left| \frac{d}{dy} g^{-1}(y) \right|\) 被称为雅可比因子,它衡量了变换过程中区间长度的伸缩比例,用以调整概率密度。
第四步:处理更一般的情况——非单调函数与多对一映射
如果函数 \(g\) 不是单调的,那么对于某些 \(y\) 值,方程 \(g(x) = y\) 可能会有多个解。假设有 \(k\) 个解,记为 \(x_1, x_2, \dots, x_k\),其中每个 \(x_i = h_i(y)\) 是 \(g(x)=y\) 的一个根,并且在每个根 \(x_i\) 的邻域内,函数 \(g\) 是局部单调的。
根据概率的可加性,\(Y\) 在 \(y\) 点的概率密度应该是所有满足 \(g(x)=y\) 的 \(x\) 点所贡献的概率密度之和。因此,推广的公式为:
\[f_Y(y) = \sum_{i=1}^{k} f_X(\, h_i(y) \,) \cdot \left| h_i'(y) \right| \]
一个经典的例子是 \(Y = X^2\)。对于 \(y > 0\),方程 \(x^2 = y\) 有两个解:\(x_1 = -\sqrt{y}\) 和 \(x_2 = \sqrt{y}\)。应用上述公式即可求得 \(f_Y(y)\)。
第五步:扩展到多元随机变量
积分变换的思想可以自然地推广到多个随机变量的情形。假设我们有随机向量 \(\mathbf{X} = (X_1, X_2, \dots, X_n)\),其联合概率密度函数为 \(f_{\mathbf{X}}(\mathbf{x})\)。我们通过一个变换 \(\mathbf{Y} = \mathbf{g}(\mathbf{X})\) 定义一个新的随机向量 \(\mathbf{Y} = (Y_1, Y_2, \dots, Y_n)\),其中每个 \(Y_i = g_i(X_1, \dots, X_n)\)。
概率守恒原理现在表述为:在 \(\mathbf{X}\) 空间中的一个无穷小体积元 \(d\mathbf{x}\) 内的概率,等于它被映射到 \(\mathbf{Y}\) 空间中所对应的无穷小体积元 \(d\mathbf{y}\) 内的概率:
\[f_{\mathbf{X}}(\mathbf{x}) |d\mathbf{x}| = f_{\mathbf{Y}}(\mathbf{y}) |d\mathbf{y}| \]
这里,体积元的比例由变换的雅可比行列式的绝对值给出:\(|d\mathbf{y}| / |d\mathbf{x}| = |J|\),其中雅可比行列式 \(J\) 定义为:
\[J = \det \begin{pmatrix} \frac{\partial y_1}{\partial x_1} & \cdots & \frac{\partial y_1}{\partial x_n} \\ \vdots & \ddots & \vdots \\ \frac{\partial y_n}{\partial x_1} & \cdots & \frac{\partial y_n}{\partial x_n} \end{pmatrix} \]
因此,多元情形的变量变换公式为:
\[f_{\mathbf{Y}}(\mathbf{y}) = f_{\mathbf{X}}(\, \mathbf{g}^{-1}(\mathbf{y}) \,) \cdot |J^{-1}| \]
其中,\(|J^{-1}|\) 是反函数 \(\mathbf{x} = \mathbf{g}^{-1}(\mathbf{y})\) 的雅可比行列式的绝对值。这个公式要求变换 \(\mathbf{g}\) 是连续可微且一一对应的。
总结
随机变量的变换的积分变换方法,其精髓在于利用概率守恒原理和微积分中的变量代换思想。它通过计算变换的雅可比因子(或行列式)来直接建立新旧概率密度函数之间的联系。这种方法在处理单调变换或具有明确反函数的变换时,比累积分布函数法更为简洁和高效,是概率论和数理统计中一个非常强大和实用的工具。