随机变量的变换的积分变换方法
字数 3614 2025-11-05 23:46:43

随机变量的变换的积分变换方法

我们从一个具体的例子开始。假设你有一个随机变量 \(X\),其概率密度函数为 \(f_X(x)\)。现在,你定义了一个新的随机变量 \(Y = g(X)\),其中 \(g\) 是一个已知的函数(例如,\(Y = X^2\)\(Y = e^X\))。我们的目标是求出这个新随机变量 \(Y\) 的概率密度函数 \(f_Y(y)\)

第一步:回顾基础——累积分布函数方法

求解 \(Y\) 的分布,最根本的方法是使用累积分布函数方法。具体步骤如下:

  1. 写出 \(Y\) 的累积分布函数定义:\(F_Y(y) = P(Y \le y)\)
  2. 将事件 \(\{Y \le y\}\) 用原始随机变量 \(X\) 来表示:\(F_Y(y) = P(g(X) \le y)\)
  3. 求解这个关于 \(X\) 的不等式,找到使得 \(g(X) \le y\) 成立的 \(X\) 的取值范围。我们把这个范围记作 \(A_y\)(例如,\(A_y = \{x: g(x) \le y\}\))。
  4. 通过对 \(X\) 的概率密度函数在区域 \(A_y\) 上积分来计算这个概率:\(F_Y(y) = \int_{A_y} f_X(x) \, dx\)
  5. 最后,对 \(F_Y(y)\) 关于 \(y\) 求导,即可得到 \(Y\) 的概率密度函数:\(f_Y(y) = \frac{d}{dy} F_Y(y)\)

这个方法非常通用,但有时求解不等式和积分会比较复杂。积分变换方法提供了一种更直接、更优雅的求解途径,特别是在处理单调函数时。

第二步:引入核心思想——积分变换的直观理解

积分变换方法的核心思想是“概率守恒”。想象一下,随机变量 \(X\) 的取值在 \(x\) 轴上,其概率密度 \(f_X(x)\) 表示概率在 \(x\) 轴上的“密度”。当我们通过函数 \(Y = g(X)\) 进行变换时,相当于把 \(x\) 轴上的点映射到了 \(y\) 轴上。

概率守恒原理告诉我们,在变换前后,落在任意区间内的总概率是不变的。更精确地说,对于 \(X\) 的一个极小区间 \([x, x+dx]\),它被变换到 \(Y\) 的一个极小区间 \([y, y+dy]\)。这两个区间所蕴含的概率应该相等:

\[P(x \le X \le x+dx) = P(y \le Y \le y+dy) \]

用概率密度函数表示为:

\[f_X(x) |dx| = f_Y(y) |dy| \]

这里取绝对值是为了保证概率的非负性。这个等式是积分变换方法最基础的公式。

第三步:关键推导——变量变换公式

从基础公式 \(f_X(x) |dx| = f_Y(y) |dy|\) 出发,我们可以解出 \(f_Y(y)\)

\[f_Y(y) = f_X(x) \left| \frac{dx}{dy} \right| \]

但是,这个表达式中右边还含有 \(x\),而我们需要的是一个关于 \(y\) 的函数。由于 \(y = g(x)\),如果函数 \(g\) 是可逆的(即存在反函数 \(x = g^{-1}(y)\)),我们就可以将 \(x\)\(y\) 来表示。

由此,我们得到一元随机变量变换的定理(变量变换公式)

如果 \(Y = g(X)\),且 \(g\) 是一个严格单调可微函数,其反函数为 \(x = h(y) = g^{-1}(y)\),那么 \(Y\) 的概率密度函数为:

\[f_Y(y) = f_X(\, h(y) \,) \cdot \left| h'(y) \right| \]

或者等价地写为:

\[f_Y(y) = f_X(\, g^{-1}(y) \,) \cdot \left| \frac{d}{dy} g^{-1}(y) \right| \]

其中,\(\left| h'(y) \right|\)\(\left| \frac{d}{dy} g^{-1}(y) \right|\) 被称为雅可比因子,它衡量了变换过程中区间长度的伸缩比例,用以调整概率密度。

第四步:处理更一般的情况——非单调函数与多对一映射

如果函数 \(g\) 不是单调的,那么对于某些 \(y\) 值,方程 \(g(x) = y\) 可能会有多个解。假设有 \(k\) 个解,记为 \(x_1, x_2, \dots, x_k\),其中每个 \(x_i = h_i(y)\)\(g(x)=y\) 的一个根,并且在每个根 \(x_i\) 的邻域内,函数 \(g\) 是局部单调的。

根据概率的可加性,\(Y\)\(y\) 点的概率密度应该是所有满足 \(g(x)=y\)\(x\) 点所贡献的概率密度之和。因此,推广的公式为:

\[f_Y(y) = \sum_{i=1}^{k} f_X(\, h_i(y) \,) \cdot \left| h_i'(y) \right| \]

一个经典的例子是 \(Y = X^2\)。对于 \(y > 0\),方程 \(x^2 = y\) 有两个解:\(x_1 = -\sqrt{y}\)\(x_2 = \sqrt{y}\)。应用上述公式即可求得 \(f_Y(y)\)

第五步:扩展到多元随机变量

积分变换的思想可以自然地推广到多个随机变量的情形。假设我们有随机向量 \(\mathbf{X} = (X_1, X_2, \dots, X_n)\),其联合概率密度函数为 \(f_{\mathbf{X}}(\mathbf{x})\)。我们通过一个变换 \(\mathbf{Y} = \mathbf{g}(\mathbf{X})\) 定义一个新的随机向量 \(\mathbf{Y} = (Y_1, Y_2, \dots, Y_n)\),其中每个 \(Y_i = g_i(X_1, \dots, X_n)\)

概率守恒原理现在表述为:在 \(\mathbf{X}\) 空间中的一个无穷小体积元 \(d\mathbf{x}\) 内的概率,等于它被映射到 \(\mathbf{Y}\) 空间中所对应的无穷小体积元 \(d\mathbf{y}\) 内的概率:

\[f_{\mathbf{X}}(\mathbf{x}) |d\mathbf{x}| = f_{\mathbf{Y}}(\mathbf{y}) |d\mathbf{y}| \]

这里,体积元的比例由变换的雅可比行列式的绝对值给出:\(|d\mathbf{y}| / |d\mathbf{x}| = |J|\),其中雅可比行列式 \(J\) 定义为:

\[J = \det \begin{pmatrix} \frac{\partial y_1}{\partial x_1} & \cdots & \frac{\partial y_1}{\partial x_n} \\ \vdots & \ddots & \vdots \\ \frac{\partial y_n}{\partial x_1} & \cdots & \frac{\partial y_n}{\partial x_n} \end{pmatrix} \]

因此,多元情形的变量变换公式为:

\[f_{\mathbf{Y}}(\mathbf{y}) = f_{\mathbf{X}}(\, \mathbf{g}^{-1}(\mathbf{y}) \,) \cdot |J^{-1}| \]

其中,\(|J^{-1}|\) 是反函数 \(\mathbf{x} = \mathbf{g}^{-1}(\mathbf{y})\) 的雅可比行列式的绝对值。这个公式要求变换 \(\mathbf{g}\) 是连续可微且一一对应的。

总结

随机变量的变换的积分变换方法,其精髓在于利用概率守恒原理和微积分中的变量代换思想。它通过计算变换的雅可比因子(或行列式)来直接建立新旧概率密度函数之间的联系。这种方法在处理单调变换或具有明确反函数的变换时,比累积分布函数法更为简洁和高效,是概率论和数理统计中一个非常强大和实用的工具。

随机变量的变换的积分变换方法 我们从一个具体的例子开始。假设你有一个随机变量 \( X \),其概率密度函数为 \( f_ X(x) \)。现在,你定义了一个新的随机变量 \( Y = g(X) \),其中 \( g \) 是一个已知的函数(例如,\( Y = X^2 \) 或 \( Y = e^X \))。我们的目标是求出这个新随机变量 \( Y \) 的概率密度函数 \( f_ Y(y) \)。 第一步:回顾基础——累积分布函数方法 求解 \( Y \) 的分布,最根本的方法是使用累积分布函数方法。具体步骤如下: 写出 \( Y \) 的累积分布函数定义:\( F_ Y(y) = P(Y \le y) \)。 将事件 \( \{Y \le y\} \) 用原始随机变量 \( X \) 来表示:\( F_ Y(y) = P(g(X) \le y) \)。 求解这个关于 \( X \) 的不等式,找到使得 \( g(X) \le y \) 成立的 \( X \) 的取值范围。我们把这个范围记作 \( A_ y \)(例如,\( A_ y = \{x: g(x) \le y\} \))。 通过对 \( X \) 的概率密度函数在区域 \( A_ y \) 上积分来计算这个概率:\( F_ Y(y) = \int_ {A_ y} f_ X(x) \, dx \)。 最后,对 \( F_ Y(y) \) 关于 \( y \) 求导,即可得到 \( Y \) 的概率密度函数:\( f_ Y(y) = \frac{d}{dy} F_ Y(y) \)。 这个方法非常通用,但有时求解不等式和积分会比较复杂。积分变换方法提供了一种更直接、更优雅的求解途径,特别是在处理单调函数时。 第二步:引入核心思想——积分变换的直观理解 积分变换方法的核心思想是“概率守恒”。想象一下,随机变量 \( X \) 的取值在 \( x \) 轴上,其概率密度 \( f_ X(x) \) 表示概率在 \( x \) 轴上的“密度”。当我们通过函数 \( Y = g(X) \) 进行变换时,相当于把 \( x \) 轴上的点映射到了 \( y \) 轴上。 概率守恒原理告诉我们,在变换前后,落在任意区间内的总概率是不变的。更精确地说,对于 \( X \) 的一个极小区间 \( [ x, x+dx] \),它被变换到 \( Y \) 的一个极小区间 \( [ y, y+dy ] \)。这两个区间所蕴含的概率应该相等: \[ P(x \le X \le x+dx) = P(y \le Y \le y+dy) \] 用概率密度函数表示为: \[ f_ X(x) |dx| = f_ Y(y) |dy| \] 这里取绝对值是为了保证概率的非负性。这个等式是积分变换方法最基础的公式。 第三步:关键推导——变量变换公式 从基础公式 \( f_ X(x) |dx| = f_ Y(y) |dy| \) 出发,我们可以解出 \( f_ Y(y) \): \[ f_ Y(y) = f_ X(x) \left| \frac{dx}{dy} \right| \] 但是,这个表达式中右边还含有 \( x \),而我们需要的是一个关于 \( y \) 的函数。由于 \( y = g(x) \),如果函数 \( g \) 是可逆的(即存在反函数 \( x = g^{-1}(y) \)),我们就可以将 \( x \) 用 \( y \) 来表示。 由此,我们得到 一元随机变量变换的定理(变量变换公式) : 如果 \( Y = g(X) \),且 \( g \) 是一个严格单调可微函数,其反函数为 \( x = h(y) = g^{-1}(y) \),那么 \( Y \) 的概率密度函数为: \[ f_ Y(y) = f_ X(\, h(y) \,) \cdot \left| h'(y) \right| \] 或者等价地写为: \[ f_ Y(y) = f_ X(\, g^{-1}(y) \,) \cdot \left| \frac{d}{dy} g^{-1}(y) \right| \] 其中,\( \left| h'(y) \right| \) 或 \( \left| \frac{d}{dy} g^{-1}(y) \right| \) 被称为 雅可比因子 ,它衡量了变换过程中区间长度的伸缩比例,用以调整概率密度。 第四步:处理更一般的情况——非单调函数与多对一映射 如果函数 \( g \) 不是单调的,那么对于某些 \( y \) 值,方程 \( g(x) = y \) 可能会有多个解。假设有 \( k \) 个解,记为 \( x_ 1, x_ 2, \dots, x_ k \),其中每个 \( x_ i = h_ i(y) \) 是 \( g(x)=y \) 的一个根,并且在每个根 \( x_ i \) 的邻域内,函数 \( g \) 是局部单调的。 根据概率的可加性,\( Y \) 在 \( y \) 点的概率密度应该是所有满足 \( g(x)=y \) 的 \( x \) 点所贡献的概率密度之和。因此,推广的公式为: \[ f_ Y(y) = \sum_ {i=1}^{k} f_ X(\, h_ i(y) \,) \cdot \left| h_ i'(y) \right| \] 一个经典的例子是 \( Y = X^2 \)。对于 \( y > 0 \),方程 \( x^2 = y \) 有两个解:\( x_ 1 = -\sqrt{y} \) 和 \( x_ 2 = \sqrt{y} \)。应用上述公式即可求得 \( f_ Y(y) \)。 第五步:扩展到多元随机变量 积分变换的思想可以自然地推广到多个随机变量的情形。假设我们有随机向量 \( \mathbf{X} = (X_ 1, X_ 2, \dots, X_ n) \),其联合概率密度函数为 \( f_ {\mathbf{X}}(\mathbf{x}) \)。我们通过一个变换 \( \mathbf{Y} = \mathbf{g}(\mathbf{X}) \) 定义一个新的随机向量 \( \mathbf{Y} = (Y_ 1, Y_ 2, \dots, Y_ n) \),其中每个 \( Y_ i = g_ i(X_ 1, \dots, X_ n) \)。 概率守恒原理现在表述为:在 \( \mathbf{X} \) 空间中的一个无穷小体积元 \( d\mathbf{x} \) 内的概率,等于它被映射到 \( \mathbf{Y} \) 空间中所对应的无穷小体积元 \( d\mathbf{y} \) 内的概率: \[ f_ {\mathbf{X}}(\mathbf{x}) |d\mathbf{x}| = f_ {\mathbf{Y}}(\mathbf{y}) |d\mathbf{y}| \] 这里,体积元的比例由变换的 雅可比行列式 的绝对值给出:\( |d\mathbf{y}| / |d\mathbf{x}| = |J| \),其中雅可比行列式 \( J \) 定义为: \[ J = \det \begin{pmatrix} \frac{\partial y_ 1}{\partial x_ 1} & \cdots & \frac{\partial y_ 1}{\partial x_ n} \\ \vdots & \ddots & \vdots \\ \frac{\partial y_ n}{\partial x_ 1} & \cdots & \frac{\partial y_ n}{\partial x_ n} \end{pmatrix} \] 因此,多元情形的 变量变换公式 为: \[ f_ {\mathbf{Y}}(\mathbf{y}) = f_ {\mathbf{X}}(\, \mathbf{g}^{-1}(\mathbf{y}) \,) \cdot |J^{-1}| \] 其中,\( |J^{-1}| \) 是反函数 \( \mathbf{x} = \mathbf{g}^{-1}(\mathbf{y}) \) 的雅可比行列式的绝对值。这个公式要求变换 \( \mathbf{g} \) 是连续可微且一一对应的。 总结 随机变量的变换的积分变换方法,其精髓在于利用概率守恒原理和微积分中的变量代换思想。它通过计算变换的雅可比因子(或行列式)来直接建立新旧概率密度函数之间的联系。这种方法在处理单调变换或具有明确反函数的变换时,比累积分布函数法更为简洁和高效,是概率论和数理统计中一个非常强大和实用的工具。