随机变量的变换
字数 3751 2025-10-28 20:05:42

随机变量的变换

  1. 基本概念与动机
    随机变量的变换是指通过一个确定的函数 \(g\) 将一个随机变量 \(X\) 映射为另一个新的随机变量 \(Y = g(X)\)。这是概率论中的一个核心工具,其目的在于:当我们已知原随机变量 \(X\) 的概率分布(概率密度函数或概率质量函数),如何推导出变换后随机变量 \(Y\) 的分布。这在统计学、信号处理、金融工程等领域有广泛应用,例如,当我们对数据进行标准化(\(Y = (X - \mu)/\sigma\))或进行非线性转换时。

  2. 离散型随机变量的变换
    \(X\) 是离散型随机变量时,问题相对简单。设 \(X\) 的概率质量函数为 \(P(X = x_i) = p_i\)。对于变换 \(Y = g(X)\)

  • \(Y\) 也是一个离散型随机变量。
  • \(Y\) 取某个值 \(y\) 的概率,等于所有使得 \(g(x_i) = y\)\(x_i\) 对应的概率之和。
  • 公式表示为:\(P(Y = y) = \sum_{\{i: g(x_i) = y\}} P(X = x_i)\)
  • 例子:若 \(X\) 的取值为 {-1, 0, 1},且概率均为 1/3。令 \(Y = X^2\)。则 \(Y\) 的取值为 {0, 1}。计算过程为:\(P(Y=0) = P(X=0) = 1/3\)\(P(Y=1) = P(X=-1) + P(X=1) = 1/3 + 1/3 = 2/3\)
  1. 连续型随机变量的变换:CDF法(通用方法)
    \(X\) 是连续型随机变量时,最通用、最基础的方法是使用累积分布函数。目标是求 \(Y = g(X)\) 的概率密度函数 \(f_Y(y)\)
    • 步骤 1: 求 Y 的累积分布函数(CDF)
      \(F_Y(y) = P(Y \le y) = P(g(X) \le y)\)
  • 步骤 2: 将事件 \(\{g(X) \le y\}\) 用关于 X 的事件表示
    这需要根据函数 \(g\) 的具体形式(单调性)来处理。然后利用已知的 \(X\) 的分布来计算这个概率。
    • 步骤 3: 对 CDF 求导得到 PDF
      \(f_Y(y) = \frac{d}{dy} F_Y(y)\)
  • 例子:设 \(X \sim Uniform(0, 1)\),其 PDF 为 \(f_X(x) = 1\) 对于 \(0 < x < 1\)。令 \(Y = -\ln(X)\)。求 \(f_Y(y)\)
  1. \(F_Y(y) = P(Y \le y) = P(-\ln(X) \le y) = P(\ln(X) \ge -y) = P(X \ge e^{-y})\)

  2. 由于 \(X \sim Uniform(0,1)\)\(P(X \ge a) = 1 - a\)(当 \(0 < a < 1\))。所以 \(F_Y(y) = 1 - e^{-y}\)。(注意:此式成立要求 \(e^{-y}\) 在 (0,1) 区间内,即 \(y > 0\))。

  3. 求导:\(f_Y(y) = \frac{d}{dy}(1 - e^{-y}) = e^{-y}\),对于 \(y > 0\)。我们发现 \(Y\) 服从指数分布。

  4. 连续型随机变量的变换:公式法(单调函数情形)
    当变换函数 \(g\) 是严格单调可微函数时,存在一个更直接的公式,无需每次都推导 CDF。

  • 定理:设 \(X\) 是连续随机变量,PDF 为 \(f_X(x)\)。设 \(Y = g(X)\),且 \(g\) 是一个可微的严格单调函数(在整个 \(X\) 的取值范围上)。则 \(Y\) 的 PDF 为:
    \(f_Y(y) = f_X(g^{-1}(y)) \cdot \left| \frac{d}{dy} g^{-1}(y) \right|\)
    其中 \(g^{-1}\)\(g\) 的反函数。绝对值符号保证了概率密度非负。
    • 推导思路:此公式本质上是 CDF 求导法与微积分中反函数求导和变量变换法则的结合。绝对值来源于单调递增和单调递减情况下求导符号的不同。
  • 例子(重温)\(X \sim Uniform(0,1)\)\(Y = -\ln(X)\)。函数 \(g(x) = -\ln(x)\) 在 (0,1) 上是严格单调递减的。
  • 反函数:由 \(y = -\ln(x)\)\(x = e^{-y}\),所以 \(g^{-1}(y) = e^{-y}\)
  • 求导:\(\frac{d}{dy} g^{-1}(y) = -e^{-y}\)
  • 取绝对值:\(\left| -e^{-y} \right| = e^{-y}\)
  • 代入公式:\(f_Y(y) = f_X(e^{-y}) \cdot e^{-y} = 1 \cdot e^{-y} = e^{-y}\),对于 \(y > 0\)(因为当 \(y>0\) 时,\(x=e^{-y} \in (0,1)\),此时 \(f_X(x)=1\))。结果与 CDF 法一致。
  1. 多元随机变量的变换(雅可比行列式)
    此概念可推广到多个随机变量的情形。设有一个随机向量 \(\mathbf{X} = (X_1, ..., X_n)\),其联合概率密度函数为 \(f_{\mathbf{X}}(\mathbf{x})\)。考虑变换 \(\mathbf{Y} = g(\mathbf{X})\),即 \((Y_1, ..., Y_n) = (g_1(X_1,...,X_n), ..., g_n(X_1,...,X_n))\)
  • 核心工具:雅可比行列式。假设变换 \(g\) 是从 \(\mathbb{R}^n\)\(\mathbb{R}^n\) 的一一映射(可逆),且可微。雅可比矩阵 \(J\) 是一个 n×n 矩阵,其第 (i, j) 元素为 \(\frac{\partial y_i}{\partial x_j}\)。雅可比行列式 \(|J|\) 是这个矩阵的行列式。
  • 变换公式:变换后向量 \(\mathbf{Y}\) 的联合概率密度函数为:
    \(f_{\mathbf{Y}}(\mathbf{y}) = f_{\mathbf{X}}(g^{-1}(\mathbf{y})) \cdot \left| J^{-1} \right|\)
    其中 \(J^{-1}\) 是反函数 \(g^{-1}\) 的雅可比矩阵,其行列式 \(|J^{-1}|\) 是原雅可比行列式 \(|J|\) 的倒数,即 \(|J^{-1}| = 1 / |J|\)。因此公式也常写作 \(f_{\mathbf{Y}}(\mathbf{y}) = f_{\mathbf{X}}(\mathbf{x}) \cdot \left| \frac{\partial \mathbf{x}}{\partial \mathbf{y}} \right|\)
  • 例子:极坐标变换。设 \((X, Y)\) 是平面上的点,已知其联合 PDF \(f_{XY}(x, y)\)。变换为极坐标:\(R = \sqrt{X^2 + Y^2}\)\(\Theta = \arctan(Y/X)\)。其反变换为 \(X = R\cos\Theta\)\(Y = R\sin\Theta\)。计算反变换的雅可比行列式:
    \(J = \begin{vmatrix} \frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta} \\ \frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta} \end{vmatrix} = \begin{vmatrix} \cos\theta & -r\sin\theta \\ \sin\theta & r\cos\theta \end{vmatrix} = r\cos^2\theta + r\sin^2\theta = r\)
    因此,\((R, \Theta)\) 的联合 PDF 为 \(f_{R\Theta}(r, \theta) = f_{XY}(r\cos\theta, r\sin\theta) \cdot r\),其中 \(r \ge 0, 0 \le \theta < 2\pi\)。这个额外的因子 \(r\) 在二维模拟和积分中至关重要。
随机变量的变换 基本概念与动机 随机变量的变换是指通过一个确定的函数 \( g \) 将一个随机变量 \( X \) 映射为另一个新的随机变量 \( Y = g(X) \)。这是概率论中的一个核心工具,其目的在于:当我们已知原随机变量 \( X \) 的概率分布(概率密度函数或概率质量函数),如何推导出变换后随机变量 \( Y \) 的分布。这在统计学、信号处理、金融工程等领域有广泛应用,例如,当我们对数据进行标准化(\( Y = (X - \mu)/\sigma \))或进行非线性转换时。 离散型随机变量的变换 当 \( X \) 是离散型随机变量时,问题相对简单。设 \( X \) 的概率质量函数为 \( P(X = x_ i) = p_ i \)。对于变换 \( Y = g(X) \): \( Y \) 也是一个离散型随机变量。 \( Y \) 取某个值 \( y \) 的概率,等于所有使得 \( g(x_ i) = y \) 的 \( x_ i \) 对应的概率之和。 公式表示为:\( P(Y = y) = \sum_ {\{i: g(x_ i) = y\}} P(X = x_ i) \)。 例子 :若 \( X \) 的取值为 {-1, 0, 1},且概率均为 1/3。令 \( Y = X^2 \)。则 \( Y \) 的取值为 {0, 1}。计算过程为:\( P(Y=0) = P(X=0) = 1/3 \),\( P(Y=1) = P(X=-1) + P(X=1) = 1/3 + 1/3 = 2/3 \)。 连续型随机变量的变换:CDF法(通用方法) 当 \( X \) 是连续型随机变量时,最通用、最基础的方法是使用累积分布函数。目标是求 \( Y = g(X) \) 的概率密度函数 \( f_ Y(y) \)。 步骤 1: 求 Y 的累积分布函数(CDF) 。 \( F_ Y(y) = P(Y \le y) = P(g(X) \le y) \)。 步骤 2: 将事件 \( \{g(X) \le y\} \) 用关于 X 的事件表示 。 这需要根据函数 \( g \) 的具体形式(单调性)来处理。然后利用已知的 \( X \) 的分布来计算这个概率。 步骤 3: 对 CDF 求导得到 PDF 。 \( f_ Y(y) = \frac{d}{dy} F_ Y(y) \)。 例子 :设 \( X \sim Uniform(0, 1) \),其 PDF 为 \( f_ X(x) = 1 \) 对于 \( 0 < x < 1 \)。令 \( Y = -\ln(X) \)。求 \( f_ Y(y) \)。 \( F_ Y(y) = P(Y \le y) = P(-\ln(X) \le y) = P(\ln(X) \ge -y) = P(X \ge e^{-y}) \)。 由于 \( X \sim Uniform(0,1) \),\( P(X \ge a) = 1 - a \)(当 \( 0 < a < 1 \))。所以 \( F_ Y(y) = 1 - e^{-y} \)。(注意:此式成立要求 \( e^{-y} \) 在 (0,1) 区间内,即 \( y > 0 \))。 求导:\( f_ Y(y) = \frac{d}{dy}(1 - e^{-y}) = e^{-y} \),对于 \( y > 0 \)。我们发现 \( Y \) 服从指数分布。 连续型随机变量的变换:公式法(单调函数情形) 当变换函数 \( g \) 是严格单调可微函数时,存在一个更直接的公式,无需每次都推导 CDF。 定理 :设 \( X \) 是连续随机变量,PDF 为 \( f_ X(x) \)。设 \( Y = g(X) \),且 \( g \) 是一个可微的严格单调函数(在整个 \( X \) 的取值范围上)。则 \( Y \) 的 PDF 为: \( f_ Y(y) = f_ X(g^{-1}(y)) \cdot \left| \frac{d}{dy} g^{-1}(y) \right| \)。 其中 \( g^{-1} \) 是 \( g \) 的反函数。绝对值符号保证了概率密度非负。 推导思路 :此公式本质上是 CDF 求导法与微积分中反函数求导和变量变换法则的结合。绝对值来源于单调递增和单调递减情况下求导符号的不同。 例子(重温) :\( X \sim Uniform(0,1) \),\( Y = -\ln(X) \)。函数 \( g(x) = -\ln(x) \) 在 (0,1) 上是严格单调递减的。 反函数:由 \( y = -\ln(x) \) 得 \( x = e^{-y} \),所以 \( g^{-1}(y) = e^{-y} \)。 求导:\( \frac{d}{dy} g^{-1}(y) = -e^{-y} \)。 取绝对值:\( \left| -e^{-y} \right| = e^{-y} \)。 代入公式:\( f_ Y(y) = f_ X(e^{-y}) \cdot e^{-y} = 1 \cdot e^{-y} = e^{-y} \),对于 \( y > 0 \)(因为当 \( y>0 \) 时,\( x=e^{-y} \in (0,1) \),此时 \( f_ X(x)=1 \))。结果与 CDF 法一致。 多元随机变量的变换(雅可比行列式) 此概念可推广到多个随机变量的情形。设有一个随机向量 \( \mathbf{X} = (X_ 1, ..., X_ n) \),其联合概率密度函数为 \( f_ {\mathbf{X}}(\mathbf{x}) \)。考虑变换 \( \mathbf{Y} = g(\mathbf{X}) \),即 \( (Y_ 1, ..., Y_ n) = (g_ 1(X_ 1,...,X_ n), ..., g_ n(X_ 1,...,X_ n)) \)。 核心工具 :雅可比行列式。假设变换 \( g \) 是从 \( \mathbb{R}^n \) 到 \( \mathbb{R}^n \) 的一一映射(可逆),且可微。雅可比矩阵 \( J \) 是一个 n×n 矩阵,其第 (i, j) 元素为 \( \frac{\partial y_ i}{\partial x_ j} \)。雅可比行列式 \( |J| \) 是这个矩阵的行列式。 变换公式 :变换后向量 \( \mathbf{Y} \) 的联合概率密度函数为: \( f_ {\mathbf{Y}}(\mathbf{y}) = f_ {\mathbf{X}}(g^{-1}(\mathbf{y})) \cdot \left| J^{-1} \right| \)。 其中 \( J^{-1} \) 是反函数 \( g^{-1} \) 的雅可比矩阵,其行列式 \( |J^{-1}| \) 是原雅可比行列式 \( |J| \) 的倒数,即 \( |J^{-1}| = 1 / |J| \)。因此公式也常写作 \( f_ {\mathbf{Y}}(\mathbf{y}) = f_ {\mathbf{X}}(\mathbf{x}) \cdot \left| \frac{\partial \mathbf{x}}{\partial \mathbf{y}} \right| \)。 例子 :极坐标变换。设 \( (X, Y) \) 是平面上的点,已知其联合 PDF \( f_ {XY}(x, y) \)。变换为极坐标:\( R = \sqrt{X^2 + Y^2} \),\( \Theta = \arctan(Y/X) \)。其反变换为 \( X = R\cos\Theta \),\( Y = R\sin\Theta \)。计算反变换的雅可比行列式: \( J = \begin{vmatrix} \frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta} \\ \frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta} \end{vmatrix} = \begin{vmatrix} \cos\theta & -r\sin\theta \\ \sin\theta & r\cos\theta \end{vmatrix} = r\cos^2\theta + r\sin^2\theta = r \)。 因此,\( (R, \Theta) \) 的联合 PDF 为 \( f_ {R\Theta}(r, \theta) = f_ {XY}(r\cos\theta, r\sin\theta) \cdot r \),其中 \( r \ge 0, 0 \le \theta < 2\pi \)。这个额外的因子 \( r \) 在二维模拟和积分中至关重要。