随机变量的矩生成函数
字数 2700 2025-10-30 08:32:53

随机变量的矩生成函数

我们来学习概率论中一个非常强大的工具:矩生成函数。它提供了一种统一的方法来研究随机变量的所有矩,并且在许多高级问题中非常有效。

第一步:矩生成函数的定义

\(X\) 是一个随机变量。它的矩生成函数(Moment Generating Function, MGF)定义为函数 \(M_X(t)\)

\[M_X(t) = E[e^{tX}] \]

其中,\(E[\cdot]\) 表示期望,\(t\) 是一个实数。这个期望值可能并不总是存在;它存在的条件是存在一个包含零的开区间 \((-h, h)\)(其中 \(h > 0\)),使得对于该区间内的所有 \(t\),期望 \(E[e^{tX}]\) 都是有限的。

第二步:矩生成函数与矩的关系

“矩生成函数”这个名字的由来,是因为它可以用来“生成”随机变量的所有矩。随机变量 \(X\)\(k\) 阶矩定义为 \(E[X^k]\)

矩生成函数与矩的关系如下:对矩生成函数 \(M_X(t)\)\(t=0\) 处求 \(k\) 阶导数,可以得到 \(k\) 阶矩:

\[E[X^k] = M_X^{(k)}(0) \]

这里,\(M_X^{(k)}(0)\) 表示 \(M_X(t)\)\(t=0\) 处的 \(k\) 阶导数。

推导思路
根据定义,\(M_X(t) = E[e^{tX}]\)。在满足一定正则性条件(如可交换期望和求导顺序)下,我们有:

\[\frac{d}{dt} M_X(t) = \frac{d}{dt} E[e^{tX}] = E[\frac{d}{dt} e^{tX}] = E[X e^{tX}] \]

\(t=0\),得到 \(M_X'(0) = E[X]\)
类似地,求二阶导:

\[\frac{d^2}{dt^2} M_X(t) = E[X^2 e^{tX}] \]

\(t=0\),得到 \(M_X''(0) = E[X^2]\)
以此类推,即可得到上述关系。

第三步:矩生成函数的性质

矩生成函数有几个关键性质,使其成为一个强有力的工具:

  1. 唯一性定理:如果两个随机变量的矩生成函数在包含零的某个开区间内相等,那么它们服从相同的概率分布。这是矩生成函数最强大的性质之一,它意味着分布函数由其矩生成函数唯一确定。

  2. 线性变换:设 \(Y = aX + b\)(其中 \(a, b\) 是常数),则 \(Y\) 的矩生成函数为:

\[ M_Y(t) = E[e^{t(aX+b)}] = e^{tb} E[e^{(ta)X}] = e^{tb} M_X(at) \]

  1. 独立随机变量之和:如果 \(X\)\(Y\) 是相互独立的随机变量,那么它们的和 \(Z = X + Y\) 的矩生成函数是它们各自矩生成函数的乘积:

\[ M_Z(t) = E[e^{t(X+Y)}] = E[e^{tX} e^{tY}] = E[e^{tX}] E[e^{tY}] = M_X(t) M_Y(t) \]

这个性质在推导独立同分布随机变量和的分布时极其有用。

第四步:一个计算示例——正态分布

让我们以标准正态分布 \(X \sim N(0, 1)\) 为例来计算其矩生成函数。

其概率密度函数为 \(f(x) = \frac{1}{\sqrt{2\pi}} e^{-x^2/2}\)

\[M_X(t) = E[e^{tX}] = \int_{-\infty}^{\infty} e^{tx} \frac{1}{\sqrt{2\pi}} e^{-x^2/2} dx = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} e^{tx - x^2/2} dx \]

对指数部分进行配方:

\[tx - \frac{x^2}{2} = -\frac{1}{2}(x^2 - 2tx) = -\frac{1}{2}[(x - t)^2 - t^2] = -\frac{1}{2}(x-t)^2 + \frac{t^2}{2} \]

代入积分:

\[M_X(t) = \frac{1}{\sqrt{2\pi}} e^{t^2/2} \int_{-\infty}^{\infty} e^{-\frac{1}{2}(x-t)^2} dx \]

注意到积分号内的函数是均值为 \(t\)、方差为 1 的正态分布密度函数的核(只差归一化常数 \(\frac{1}{\sqrt{2\pi}}\)),所以整个积分等于 \(\sqrt{2\pi}\)
因此,

\[M_X(t) = \frac{1}{\sqrt{2\pi}} e^{t^2/2} \cdot \sqrt{2\pi} = e^{t^2/2} \]

现在,我们可以利用它来求矩。例如,求均值 \(E[X]\)

\[M_X'(t) = \frac{d}{dt}(e^{t^2/2}) = t e^{t^2/2}, \quad 所以 E[X] = M_X'(0) = 0 \]

求方差需要二阶矩:

\[M_X''(t) = \frac{d}{dt}(t e^{t^2/2}) = e^{t^2/2} + t^2 e^{t^2/2}, \quad 所以 E[X^2] = M_X''(0) = 1 \]

方差 \(Var(X) = E[X^2] - (E[X])^2 = 1 - 0 = 1\),与定义一致。

第五步:矩生成函数的适用性与局限性

  • 优点

    • 统一处理矩:可以方便地求出所有阶的矩。
    • 处理独立和:独立随机变量和的矩生成函数是乘积形式,易于操作。
    • 唯一确定性:唯一性定理是证明分布相等性的有力工具。
  • 局限性

  • 可能不存在:矩生成函数并非对所有随机变量和所有 \(t\) 都存在。例如,柯西分布就不存在矩生成函数(因为其各阶矩本身就不有限)。

  • 在这种情况下,我们通常会使用另一个叫做特征函数的工具,它总是存在,并且具有许多与矩生成函数相似的性质。特征函数定义为 \(\phi_X(t) = E[e^{itX}]\),其中 \(i\) 是虚数单位。

随机变量的矩生成函数 我们来学习概率论中一个非常强大的工具:矩生成函数。它提供了一种统一的方法来研究随机变量的所有矩,并且在许多高级问题中非常有效。 第一步:矩生成函数的定义 设 \( X \) 是一个随机变量。它的矩生成函数(Moment Generating Function, MGF)定义为函数 \( M_ X(t) \): \[ M_ X(t) = E[ e^{tX} ] \] 其中,\( E[ \cdot] \) 表示期望,\( t \) 是一个实数。这个期望值可能并不总是存在;它存在的条件是存在一个包含零的开区间 \( (-h, h) \)(其中 \( h > 0 \)),使得对于该区间内的所有 \( t \),期望 \( E[ e^{tX} ] \) 都是有限的。 第二步:矩生成函数与矩的关系 “矩生成函数”这个名字的由来,是因为它可以用来“生成”随机变量的所有矩。随机变量 \( X \) 的 \( k \) 阶矩定义为 \( E[ X^k ] \)。 矩生成函数与矩的关系如下:对矩生成函数 \( M_ X(t) \) 在 \( t=0 \) 处求 \( k \) 阶导数,可以得到 \( k \) 阶矩: \[ E[ X^k] = M_ X^{(k)}(0) \] 这里,\( M_ X^{(k)}(0) \) 表示 \( M_ X(t) \) 在 \( t=0 \) 处的 \( k \) 阶导数。 推导思路 : 根据定义,\( M_ X(t) = E[ e^{tX} ] \)。在满足一定正则性条件(如可交换期望和求导顺序)下,我们有: \[ \frac{d}{dt} M_ X(t) = \frac{d}{dt} E[ e^{tX}] = E[ \frac{d}{dt} e^{tX}] = E[ X e^{tX} ] \] 令 \( t=0 \),得到 \( M_ X'(0) = E[ X ] \)。 类似地,求二阶导: \[ \frac{d^2}{dt^2} M_ X(t) = E[ X^2 e^{tX} ] \] 令 \( t=0 \),得到 \( M_ X''(0) = E[ X^2 ] \)。 以此类推,即可得到上述关系。 第三步:矩生成函数的性质 矩生成函数有几个关键性质,使其成为一个强有力的工具: 唯一性定理 :如果两个随机变量的矩生成函数在包含零的某个开区间内相等,那么它们服从相同的概率分布。这是矩生成函数最强大的性质之一,它意味着分布函数由其矩生成函数唯一确定。 线性变换 :设 \( Y = aX + b \)(其中 \( a, b \) 是常数),则 \( Y \) 的矩生成函数为: \[ M_ Y(t) = E[ e^{t(aX+b)}] = e^{tb} E[ e^{(ta)X}] = e^{tb} M_ X(at) \] 独立随机变量之和 :如果 \( X \) 和 \( Y \) 是相互独立的随机变量,那么它们的和 \( Z = X + Y \) 的矩生成函数是它们各自矩生成函数的乘积: \[ M_ Z(t) = E[ e^{t(X+Y)}] = E[ e^{tX} e^{tY}] = E[ e^{tX}] E[ e^{tY}] = M_ X(t) M_ Y(t) \] 这个性质在推导独立同分布随机变量和的分布时极其有用。 第四步:一个计算示例——正态分布 让我们以标准正态分布 \( X \sim N(0, 1) \) 为例来计算其矩生成函数。 其概率密度函数为 \( f(x) = \frac{1}{\sqrt{2\pi}} e^{-x^2/2} \)。 \[ M_ X(t) = E[ e^{tX}] = \int_ {-\infty}^{\infty} e^{tx} \frac{1}{\sqrt{2\pi}} e^{-x^2/2} dx = \frac{1}{\sqrt{2\pi}} \int_ {-\infty}^{\infty} e^{tx - x^2/2} dx \] 对指数部分进行配方: \[ tx - \frac{x^2}{2} = -\frac{1}{2}(x^2 - 2tx) = -\frac{1}{2}[ (x - t)^2 - t^2 ] = -\frac{1}{2}(x-t)^2 + \frac{t^2}{2} \] 代入积分: \[ M_ X(t) = \frac{1}{\sqrt{2\pi}} e^{t^2/2} \int_ {-\infty}^{\infty} e^{-\frac{1}{2}(x-t)^2} dx \] 注意到积分号内的函数是均值为 \( t \)、方差为 1 的正态分布密度函数的核(只差归一化常数 \( \frac{1}{\sqrt{2\pi}} \)),所以整个积分等于 \( \sqrt{2\pi} \)。 因此, \[ M_ X(t) = \frac{1}{\sqrt{2\pi}} e^{t^2/2} \cdot \sqrt{2\pi} = e^{t^2/2} \] 现在,我们可以利用它来求矩。例如,求均值 \( E[ X ] \): \[ M_ X'(t) = \frac{d}{dt}(e^{t^2/2}) = t e^{t^2/2}, \quad 所以 E[ X] = M_ X'(0) = 0 \] 求方差需要二阶矩: \[ M_ X''(t) = \frac{d}{dt}(t e^{t^2/2}) = e^{t^2/2} + t^2 e^{t^2/2}, \quad 所以 E[ X^2] = M_ X''(0) = 1 \] 方差 \( Var(X) = E[ X^2] - (E[ X ])^2 = 1 - 0 = 1 \),与定义一致。 第五步:矩生成函数的适用性与局限性 优点 : 统一处理矩 :可以方便地求出所有阶的矩。 处理独立和 :独立随机变量和的矩生成函数是乘积形式,易于操作。 唯一确定性 :唯一性定理是证明分布相等性的有力工具。 局限性 : 可能不存在 :矩生成函数并非对所有随机变量和所有 \( t \) 都存在。例如,柯西分布就不存在矩生成函数(因为其各阶矩本身就不有限)。 在这种情况下,我们通常会使用另一个叫做 特征函数 的工具,它总是存在,并且具有许多与矩生成函数相似的性质。特征函数定义为 \( \phi_ X(t) = E[ e^{itX} ] \),其中 \( i \) 是虚数单位。