随机变量的矩生成函数

字数 2700 2025-10-30 08:32:53

随机变量的矩生成函数

我们来学习概率论中一个非常强大的工具：矩生成函数。它提供了一种统一的方法来研究随机变量的所有矩，并且在许多高级问题中非常有效。

第一步：矩生成函数的定义

设 \(X\) 是一个随机变量。它的矩生成函数（Moment Generating Function, MGF）定义为函数 \(M_X(t)\)：

\[M_X(t) = E[e^{tX}] \]

其中，\(E[\cdot]\) 表示期望，\(t\) 是一个实数。这个期望值可能并不总是存在；它存在的条件是存在一个包含零的开区间 \((-h, h)\)（其中 \(h > 0\)），使得对于该区间内的所有 \(t\)，期望 \(E[e^{tX}]\) 都是有限的。

第二步：矩生成函数与矩的关系

“矩生成函数”这个名字的由来，是因为它可以用来“生成”随机变量的所有矩。随机变量 \(X\) 的 \(k\) 阶矩定义为 \(E[X^k]\)。

矩生成函数与矩的关系如下：对矩生成函数 \(M_X(t)\) 在 \(t=0\) 处求 \(k\) 阶导数，可以得到 \(k\) 阶矩：

\[E[X^k] = M_X^{(k)}(0) \]

这里，\(M_X^{(k)}(0)\) 表示 \(M_X(t)\) 在 \(t=0\) 处的 \(k\) 阶导数。

推导思路：
根据定义，\(M_X(t) = E[e^{tX}]\)。在满足一定正则性条件（如可交换期望和求导顺序）下，我们有：

\[\frac{d}{dt} M_X(t) = \frac{d}{dt} E[e^{tX}] = E[\frac{d}{dt} e^{tX}] = E[X e^{tX}] \]

令 \(t=0\)，得到 \(M_X'(0) = E[X]\)。
类似地，求二阶导：

\[\frac{d^2}{dt^2} M_X(t) = E[X^2 e^{tX}] \]

令 \(t=0\)，得到 \(M_X''(0) = E[X^2]\)。
以此类推，即可得到上述关系。

第三步：矩生成函数的性质

矩生成函数有几个关键性质，使其成为一个强有力的工具：

唯一性定理：如果两个随机变量的矩生成函数在包含零的某个开区间内相等，那么它们服从相同的概率分布。这是矩生成函数最强大的性质之一，它意味着分布函数由其矩生成函数唯一确定。
线性变换：设 \(Y = aX + b\)（其中 \(a, b\) 是常数），则 \(Y\) 的矩生成函数为：

\[ M_Y(t) = E[e^{t(aX+b)}] = e^{tb} E[e^{(ta)X}] = e^{tb} M_X(at) \]

独立随机变量之和：如果 \(X\) 和 \(Y\) 是相互独立的随机变量，那么它们的和 \(Z = X + Y\) 的矩生成函数是它们各自矩生成函数的乘积：

\[ M_Z(t) = E[e^{t(X+Y)}] = E[e^{tX} e^{tY}] = E[e^{tX}] E[e^{tY}] = M_X(t) M_Y(t) \]

这个性质在推导独立同分布随机变量和的分布时极其有用。

第四步：一个计算示例——正态分布

让我们以标准正态分布 \(X \sim N(0, 1)\) 为例来计算其矩生成函数。

其概率密度函数为 \(f(x) = \frac{1}{\sqrt{2\pi}} e^{-x^2/2}\)。

\[M_X(t) = E[e^{tX}] = \int_{-\infty}^{\infty} e^{tx} \frac{1}{\sqrt{2\pi}} e^{-x^2/2} dx = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{\infty} e^{tx - x^2/2} dx \]

对指数部分进行配方：

\[tx - \frac{x^2}{2} = -\frac{1}{2}(x^2 - 2tx) = -\frac{1}{2}[(x - t)^2 - t^2] = -\frac{1}{2}(x-t)^2 + \frac{t^2}{2} \]

代入积分：

\[M_X(t) = \frac{1}{\sqrt{2\pi}} e^{t^2/2} \int_{-\infty}^{\infty} e^{-\frac{1}{2}(x-t)^2} dx \]

注意到积分号内的函数是均值为 \(t\)、方差为 1 的正态分布密度函数的核（只差归一化常数 \(\frac{1}{\sqrt{2\pi}}\)），所以整个积分等于 \(\sqrt{2\pi}\)。
因此，

\[M_X(t) = \frac{1}{\sqrt{2\pi}} e^{t^2/2} \cdot \sqrt{2\pi} = e^{t^2/2} \]

现在，我们可以利用它来求矩。例如，求均值 \(E[X]\)：

\[M_X'(t) = \frac{d}{dt}(e^{t^2/2}) = t e^{t^2/2}, \quad 所以 E[X] = M_X'(0) = 0 \]

求方差需要二阶矩：

\[M_X''(t) = \frac{d}{dt}(t e^{t^2/2}) = e^{t^2/2} + t^2 e^{t^2/2}, \quad 所以 E[X^2] = M_X''(0) = 1 \]

方差 \(Var(X) = E[X^2] - (E[X])^2 = 1 - 0 = 1\)，与定义一致。

第五步：矩生成函数的适用性与局限性

优点：
- 统一处理矩：可以方便地求出所有阶的矩。
- 处理独立和：独立随机变量和的矩生成函数是乘积形式，易于操作。
- 唯一确定性：唯一性定理是证明分布相等性的有力工具。
局限性：
可能不存在：矩生成函数并非对所有随机变量和所有 \(t\) 都存在。例如，柯西分布就不存在矩生成函数（因为其各阶矩本身就不有限）。
在这种情况下，我们通常会使用另一个叫做特征函数的工具，它总是存在，并且具有许多与矩生成函数相似的性质。特征函数定义为 \(\phi_X(t) = E[e^{itX}]\)，其中 \(i\) 是虚数单位。

随机变量的矩生成函数我们来学习概率论中一个非常强大的工具：矩生成函数。它提供了一种统一的方法来研究随机变量的所有矩，并且在许多高级问题中非常有效。第一步：矩生成函数的定义设 \( X \) 是一个随机变量。它的矩生成函数（Moment Generating Function, MGF）定义为函数 \( M_ X(t) \)： \[ M_ X(t) = E[ e^{tX} ] \] 其中，\( E[ \cdot] \) 表示期望，\( t \) 是一个实数。这个期望值可能并不总是存在；它存在的条件是存在一个包含零的开区间 \( (-h, h) \)（其中 \( h > 0 \)），使得对于该区间内的所有 \( t \)，期望 \( E[ e^{tX} ] \) 都是有限的。第二步：矩生成函数与矩的关系 “矩生成函数”这个名字的由来，是因为它可以用来“生成”随机变量的所有矩。随机变量 \( X \) 的 \( k \) 阶矩定义为 \( E[ X^k ] \)。矩生成函数与矩的关系如下：对矩生成函数 \( M_ X(t) \) 在 \( t=0 \) 处求 \( k \) 阶导数，可以得到 \( k \) 阶矩： \[ E[ X^k] = M_ X^{(k)}(0) \] 这里，\( M_ X^{(k)}(0) \) 表示 \( M_ X(t) \) 在 \( t=0 \) 处的 \( k \) 阶导数。推导思路：根据定义，\( M_ X(t) = E[ e^{tX} ] \)。在满足一定正则性条件（如可交换期望和求导顺序）下，我们有： \[ \frac{d}{dt} M_ X(t) = \frac{d}{dt} E[ e^{tX}] = E[ \frac{d}{dt} e^{tX}] = E[ X e^{tX} ] \] 令 \( t=0 \)，得到 \( M_ X'(0) = E[ X ] \)。类似地，求二阶导： \[ \frac{d^2}{dt^2} M_ X(t) = E[ X^2 e^{tX} ] \] 令 \( t=0 \)，得到 \( M_ X''(0) = E[ X^2 ] \)。以此类推，即可得到上述关系。第三步：矩生成函数的性质矩生成函数有几个关键性质，使其成为一个强有力的工具：唯一性定理：如果两个随机变量的矩生成函数在包含零的某个开区间内相等，那么它们服从相同的概率分布。这是矩生成函数最强大的性质之一，它意味着分布函数由其矩生成函数唯一确定。线性变换：设 \( Y = aX + b \)（其中 \( a, b \) 是常数），则 \( Y \) 的矩生成函数为： \[ M_ Y(t) = E[ e^{t(aX+b)}] = e^{tb} E[ e^{(ta)X}] = e^{tb} M_ X(at) \] 独立随机变量之和：如果 \( X \) 和 \( Y \) 是相互独立的随机变量，那么它们的和 \( Z = X + Y \) 的矩生成函数是它们各自矩生成函数的乘积： \[ M_ Z(t) = E[ e^{t(X+Y)}] = E[ e^{tX} e^{tY}] = E[ e^{tX}] E[ e^{tY}] = M_ X(t) M_ Y(t) \] 这个性质在推导独立同分布随机变量和的分布时极其有用。第四步：一个计算示例——正态分布让我们以标准正态分布 \( X \sim N(0, 1) \) 为例来计算其矩生成函数。其概率密度函数为 \( f(x) = \frac{1}{\sqrt{2\pi}} e^{-x^2/2} \)。 \[ M_ X(t) = E[ e^{tX}] = \int_ {-\infty}^{\infty} e^{tx} \frac{1}{\sqrt{2\pi}} e^{-x^2/2} dx = \frac{1}{\sqrt{2\pi}} \int_ {-\infty}^{\infty} e^{tx - x^2/2} dx \] 对指数部分进行配方： \[ tx - \frac{x^2}{2} = -\frac{1}{2}(x^2 - 2tx) = -\frac{1}{2}[ (x - t)^2 - t^2 ] = -\frac{1}{2}(x-t)^2 + \frac{t^2}{2} \] 代入积分： \[ M_ X(t) = \frac{1}{\sqrt{2\pi}} e^{t^2/2} \int_ {-\infty}^{\infty} e^{-\frac{1}{2}(x-t)^2} dx \] 注意到积分号内的函数是均值为 \( t \)、方差为 1 的正态分布密度函数的核（只差归一化常数 \( \frac{1}{\sqrt{2\pi}} \)），所以整个积分等于 \( \sqrt{2\pi} \)。因此， \[ M_ X(t) = \frac{1}{\sqrt{2\pi}} e^{t^2/2} \cdot \sqrt{2\pi} = e^{t^2/2} \] 现在，我们可以利用它来求矩。例如，求均值 \( E[ X ] \)： \[ M_ X'(t) = \frac{d}{dt}(e^{t^2/2}) = t e^{t^2/2}, \quad 所以 E[ X] = M_ X'(0) = 0 \] 求方差需要二阶矩： \[ M_ X''(t) = \frac{d}{dt}(t e^{t^2/2}) = e^{t^2/2} + t^2 e^{t^2/2}, \quad 所以 E[ X^2] = M_ X''(0) = 1 \] 方差 \( Var(X) = E[ X^2] - (E[ X ])^2 = 1 - 0 = 1 \)，与定义一致。第五步：矩生成函数的适用性与局限性优点：统一处理矩：可以方便地求出所有阶的矩。处理独立和：独立随机变量和的矩生成函数是乘积形式，易于操作。唯一确定性：唯一性定理是证明分布相等性的有力工具。局限性：可能不存在：矩生成函数并非对所有随机变量和所有 \( t \) 都存在。例如，柯西分布就不存在矩生成函数（因为其各阶矩本身就不有限）。在这种情况下，我们通常会使用另一个叫做特征函数的工具，它总是存在，并且具有许多与矩生成函数相似的性质。特征函数定义为 \( \phi_ X(t) = E[ e^{itX} ] \)，其中 \( i \) 是虚数单位。