条件期望
-
基本概念:从条件概率到条件期望
首先,我们回顾一下条件概率。事件A在事件B发生的条件下的概率,记为 P(A|B),其公式为 P(A|B) = P(A∩B) / P(B)。这个公式量化了在已知部分信息(B发生)后,我们对事件A发生可能性的重新评估。现在,我们将这个“在已知条件下重新评估”的思想应用到随机变量的平均值上。随机变量X的期望值E(X)是其所有可能取值以其概率为权重的加权平均,代表了X的“平均”水平或长期中心值。
条件期望,顾名思义,就是在已知某些信息(通常表示为另一个随机变量Y的取值或某个事件的发生)的条件下,随机变量X的期望值。我们将其记为 E(X|Y=y),其含义是:在已知随机变量Y取特定值y的前提下,X的平均值是多少。
-
离散型随机变量的条件期望计算
对于离散型随机变量,计算条件期望是直观的。假设我们有两个离散随机变量X和Y。- 步骤一:求条件概率分布
首先,对于给定的Y的某个特定取值y(且P(Y=y) > 0),我们计算X在Y=y这个条件下的条件概率分布。对于X的每一个可能取值x_i,其条件概率为:
P(X=x_i | Y=y) = P(X=x_i, Y=y) / P(Y=y) - 步骤二:按条件分布求期望
然后,我们就像计算普通期望一样,但使用的是条件概率而不是边缘概率。X在Y=y条件下的期望值为:
E(X|Y=y) = Σ [x_i * P(X=x_i | Y=y)]
这里的求和是针对X的所有可能取值x_i进行的。
举例说明:假设一个班级学生的数学成绩(X)和物理成绩(Y)的联合分布如下(为简化,成绩只有两个等级):
- P(X=高分, Y=高分) = 0.3
- P(X=高分, Y=低分) = 0.2
- P(X=低分, Y=高分) = 0.1
- P(X=低分, Y=低分) = 0.4
现在计算“已知物理考了高分的情况下,数学成绩的期望值”。我们先将成绩数值化,设“高分”为90分,“低分”为60分。
- 条件:Y=90。P(Y=90) = P(X=高,Y=高) + P(X=低,Y=高) = 0.3 + 0.1 = 0.4
- 条件概率分布:
P(X=90 | Y=90) = 0.3 / 0.4 = 0.75
P(X=60 | Y=90) = 0.1 / 0.4 = 0.25 - 条件期望:
E(X|Y=90) = 90 * 0.75 + 60 * 0.25 = 67.5 + 15 = 82.5
这意味着,在已知一个学生物理考了高分的前提下,我们预测他的数学平均成绩是82.5分。
- 步骤一:求条件概率分布
-
条件期望本身是一个随机变量
这是理解条件期望的一个关键飞跃。请注意,E(X|Y=y) 的值依赖于y的取值。对于每一个可能的y,我们都能算出一个对应的E(X|Y=y)。因此,我们可以定义一个新的函数g(Y): g(y) = E(X|Y=y)。由于Y是一个随机变量,那么g(Y) = E(X|Y) 也是一个随机变量!它的取值取决于Y的取值。在上面的例子中:
- 当Y=90时,E(X|Y)=82.5
- 当Y=60时,我们可以类似计算出 E(X|Y=60) = (900.2 + 600.4) / (0.2+0.4) = (18+24)/0.6 = 70
因此,E(X|Y) 是一个随机变量,它以0.4的概率取值为82.5,以0.6的概率取值为70。
-
条件期望的重要性质:迭代期望定律
迭代期望定律是条件期望中最重要和最实用的性质之一。它的表述如下:
E[X] = E[ E(X|Y) ]
用文字描述就是:随机变量X的无条件期望,等于其条件期望 E(X|Y) 再求期望。这个性质非常直观:X的整体平均值,应该等于在各种不同条件(Y的不同取值)下的条件平均值的再次平均,而这个“再次平均”的权重就是各种条件发生的概率。
验证上面的例子:
- X的无条件期望E(X):
P(X=90) = 0.3+0.2=0.5, P(X=60)=0.1+0.4=0.5
E(X) = 900.5 + 600.5 = 75 - E(X|Y) 的期望 E[E(X|Y)]:
E(X|Y) 以概率0.4取82.5,以概率0.6取70。
E[E(X|Y)] = 82.5 * 0.4 + 70 * 0.6 = 33 + 42 = 75
结果确实相等。这个定律在理论推导和复杂计算中极其有用,它允许我们通过“分情况讨论”(条件化)来简化问题。
- X的无条件期望E(X):
-
连续型随机变量的条件期望
对于连续型随机变量,思想完全一致,只是将概率质量函数替换为概率密度函数,求和替换为积分。- 在给定Y=y的条件下,X的条件概率密度函数为: f_{X|Y}(x|y) = f_{X,Y}(x,y) / f_Y(y),其中f_Y(y) > 0。
- 条件期望定义为: E(X|Y=y) = ∫ x * f_{X|Y}(x|y) dx (积分在整个X的定义域上进行)。
同样,E(X|Y) 是一个关于Y的随机变量,并且迭代期望定律 E[X] = E[E(X|Y)] 依然成立。
总结:条件期望 E(X|Y) 是在已知另一个随机变量Y的信息后,对X的期望值的最佳预测。它本身也是一个随机变量,其波动性反映了我们所掌握信息Y的不确定性。迭代期望定律连接了条件期望与无条件期望,是概率论中一个强大而优雅的工具。