随机变量的条件分布
条件分布是概率论中描述随机变量在给定其他随机变量取值时的概率分布。下面从基础概念开始,逐步深入讲解。
1. 条件概率的回顾
条件概率是条件分布的基础。对于事件 \(A\) 和 \(B\)(且 \(P(B) > 0\)),条件概率定义为:
\[P(A \mid B) = \frac{P(A \cap B)}{P(B)}. \]
这一公式描述了在 \(B\) 发生的条件下 \(A\) 发生的概率。
2. 离散随机变量的条件分布
设 \(X\) 和 \(Y\) 是离散随机变量,其联合概率质量函数为 \(P(X=x, Y=y)\)。对于满足 \(P(Y=y) > 0\) 的 \(y\),条件概率质量函数 定义为:
\[P(X=x \mid Y=y) = \frac{P(X=x, Y=y)}{P(Y=y)}. \]
- 对于固定的 \(y\),条件概率 \(P(X=x \mid Y=y)\) 是 \(x\) 的函数,满足概率公理(非负且和为1)。
- 条件分布的本质是:将联合分布限制在 \(Y=y\) 的子集中,并重新归一化。
3. 连续随机变量的条件分布
对于连续随机变量 \(X\) 和 \(Y\),联合概率密度函数为 \(f_{X,Y}(x,y)\),边缘密度为 \(f_Y(y) = \int_{-\infty}^{\infty} f_{X,Y}(x,y) \, dx\)。若 \(f_Y(y) > 0\),条件概率密度函数 定义为:
\[f_{X \mid Y}(x \mid y) = \frac{f_{X,Y}(x,y)}{f_Y(y)}. \]
- 条件密度函数 \(f_{X \mid Y}(x \mid y)\) 是 \(x\) 的函数,且满足 \(\int_{-\infty}^{\infty} f_{X \mid Y}(x \mid y) \, dx = 1\)。
- 注意:条件密度不是直接的概率,但用于计算条件概率,例如:
\[P(X \in A \mid Y=y) = \int_A f_{X \mid Y}(x \mid y) \, dx. \]
4. 条件分布函数
条件分布函数定义为条件概率的累积形式:
- 离散情形: \(F_{X \mid Y}(x \mid y) = \sum_{t \leq x} P(X=t \mid Y=y)\)。
- 连续情形: \(F_{X \mid Y}(x \mid y) = \int_{-\infty}^{x} f_{X \mid Y}(t \mid y) \, dt\)。
5. 条件期望
条件期望是条件分布的均值,定义为:
- 离散情形: \(E[X \mid Y=y] = \sum_x x \cdot P(X=x \mid Y=y)\)。
- 连续情形: \(E[X \mid Y=y] = \int_{-\infty}^{\infty} x f_{X \mid Y}(x \mid y) \, dx\)。
- 条件期望 \(E[X \mid Y]\) 本身是一个随机变量(关于 \(Y\) 的函数),满足全期望公式: \(E[E[X \mid Y]] = E[X]\)。
6. 条件方差公式
条件方差描述条件分布内的波动性:
\[\operatorname{Var}(X \mid Y) = E[X^2 \mid Y] - (E[X \mid Y])^2. \]
方差分解公式(Law of Total Variance)将总体方差分解为:
\[\operatorname{Var}(X) = E[\operatorname{Var}(X \mid Y)] + \operatorname{Var}(E[X \mid Y]). \]
- 第一项是条件方差的平均,反映随机性;第二项是条件期望的方差,反映系统性差异。
7. 条件分布与独立性
若 \(X\) 与 \(Y\) 独立,则条件分布退化为边缘分布:
\[f_{X \mid Y}(x \mid y) = f_X(x), \quad P(X=x \mid Y=y) = P(X=x). \]
独立性可通过条件分布验证。
8. 应用示例
- 贝叶斯推断:用条件分布更新先验概率(如 \(P(\theta \mid \text{数据})\))。
- 回归分析:条件期望 \(E[Y \mid X]\) 是最小均方误差预测器。
- 随机过程:马尔可夫链的转移概率本质是条件分布。
总结
条件分布将概率分析聚焦于部分信息(如 \(Y=y\)),是处理不确定性和依赖关系的核心工具。通过条件概率密度、条件期望和条件方差,可以深入理解随机变量间的动态关系。