随机变量的变换的雅可比行列式
好的,我们开始学习“随机变量的变换的雅可比行列式”。这是一个在概率论中处理多维随机变量变换时至关重要的工具。
第一步:回顾问题——为什么需要雅可比行列式?
想象一个简单的情景:我们已知两个随机变量 \(X\) 和 \(Y\) 的联合概率密度函数 \(f_{X,Y}(x, y)\)。现在,我们通过某种变换得到了两个新的随机变量 \(U\) 和 \(V\),例如:
\[U = g_1(X, Y), \quad V = g_2(X, Y) \]
我们的目标是求出新随机变量 \(U\) 和 \(V\) 的联合概率密度函数 \(f_{U,V}(u, v)\)。
在一维情况下(即单个随机变量的变换),我们有公式:如果 \(Y = g(X)\),且 \(g\) 是单调可逆函数,那么
\[f_Y(y) = f_X(x) \left| \frac{dx}{dy} \right| = f_X(g^{-1}(y)) \left| \frac{d}{dy} g^{-1}(y) \right| \]
这里的导数项 \(\left| \frac{dx}{dy} \right|\) 起到了“缩放因子”的作用,它补偿了因变量变换而导致概率密度在微小区间上的伸缩。
第二步:将思路推广到多维空间
在二维或更高维的空间中,变换同样会导致区域的“拉伸”或“压缩”,但不再是一个简单的导数可以描述。我们需要一个能衡量多维空间中进行变量变换时,局部体积变化率的量。这个量就是雅可比行列式。
对于一个从 \((x, y)\) 到 \((u, v)\) 的变换,假设变换是可逆的(即存在反函数 \(X = h_1(U, V), Y = h_2(U, V)\)),并且函数是连续可微的。这个变换的雅可比矩阵 \(J\) 定义为:
\[J = \begin{bmatrix} \frac{\partial u}{\partial x} & \frac{\partial u}{\partial y} \\ \frac{\partial v}{\partial x} & \frac{\partial v}{\partial y} \end{bmatrix} \]
然而,在概率论中,我们更常用的是其反函数变换的雅可比行列式。即,我们用 \(u, v\) 来表示 \(x, y\):
\[x = h_1(u, v), \quad y = h_2(u, v) \]
这个反函数变换的雅可比矩阵是:
\[J = \begin{bmatrix} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \end{bmatrix} \]
这个矩阵的行列式的绝对值,就是我们要的雅可比行列式,记作 \(|J|\):
\[|J| = \left| \det \begin{bmatrix} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \end{bmatrix} \right| \]
这个 \(|J|\) 的几何意义是:当从 \((u, v)\) 空间映射回 \((x, y)\) 空间时,一个微小的矩形区域面积的变化倍数。
第三步:得出核心公式
利用这个雅可比行列式,我们可以写出从 \((X, Y)\) 到 \((U, V)\) 变换后的联合概率密度函数公式:
\[f_{U,V}(u, v) = f_{X,Y}(x, y) \cdot |J| = f_{X,Y}\left( h_1(u, v), h_2(u, v) \right) \cdot \left| \det \begin{bmatrix} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \end{bmatrix} \right| \]
核心要点:
- 找到反函数:必须用新变量 \(u, v\) 来表示旧变量 \(x, y\)。
- 计算雅可比行列式:计算这个反函数变换的雅可比矩阵的行列式。
- 取绝对值:概率密度必须为非负,所以取行列式的绝对值。
- 代入原联合密度:将用 \(u, v\) 表示的 \(x, y\) 代入原来的联合密度函数 \(f_{X,Y}(x, y)\)。
- 相乘:将代入后的结果与雅可比行列式相乘。
第四步:一个简单的例子
假设 \(X\) 和 \(Y\) 是独立的随机变量,且 \(X, Y \sim \text{Uniform}(0, 1)\)。它们的联合概率密度函数为:
\[f_{X,Y}(x, y) = 1, \quad \text{当 } 0 \le x \le 1, 0 \le y \le 1 \]
现在我们定义变换:
\[U = X + Y, \quad V = X - Y \]
我们的目标是求 \(f_{U,V}(u, v)\)。
- 求反函数:
解方程组:
\[ u = x + y, \quad v = x - y \]
得到:
\[ x = \frac{u + v}{2}, \quad y = \frac{u - v}{2} \]
这就是反函数 \(X = h_1(U, V), Y = h_2(U, V)\)。
- 计算雅可比行列式:
构造雅可比矩阵并求其行列式:
\[ J = \begin{bmatrix} \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \\ \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \end{bmatrix} = \begin{bmatrix} \frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & -\frac{1}{2} \end{bmatrix} \]
\[ \det(J) = \left( \frac{1}{2} \right) \times \left( -\frac{1}{2} \right) - \left( \frac{1}{2} \right) \times \left( \frac{1}{2} \right) = -\frac{1}{4} - \frac{1}{4} = -\frac{1}{2} \]
取其绝对值: \(|J| = \frac{1}{2}\).
- 应用公式:
\[ f_{U,V}(u, v) = f_{X,Y}\left( \frac{u+v}{2}, \frac{u-v}{2} \right) \cdot |J| = 1 \cdot \frac{1}{2} = \frac{1}{2} \]
- 确定定义域(至关重要的一步!):
公式给出的结果是在变换后的有效区域内成立。我们需要找出在 \((u, v)\) 平面上,哪些点对应着原来 \((x, y)\) 在单位正方形 \([0,1] \times [0,1]\) 内的点。
由 \(x = (u+v)/2 \in [0,1]\) 和 \(y = (u-v)/2 \in [0,1]\),我们可以推导出 \(u, v\) 的取值范围。最终,\((U, V)\) 的联合密度函数为:
\[ f_{U,V}(u, v) = \begin{cases} \frac{1}{2}, & \text{如果 } (u, v) \text{ 在由直线 } v=u, v=-u, v=u-2, v=2-u \text{ 所围成的菱形区域内} \\ 0, & \text{其他} \end{cases} \]
总结:
雅可比行列式是多维随机变量变换中的核心工具,它精确地量化了变换引起的局部体积变化率,从而允许我们将概率密度从一个坐标系正确地转换到另一个坐标系。掌握它的关键在于:1)熟练求解反函数;2)正确计算行列式;3)仔细确定变换后的定义域。