随机变量的变换的指数族分布方法
第一步:指数族分布的基本定义
指数族分布是一类重要的概率分布,其概率密度函数(或概率质量函数)可以写成以下形式:
\[f(x \mid \boldsymbol{\theta}) = h(x) \exp\left( \boldsymbol{\eta}(\boldsymbol{\theta})^\top \mathbf{T}(x) - A(\boldsymbol{\theta}) \right) \]
其中:
- \(\boldsymbol{\theta}\) 是自然参数(可能为向量);
- \(\mathbf{T}(x)\) 是充分统计量(函数);
- \(\boldsymbol{\eta}(\boldsymbol{\theta})\) 将自然参数映射到标准形式;
- \(h(x)\) 是基准测度(非负函数);
- \(A(\boldsymbol{\theta})\) 是对数配分函数,确保概率归一化。
第二步:常见分布的指数族形式示例
- 高斯分布(均值为 \(\mu\),方差固定为 \(\sigma^2\)):
\[ f(x \mid \mu) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left( -\frac{(x-\mu)^2}{2\sigma^2} \right) \]
可改写为:
\[ f(x \mid \mu) = \exp\left( \frac{\mu}{\sigma^2} x - \frac{x^2}{2\sigma^2} - \frac{\mu^2}{2\sigma^2} - \frac{1}{2} \ln(2\pi\sigma^2) \right) \]
此时 \(\eta(\mu) = \mu/\sigma^2\),\(T(x) = x\),\(A(\mu) = \mu^2/(2\sigma^2)\)。
- 伯努利分布(参数 \(p\)):
\[ f(x \mid p) = p^x (1-p)^{1-x} = \exp\left( x \ln\frac{p}{1-p} + \ln(1-p) \right) \]
此时 \(\eta(p) = \ln(p/(1-p))\),\(T(x) = x\),\(A(p) = -\ln(1-p)\)。
第三步:指数族分布的性质
- 充分统计量:\(\mathbf{T}(x)\) 包含关于参数 \(\boldsymbol{\theta}\) 的全部信息;
- 矩生成性质:对数配分函数 \(A(\boldsymbol{\theta})\) 的导数给出充分统计量的矩:
\[ \mathbb{E}[\mathbf{T}(x)] = \nabla A(\boldsymbol{\theta}), \quad \text{Var}[\mathbf{T}(x)] = \nabla^2 A(\boldsymbol{\theta}) \]
- 共轭先验:在贝叶斯统计中,指数族分布的共轭先验仍属于指数族。
第四步:随机变量变换与指数族分布的关系
若随机变量 \(X\) 服从指数族分布,且定义 \(Y = g(X)\)(\(g\) 为可逆光滑函数),则 \(Y\) 的分布可能不再属于指数族。但以下情况例外:
- 仿射变换:若 \(Y = aX + b\)(\(a \neq 0\)),且 \(X\) 服从指数族分布,则 \(Y\) 的分布仍为指数族形式,仅需调整参数和充分统计量。
- 充分统计量的变换:若变换作用于参数空间或充分统计量,可能通过重新参数化保持指数族结构。
第五步:应用场景
- 广义线性模型(GLM):利用指数族分布统一处理回归问题(如逻辑回归、泊松回归);
- 变分推断:指数族分布是变分近似中常用分布族;
- 信息几何:指数族分布形成统计流形,其几何结构由 Fisher 信息度量。
总结:指数族分布通过统一数学框架涵盖众多常见分布,其性质简化了统计推断与变换分析。理解其结构有助于处理更复杂的随机变量变换问题。