随机规划中的分布鲁棒优化与φ-散度
-
基本概念引入
在传统随机规划中,我们假设不确定参数服从某个已知概率分布。然而实际中,真实分布往往难以精确获取。分布鲁棒优化通过考虑一个包含可能分布的集合(不确定集)来应对这一问题。φ-散度是衡量两个概率分布差异的工具,用于构造分布不确定集。 -
φ-散度的数学定义
设P和Q为同一可测空间上的两个概率分布,且P关于Q绝对连续。φ-散度定义为:
\(D_\phi(P\|Q) = \int \phi\left(\frac{dP}{dQ}\right) dQ\)
其中φ是凸函数,满足φ(1)=0。常见特例包括:- Kullback-Leibler散度(φ(t)=t log t)
- χ²散度(φ(t)=(t-1)²)
- Burg熵(φ(t)=-log t)
-
分布不确定集的构建
以参考分布\(Q\)为中心,用φ-散度构造球型不确定集:
\(\mathcal{U}_\epsilon(Q) = \{P \ll Q: D_\phi(P\|Q) \leq \epsilon \}\)
其中ε控制保守程度。该集合保留了分布的结构信息,且能通过共轭对偶转化为可计算形式。 -
分布鲁棒模型的对偶转化
考虑优化问题:
\(\min_x \sup_{P \in \mathcal{U}_\epsilon(Q)} \mathbb{E}_P[f(x,\xi)]\)
利用φ函数的共轭函数φ*,可证明其对偶形式等价于:
\(\min_x \inf_{\lambda \geq 0} \left\{ \lambda \epsilon + \mathbb{E}_Q\left[ \phi^*\left( \frac{f(x,\xi)-\eta}{\lambda} \right) \right] + \eta \right\}\)
这一转化将无限维问题简化为有限维优化。 -
实际计算策略
对偶问题可通过样本平均近似求解:- 从参考分布Q生成N个样本{ξ₁,...,ξ_N}
- 用蒙特卡洛估计期望项
- 结合随机梯度下降或顺序凸规划求解参数(x,λ,η)
计算复杂度与样本量线性相关,且具有渐近收敛保证。
-
应用场景与优势
该方法在金融风险管理、供应链优化中尤为有效:
- 投资组合优化中控制尾部风险
- 库存管理应对需求分布不确定性
- 与传统鲁棒优化相比,避免过度保守性
- 比单一分布假设的随机规划更稳健