拉格朗日对偶在非线性规划中的应用
我将为您系统讲解“拉格朗日对偶”在非线性规划中的核心知识,从基本概念到深层应用,循序渐进展开。
第一步:理解原问题与拉格朗日函数
考虑一个标准的非线性规划原问题(Primal Problem):
最小化 f(x)
满足约束:g_i(x) ≤ 0, i = 1, ..., m
以及 h_j(x) = 0, j = 1, ..., p
其中 x ∈ R^n 是决策变量,f 是目标函数,g_i 是不等式约束函数,h_j 是等式约束函数。
为了处理这些约束,我们引入拉格朗日函数:
L(x, λ, ν) = f(x) + Σ_{i=1}^m λ_i g_i(x) + Σ_{j=1}^p ν_j h_j(x)
这里 λ_i ≥ 0 是不等式约束的拉格朗日乘子(也称为对偶变量),ν_j 是等式约束的拉格朗日乘子。这个函数将约束惩罚整合到目标中,λ_i 和 ν_j 可视为违反约束的“价格”。
第二步:从拉格朗日函数到拉格朗日对偶函数
定义拉格朗日对偶函数 d(λ, ν) 为拉格朗日函数关于原变量 x 的下确界:
d(λ, ν) = inf_{x ∈ D} L(x, λ, ν)
其中 D 是 f、g_i、h_j 定义域的交集(通常为 R^n)。
关键性质:
- 对偶函数是凹函数:即使原问题非凸,d(λ, ν) 作为关于 (λ, ν) 的仿射函数的逐点下确界,始终是凹函数。
- 对任意 λ ≥ 0 和任意 ν,有 d(λ, ν) ≤ p^,其中 p^ 是原问题的最优值。这称为弱对偶性。
第三步:构建拉格朗日对偶问题
基于对偶函数,我们形成拉格朗日对偶问题(Dual Problem):
最大化 d(λ, ν)
满足约束:λ ≥ 0
这是一个凸优化问题(因为最大化凹函数等价于最小化凸函数),记其对偶最优值为 d^*。
弱对偶性给出 d^* ≤ p^,即使原问题非凸也成立。差值 p^ - d^* 称为对偶间隙。
第四步:强对偶性与斯莱特条件
当对偶间隙为零(即 d^* = p^*)时,称强对偶成立。强对偶允许通过对偶问题精确求解原问题。
对于凸问题(f 和 g_i 凸,h_j 仿射),强对偶通常成立,但需满足约束规格。最常用的是斯莱特条件:存在一点 x 使得 g_i(x) < 0 对所有不等式约束成立,且 h_j(x) = 0 对所有等式约束成立(称为严格可行点)。若斯莱特条件满足,则强对偶成立,且对偶问题可达最优(存在最优乘子)。
第五步:互补松弛条件与 KKT 条件
若强对偶成立且原对偶最优值可达,设 x^* 是原问题最优解,(λ^, ν^) 是对偶问题最优解,则它们满足 Karush-Kuhn-Tucker (KKT) 条件:
- 原始可行性:g_i(x^) ≤ 0, h_j(x^) = 0
- 对偶可行性:λ_i^* ≥ 0
- 稳定性:∇f(x^) + Σ λ_i^ ∇g_i(x^) + Σ ν_j^ ∇h_j(x^*) = 0
- 互补松弛:λ_i^* g_i(x^*) = 0 对所有 i
互补松弛条件 λ_i^* g_i(x^) = 0 含义深刻:若第 i 个不等式约束在最优解处不紧(g_i(x^) < 0),则对应乘子 λ_i^* 必为零;若 λ_i^* > 0,则对应约束必紧(g_i(x^*) = 0)。这标识了哪些约束在最优时活跃。
第六步:对偶性的计算优势与应用价值
- 问题转化:对偶问题常比原问题更易求解,特别是当原问题约束复杂但变量可分时。例如,原问题有复杂耦合约束,对偶后可能分解为多个独立子问题。
- 敏感性分析:最优乘子 (λ^, ν^) 解释为约束的影子价格,量化约束右端项微小变化对最优值的影响速率,为决策提供边际价值信息。
- 算法基础:拉格朗日对偶是增广拉格朗日法、对偶分解、次梯度法等算法核心。在分布式优化中,通过对偶分解可将大问题分解为可并行求解的子问题。
- 界限提供:即使对偶间隙非零,对偶最优值 d^* 为原问题最优值 p^* 提供一个可计算下界(对最小化问题),这对评估启发式解质量、在分支定界中剪枝至关重要。
第七步:示例——二次规划的对偶
考虑凸二次规划:
最小化 (1/2)x^T P x + q^T x
满足约束:Ax ≤ b
其中 P 对称正定。其拉格朗日函数 L(x, λ) = (1/2)x^T P x + q^T x + λ^T (Ax - b),λ ≥ 0。
对 x 求导得最优性条件:Px + q + A^T λ = 0 ⇒ x = -P^{-1}(q + A^T λ)。代入 L 得对偶函数:
d(λ) = - (1/2)λ^T A P^{-1} A^T λ - λ^T (b + A P^{-1} q) - (1/2)q^T P^{-1} q
对偶问题为最大化 d(λ) 满足 λ ≥ 0,这是一个只含非负约束的凹二次规划,常比原问题更易处理,展示了对偶简化问题的威力。
通过以上步骤,您已系统掌握拉格朗日对偶在非线性规划中的构造、性质、条件及核心应用。这是连接理论最优性与算法设计的桥梁,也是分析问题结构的重要工具。