非线性规划中的障碍函数法（Interior Point Methods using Barrier Functions in Nonlinear Programming）

字数 2270 2025-12-17 10:50:17

非线性规划中的障碍函数法（Interior Point Methods using Barrier Functions in Nonlinear Programming）

我将为您系统讲解障碍函数法。这个方法与内点法紧密相关，但侧重于通过特定的“障碍函数”来处理约束，是求解约束非线性优化问题的一类重要内点算法。

第一步：核心思想与问题形式
障碍函数法用于求解具有不等式约束的非线性规划问题：
最小化 f(x)
满足约束 c_i(x) ≥ 0, i = 1, 2, ..., m
其中 f 和 c_i 是连续可微函数。注意，这里约束是“≥0”形式，这是障碍函数法的标准形式（“≤0”可通过乘以-1转换）。等式约束需另行处理，这里先聚焦不等式。其核心思想是：在可行域内部构造一个函数，当点接近边界时，该函数值趋于无穷大，从而在迭代中“阻挡”点跑出可行域，保证迭代点始终在可行域内部（内点）。这样就把约束问题转化为一系列逐步逼近的无约束或简单约束子问题。

第二步：构造障碍函数
障碍函数附着在不等式约束上。常用两类：

对数障碍函数：对于约束 c(x) ≥ 0，定义 B(x) = -∑_{i=1}^{m} log(c_i(x))。这里 log 是自然对数。当某个 c_i(x) → 0⁺（从正值趋于0），-log(c_i(x)) → +∞，形成“无限高墙”阻挡越界。在可行域内部（所有 c_i(x) > 0），B(x) 有限。
逆障碍函数：B(x) = ∑_{i=1}^{m} 1 / c_i(x)。当 c_i(x) → 0⁺ 时，1/c_i(x) → +∞，同样起到阻挡作用。

第三步：形成障碍问题
引入一个正参数 μ（称为障碍参数或罚参数），构造障碍问题：
最小化 φ_μ(x) = f(x) + μ * B(x)
其中 B(x) 是对数或逆障碍函数。注意，这里 x 被限制在严格可行域内部（即所有 c_i(x) > 0）。当 μ 固定时，这是一个在严格可行域内部的无约束优化问题（实际上是受隐含约束 c_i(x)>0 的约束问题，但目标函数自身已阻止边界跨越）。关键思路是：当 μ 很大时，μB(x) 项占主导，其最小值点会在远离边界的位置；当 μ 减小时，f(x) 的影响增大，最小值点会向原问题的最优解靠近，同时被障碍函数“推着”沿可行域内部路径接近边界（如果原问题最优解在边界上）。

第四步：路径跟踪与中心路径
随着 μ 从大变小，障碍问题的最优解 x*(μ) 会形成一条连续轨迹，称为中心路径（central path）。在理想条件下（如凸性、约束规格满足），中心路径位于严格可行域内部，并当 μ → 0 时，x*(μ) 收敛于原问题的最优解。算法就是沿这条路径跟踪：给定当前 μ 和当前内点 x，求解近似最小化 φ_μ(x) 的子问题得到新点，然后减小 μ，重复直到收敛。

第五步：子问题求解与牛顿法应用
对于固定的 μ，需最小化 φ_μ(x)。由于其梯度与海瑟矩阵通常可计算，常用牛顿法在可行域内部迭代。以对数障碍为例：
梯度 ∇φ_μ(x) = ∇f(x) - μ ∑_{i=1}^{m} (1/c_i(x)) ∇c_i(x)
海瑟矩阵涉及二阶导数。牛顿步 Δx 通过解线性方程组 [∇²φ_μ(x)] Δx = -∇φ_μ(x) 得到。但需注意步长控制（如线搜索）确保迭代点保持内点性（所有 c_i(x) > 0），常用回退法（如分数步长）直到满足可行性。

第六步：算法框架与参数更新
一个基本的障碍函数算法框架如下：

输入：初始严格内点 x⁰，初始 μ₀ > 0，缩减因子 σ ∈ (0,1)，容忍误差 ε > 0。
迭代：对于 k = 0,1,2,... 执行：
a. 以 xᵏ 为起点，用牛顿法（加线搜索）求解障碍问题 min φ_{μ_k}(x)，得近似解 x(μ_k)。
b. 更新 μ_{k+1} = σ μ_k。
c. 检查终止条件（如 μ_k 足够小，或最优性残差足够小）。若满足则输出 x(μ_k)，否则继续。

第七步：收敛性与实际考虑
对于凸问题，在适当条件下，算法可全局收敛到最优解，且具有多项式时间复杂性。对于非凸问题，可能收敛到局部最优。实际中，需处理：

初始内点寻找：可借助两阶段法或使用修改的障碍函数（如初始放宽约束）。
等式约束：可通过将它们纳入无约束部分，并在牛顿步中解KKT系统处理。
数值稳定性：当 μ 很小时，障碍项 1/c_i(x) 或 -log(c_i(x)) 在边界附近导数很大，导致海瑟矩阵病态，需谨慎数值计算。
现代内点法常将障碍法与原始-对偶框架结合，同时更新原始变量、对偶变量和互补松弛度量，以获更好性能。

第八步：与相关方法的对比

与罚函数法：罚函数法（如二次罚函数）允许违反约束但加大惩罚，最终从外部或内部逼近；障碍函数法则严格保持内点性。
与单纯形法（线性规划）：障碍函数法是内点法的一种，在大型线性规划中常比单纯形法有理论优势，尤其对大规模稀疏问题。
与序列二次规划（SQP）：SQP允许迭代点不可行但快速收敛；障碍函数法保持内点性但需一系列子问题。

障碍函数法是现代内点法的基石之一，尤其在线性规划、二次规划、半定规划及一般凸规划的求解器（如IPOPT、LOQO）中广泛应用，其核心是通过可控的障碍参数将约束问题转化为一系列易于处理的子问题，并沿中心路径追踪解。

非线性规划中的障碍函数法（Interior Point Methods using Barrier Functions in Nonlinear Programming）我将为您系统讲解障碍函数法。这个方法与内点法紧密相关，但侧重于通过特定的“障碍函数”来处理约束，是求解约束非线性优化问题的一类重要内点算法。第一步：核心思想与问题形式障碍函数法用于求解具有不等式约束的非线性规划问题：最小化 f(x) 满足约束 c_ i(x) ≥ 0, i = 1, 2, ..., m 其中 f 和 c_ i 是连续可微函数。注意，这里约束是“≥0”形式，这是障碍函数法的标准形式（“≤0”可通过乘以-1转换）。等式约束需另行处理，这里先聚焦不等式。其核心思想是：在可行域内部构造一个函数，当点接近边界时，该函数值趋于无穷大，从而在迭代中“阻挡”点跑出可行域，保证迭代点始终在可行域内部（内点）。这样就把约束问题转化为一系列逐步逼近的无约束或简单约束子问题。第二步：构造障碍函数障碍函数附着在不等式约束上。常用两类：对数障碍函数：对于约束 c(x) ≥ 0，定义 B(x) = -∑_ {i=1}^{m} log(c_ i(x))。这里 log 是自然对数。当某个 c_ i(x) → 0⁺（从正值趋于0），-log(c_ i(x)) → +∞，形成“无限高墙”阻挡越界。在可行域内部（所有 c_ i(x) > 0），B(x) 有限。逆障碍函数：B(x) = ∑_ {i=1}^{m} 1 / c_ i(x)。当 c_ i(x) → 0⁺ 时，1/c_ i(x) → +∞，同样起到阻挡作用。第三步：形成障碍问题引入一个正参数 μ（称为障碍参数或罚参数），构造障碍问题：最小化 φ_ μ(x) = f(x) + μ * B(x) 其中 B(x) 是对数或逆障碍函数。注意，这里 x 被限制在严格可行域内部（即所有 c_ i(x) > 0）。当 μ 固定时，这是一个在严格可行域内部的无约束优化问题（实际上是受隐含约束 c_ i(x)>0 的约束问题，但目标函数自身已阻止边界跨越）。关键思路是：当 μ 很大时，μB(x) 项占主导，其最小值点会在远离边界的位置；当 μ 减小时，f(x) 的影响增大，最小值点会向原问题的最优解靠近，同时被障碍函数“推着”沿可行域内部路径接近边界（如果原问题最优解在边界上）。第四步：路径跟踪与中心路径随着 μ 从大变小，障碍问题的最优解 x* (μ) 会形成一条连续轨迹，称为中心路径（central path）。在理想条件下（如凸性、约束规格满足），中心路径位于严格可行域内部，并当 μ → 0 时，x* (μ) 收敛于原问题的最优解。算法就是沿这条路径跟踪：给定当前 μ 和当前内点 x，求解近似最小化 φ_ μ(x) 的子问题得到新点，然后减小 μ，重复直到收敛。第五步：子问题求解与牛顿法应用对于固定的 μ，需最小化 φ_ μ(x)。由于其梯度与海瑟矩阵通常可计算，常用牛顿法在可行域内部迭代。以对数障碍为例：梯度 ∇φ_ μ(x) = ∇f(x) - μ ∑_ {i=1}^{m} (1/c_ i(x)) ∇c_ i(x) 海瑟矩阵涉及二阶导数。牛顿步 Δx 通过解线性方程组 [ ∇²φ_ μ(x)] Δx = -∇φ_ μ(x) 得到。但需注意步长控制（如线搜索）确保迭代点保持内点性（所有 c_ i(x) > 0），常用回退法（如分数步长）直到满足可行性。第六步：算法框架与参数更新一个基本的障碍函数算法框架如下：输入：初始严格内点 x⁰，初始 μ₀ > 0，缩减因子 σ ∈ (0,1)，容忍误差 ε > 0。迭代：对于 k = 0,1,2,... 执行： a. 以 xᵏ 为起点，用牛顿法（加线搜索）求解障碍问题 min φ_ {μ_ k}(x)，得近似解 x(μ_ k)。 b. 更新 μ_ {k+1} = σ μ_ k。 c. 检查终止条件（如 μ_ k 足够小，或最优性残差足够小）。若满足则输出 x(μ_ k)，否则继续。第七步：收敛性与实际考虑对于凸问题，在适当条件下，算法可全局收敛到最优解，且具有多项式时间复杂性。对于非凸问题，可能收敛到局部最优。实际中，需处理：初始内点寻找：可借助两阶段法或使用修改的障碍函数（如初始放宽约束）。等式约束：可通过将它们纳入无约束部分，并在牛顿步中解KKT系统处理。数值稳定性：当 μ 很小时，障碍项 1/c_ i(x) 或 -log(c_ i(x)) 在边界附近导数很大，导致海瑟矩阵病态，需谨慎数值计算。现代内点法常将障碍法与原始-对偶框架结合，同时更新原始变量、对偶变量和互补松弛度量，以获更好性能。第八步：与相关方法的对比与罚函数法：罚函数法（如二次罚函数）允许违反约束但加大惩罚，最终从外部或内部逼近；障碍函数法则严格保持内点性。与单纯形法（线性规划）：障碍函数法是内点法的一种，在大型线性规划中常比单纯形法有理论优势，尤其对大规模稀疏问题。与序列二次规划（SQP）：SQP允许迭代点不可行但快速收敛；障碍函数法保持内点性但需一系列子问题。障碍函数法是现代内点法的基石之一，尤其在线性规划、二次规划、半定规划及一般凸规划的求解器（如IPOPT、LOQO）中广泛应用，其核心是通过可控的障碍参数将约束问题转化为一系列易于处理的子问题，并沿中心路径追踪解。