非线性规划中的信赖域方法与自适应信赖域半径调整策略
-
基本思想引入
信赖域方法是一种解决无约束和约束非线性优化问题的迭代算法。其核心思想是:在当前迭代点 \(x_k\) 处,构造目标函数的一个局部近似模型(通常是二次模型),并假设该模型仅在以 \(x_k\) 为中心、某个半径 \(\Delta_k > 0\) 定义的“信赖域”内是准确的。该算法在每一迭代步求解一个信赖域子问题,即在该区域内寻找近似模型的最优解,从而得到候选步。之后通过比较候选步带来的实际目标函数下降量与模型预测下降量,来判断该步是否被接受,并动态调整信赖域半径 \(\Delta_k\) 的大小,以控制近似模型的可靠性。 -
数学模型构建
对于无约束问题 \(\min_{x \in \mathbb{R}^n} f(x)\),在第 \(k\) 次迭代时,信赖域子问题通常形式化为:
\[ \min_{s \in \mathbb{R}^n} m_k(s) = f(x_k) + \nabla f(x_k)^T s + \frac{1}{2} s^T B_k s \]
\[ \text{s.t. } \| s \| \le \Delta_k \]
其中 \(s\) 是待求的步长,\(B_k\) 是目标函数 Hessian 矩阵或其近似(如拟牛顿法的 BFGS 矩阵),约束条件 \(\| s \| \le \Delta_k\) 定义了信赖域边界(范数通常取 \(l_2\) 或 \(l_\infty\) 范数)。这个子问题是一个带球形(或箱形)约束的二次规划,存在高效求解方法(如折线法或内点法)。
- 接受准则与半径调整机制
定义实际下降量 \(\text{ared}_k = f(x_k) - f(x_k + s_k)\) 和预测下降量 \(\text{pred}_k = m_k(0) - m_k(s_k)\)。计算比值:
\[ \rho_k = \frac{\text{ared}_k}{\text{pred}_k} \]
该比值衡量了模型预测的准确性:
- 若 \(\rho_k\) 接近 1,说明模型拟合良好,可接受该步(即 \(x_{k+1} = x_k + s_k\))并可能增大信赖域半径以加快收敛。
- 若 \(\rho_k\) 为正但较小,说明模型预测有一定误差但步长仍有效,可接受步长但保持半径不变或略微缩小。
- 若 \(\rho_k\) 为负或接近零,说明模型预测很差,应拒绝步长(即 \(x_{k+1} = x_k\))并显著缩小信赖域半径,以提高模型局部近似精度。
- 自适应半径调整策略
半径调整是信赖域方法高效性的关键。常用自适应策略通过设定阈值 \(0 < \eta_1 < \eta_2 < 1\) 和缩放因子 \(\gamma_1 < 1 < \gamma_2\) 来自动更新 \(\Delta_k\):
- 若 \(\rho_k \ge \eta_2\),表明近似非常准确,可扩大信赖域:\(\Delta_{k+1} = \gamma_2 \Delta_k\)。
- 若 \(\eta_1 \le \rho_k < \eta_2\),表明拟合程度可接受,保持半径不变:\(\Delta_{k+1} = \Delta_k\)。
- 若 \(\rho_k < \eta_1\),表明拟合很差,缩小半径:\(\Delta_{k+1} = \gamma_1 \Delta_k\)。
典型参数取值为 \(\eta_1=0.25, \eta_2=0.75, \gamma_1=0.5, \gamma_2=2\)。这种策略能平衡全局探索(大半径保证收敛到稳定点)和局部精细搜索(小半径提升模型精度)。
-
收敛性保证与算法扩展
在适当条件下(如 \(B_k\) 一致有界,\(f\) 连续可微且下界有界),信赖域方法具有全局收敛性,即迭代序列的聚点必是稳定点(梯度为零的点)。对于约束优化问题,可通过在子问题中引入约束的线性或二次近似,或结合罚函数、滤子等方法扩展。自适应半径调整策略的引入进一步优化了收敛速率,使其在远离最优解时能快速逼近,在接近最优解时实现超线性收敛(当 \(B_k\) 精确趋近 Hessian 矩阵时)。 -
总结与应用场景
信赖域方法通过动态控制局部模型的有效范围,兼具全局收敛性和局部快速收敛性。其自适应半径调整机制避免了线搜索方法中步长选择的不确定性,特别适用于目标函数高度非线性、曲率变化剧烈或导数信息难以精确计算的问题。该方法广泛应用于工程设计、经济建模、机器学习中的参数优化等领域,是求解中大规模非线性规划问题的核心工具之一。