最优性条件的积极约束与正则性
我们先从约束优化问题的基本形式开始。考虑问题:
\[\begin{aligned} \min_{x} \quad & f(x) \\ \text{s.t.} \quad & g_i(x) \leq 0, \quad i = 1, \dots, m, \\ & h_j(x) = 0, \quad j = 1, \dots, p, \end{aligned} \]
其中 \(f, g_i, h_j: \mathbb{R}^n \to \mathbb{R}\) 是连续可微函数。可行域是所有满足约束的点的集合。
在局部最优点 \(x^*\) 处,一阶必要条件(KKT条件)指出,存在乘子 \(\lambda_i \geq 0\)(对应不等式约束)和 \(\nu_j\)(对应等式约束),使得:
\[\nabla f(x^*) + \sum_{i=1}^m \lambda_i \nabla g_i(x^*) + \sum_{j=1}^p \nu_j \nabla h_j(x^*) = 0, \]
且满足互补松弛条件:\(\lambda_i g_i(x^*) = 0\) 对所有 \(i\) 成立。
现在,我们引入“积极约束”(Active Constraints)的概念。在点 \(x^*\) 处,不等式约束 \(g_i(x) \leq 0\) 被称为积极的,如果 \(g_i(x^*) = 0\);否则(即 \(g_i(x^*) < 0\)),它是非积极的。所有等式约束 \(h_j(x) = 0\) 在可行点处总是积极的。积极约束的指标集记为:
\[\mathcal{A}(x^*) = \{ i \mid g_i(x^*) = 0 \} \cup \{ j \mid h_j(x^*) = 0 \}. \]
直观上,积极约束是在最优点处“紧”的约束,它们可能直接影响目标函数在该点的行为;而非积极约束在局部范围内不起限制作用。
然而,KKT条件的成立需要一定的“正则性”(Regularity)条件,即约束规格(Constraint Qualification)。这是因为在最优点,目标函数的梯度 \(\nabla f(x^*)\) 必须位于积极约束梯度张成的锥中,但若积极约束的梯度线性相关或几何结构不良,则可能导致KKT条件失效。
常见的约束规格包括:
- 线性独立约束规格(LICQ):在 \(x^*\) 处,所有积极约束的梯度 \(\nabla g_i(x^*)\)(对于 \(i \in \mathcal{A}(x^*)\) 且 \(g_i\) 为不等式)和 \(\nabla h_j(x^*)\)(对于所有 \(j\))是线性无关的。
- Mangasarian-Fromovitz约束规格(MFCQ):在 \(x^*\) 处,等式约束的梯度线性无关,且存在一个方向 \(d\),使得 \(\nabla h_j(x^*)^\top d = 0\) 对所有 \(j\),且 \(\nabla g_i(x^*)^\top d < 0\) 对所有积极的不等式约束 \(i\) 成立。
正则性条件的作用是保证在最优点处,可行集的切锥与线性化约束的锥一致,从而确保KKT条件成立。如果约束规格不满足,即使 \(x^*\) 是局部最优点,也可能不存在满足KKT条件的乘子。
总结:积极约束标识了在最优点处起实际作用的约束,而正则性条件则确保了约束集在最优点的几何性质良好,是KKT最优性条件适用的关键前提。