半定规划
字数 2244 2025-11-06 22:52:54
半定规划
半定规划是线性规划的一种重要推广,其决策变量不再是向量,而是对称半正定矩阵。理解半定规划,需要从线性代数的基础概念开始,逐步深入到优化理论。
第一步:理解核心数学对象——对称矩阵与半正定矩阵
- 对称矩阵:首先,一个矩阵 \(X\) 是实对称矩阵,如果它满足 \(X = X^T\),即其元素关于主对角线对称。例如,\(X = \begin{bmatrix} a & b \\ b & c \end{bmatrix}\) 就是一个 2x2 的对称矩阵。
- 半正定矩阵:这是最关键的概念。一个对称矩阵 \(X\) 被称为半正定矩阵,如果对于任意非零实向量 \(z\),都有 \(z^T X z \geq 0\)。直观上,这可以理解为矩阵 \(X\) 所定义的二次型 \(z^T X z\) 永远不会取负值,它描述了一个“非负”的曲率。我们记作 \(X \succeq 0\)。
- 几何意义:一个半正定矩阵可以类比为一个非负实数在矩阵领域的推广。正如标量 \(x \geq 0\),矩阵 \(X \succeq 0\) 也代表一种“非负性”。
第二步:认识半定规划的标准形式
一个半定规划问题通常表示为如下形式:
\[\begin{aligned} \text{minimize} \quad & \langle C, X \rangle \\ \text{subject to} \quad & \langle A_i, X \rangle = b_i, \quad i = 1, \ldots, m \\ & X \succeq 0 \end{aligned} \]
让我们逐一拆解这个形式:
- 决策变量 \(X\):这里的 \(X\) 是一个 \(n \times n\) 的对称半正定矩阵(\(X \succeq 0\)),而不是线性规划中的向量 \(x\)。这是与线性规划最根本的区别。
- 目标函数 \(\langle C, X \rangle\):符号 \(\langle C, X \rangle\) 表示矩阵 \(C\) 和 \(X\) 的弗罗贝尼乌斯内积,其计算方式为 \(\langle C, X \rangle = \sum_{i=1}^{n}\sum_{j=1}^{n} C_{ij} X_{ij} = \text{trace}(C^T X)\)。由于 \(C\) 和 \(X\) 都是对称的,这等价于它们对应元素相乘再求和。目标函数是线性的。
- 约束条件 \(\langle A_i, X \rangle = b_i\):每一个约束条件也都是线性的。\(A_i\) 是给定的对称矩阵,\(b_i\) 是给定的标量。每个约束要求决策矩阵 \(X\) 与 \(A_i\) 的内积等于 \(b_i\)。
- 半正定约束 \(X \succeq 0\):这是问题的核心,它要求解落在半正定矩阵的锥体内。这个约束是非线性的,并且是凸的,这使得半定规划属于凸优化的范畴。
第三步:理解半定规划与线性规划的联系与推广
将半定规划与线性规划的标准形式对比,可以更清晰地看到其推广关系:
- 线性规划:决策变量是向量 \(x \in \mathbb{R}^n\),要求 \(x \geq 0\)(即每个分量非负)。
- 半定规划:决策变量是矩阵 \(X \in \mathbb{S}^n\),要求 \(X \succeq 0\)(即整个矩阵半正定)。
可以证明,如果我们将所有矩阵 \(C, A_i, X\) 都限制为对角矩阵,那么半定规划就完全退化为了线性规划。因为一个对角矩阵半正定,等价于其对角线上的所有元素都非负。因此,半定规划是线性规划在矩阵空间上的一次深刻扩展。
第四步:掌握求解半定规划的基本思路——内点法
由于半定规划是凸优化问题,理论上可以用多种凸优化算法求解。但在实践中,最强大、最主流的算法是内点法的扩展。
- 核心思想:内点法通过构造一个“障碍函数”,使得迭代点始终在可行域的内部(即 \(X \succ 0\),严格正定),并沿着一条中心路径逐步逼近边界上的最优解。
- 关键步骤:算法在每一步需要求解一个牛顿系统(线性方程组),其复杂度主要来源于此。对于半定规划,这个牛顿系统的规模与矩阵维度 \(n\) 的平方有关,因此求解大规模半定规划在计算上具有挑战性。
第五步:了解半定规划的主要应用领域
半定规划的强大之处在于它能建模许多线性规划无法处理的问题。
- 组合优化:许多NP-难问题,如最大割问题、图着色问题,都可以找到高质量的近似算法,其核心步骤就是求解一个半定规划松弛。
- 系统与控制理论:在李雅普诺夫稳定性分析、线性矩阵不等式中,稳定性条件可以直接表示为半正定约束。
- 机器学习与数据科学:在矩阵补全(如推荐系统)、核方法、稀疏主成分分析等领域,半定规划是重要的建模和求解工具。
- 量子信息:在量子态层析、量子纠缠检测等问题中,量子态的密度矩阵本身就是半正定矩阵,自然适合用半定规划建模。
总结来说,半定规划通过将优化变量从向量空间提升到矩阵空间,并引入半正定锥序,极大地扩展了优化理论的建模能力,成为连接线性规划、凸优化、组合优化和矩阵分析的重要桥梁。