凸锥与对偶锥(Convex Cones and Dual Cones)
我们开始系统地讲解这个概念。
第一步:从基本定义出发
我们先明确“锥”与“凸锥”的严格数学定义。
- 锥:设 \(C\) 是实或复向量空间 \(X\) 的一个子集。若对任意 \(x \in C\) 和任意标量 \(\lambda \geq 0\),都有 \(\lambda x \in C\),则称 \(C\) 是一个锥。直观上,锥是从原点出发,沿某些方向无限延伸的集合。注意,根据定义,原点 \(0\) 必须在锥中(取 \(\lambda = 0\))。
- 凸锥:如果一个锥 \(C\) 同时是一个凸集,即对任意 \(x, y \in C\) 和任意 \(\lambda, \mu \geq 0\) 满足 \(\lambda + \mu = 1\),都有 \(\lambda x + \mu y \in C\),那么 \(C\) 就称为一个凸锥。这个条件等价于:对任意 \(x, y \in C\) 和任意 \(\alpha, \beta \geq 0\),都有 \(\alpha x + \beta y \in C\)。凸锥既是锥,又是凸集。
第二步:直观例子与基本性质
- 例子1(非凸锥):在 \(\mathbb{R}^2\) 中,集合 \(\{ (x, y) : y = |x| \}\) 是一个锥(因为放大或缩小绝对值函数图形仍保持形状,原点在内),但它不是凸的(例如,点 (1,1) 和 (-1,1) 在集合内,但它们的中点 (0,1) 不在)。
- 例子2(凸锥):
- 整个空间 \(\mathbb{R}^n\)。
- 第一象限(或卦限):\(\{(x_1, ..., x_n) \in \mathbb{R}^n : x_i \geq 0, \forall i\}\)。
- 半空间:\(\{ x \in \mathbb{R}^n : \langle a, x \rangle \geq 0 \}\),其中 \(a\) 是一个固定非零向量,\(\langle \cdot, \cdot \rangle\) 是内积。这是由一个线性不等式定义的锥。
- 正半定矩阵锥:在 \(n \times n\) 实对称(或复埃尔米特)矩阵构成的向量空间中,所有半正定矩阵构成的集合是一个凸锥。
- 关键性质:凸锥对非负线性组合封闭。这是优化理论和泛函分析中许多结论的基础。
第三步:引入对偶锥的定义
对偶锥是理解凸锥功能和作用的核心概念,它建立了一个锥与其所在空间的“对偶”(或“共轭”)空间之间的联系。
设 \(X\) 是一个实向量空间(为简化,我们先考虑实的情形),\(X^*\) 是其代数对偶空间(所有线性泛函的集合)。设 \(K \subset X\) 是一个凸锥。
- 对偶锥:\(K\) 的(代数)对偶锥 \(K^*\) 定义为:
\[ K^* := \{ f \in X^* : f(x) \geq 0 \text{ 对所有的 } x \in K \}. \]
换句话说,\(K^*\) 由所有在锥 \(K\) 上取非负值的线性泛函组成。
2. 几何解释:若将线性泛函 \(f\) 视为一个超平面 \(\{ x: f(x)=0 \}\) 的法方向,那么 \(f \in K^*\) 意味着这个超平面将空间分开,使得整个锥 \(K\) 落在超平面的“正侧”(\(f(x) \geq 0\))。因此,\(K^*\) 刻画了所有能够“支撑”或“界定”锥 \(K\) 的线性泛函。
第四步:对偶锥的性质(在有限维或内积空间中最直观)
在有限维欧几里得空间 \(\mathbb{R}^n\) 中(此时 \(X^*\) 可与 \(X\) 本身通过内积等同),对偶锥 \(K^*\) 的定义变为:
\[K^* := \{ y \in \mathbb{R}^n : \langle y, x \rangle \geq 0 \text{ 对所有的 } x \in K \}. \]
此时,对偶锥有一些良好性质:
- \(K^*\) 总是闭凸锥(即使 \(K\) 不闭)。
- 若 \(K\) 是闭凸锥,则对偶的对偶等于自身:\((K^*)^* = K\)。这是凸分析中的一个基本且重要的定理,它意味着闭凸锥由其所有非负线性泛函完全决定。
- 包含关系:若 \(K_1 \subset K_2\),则 \(K_2^* \subset K_1^*\)。直观上,更大的锥,对其“非负”的要求更严,所以对偶锥更小。
- 运算的对偶:\((K_1 + K_2)^* = K_1^* \cap K_2^*\),以及 \((K_1 \cap K_2)^* = \overline{K_1^* + K_2^*}\)(闭包是必要的)。
第五步:推广到一般拓扑向量空间
在无穷维泛函分析中,我们通常考虑拓扑向量空间(如巴拿赫空间、希尔伯特空间、局部凸空间)。
- 连续对偶锥:设 \(X\) 是拓扑向量空间(如实巴拿赫空间),\(X'\) 是其连续对偶空间。对于一个凸锥 \(K \subset X\),我们通常关心其连续对偶锥(或拓扑对偶锥):
\[ K^+ := \{ f \in X' : f(x) \geq 0 \text{ 对所有的 } x \in K \}. \]
即只考虑连续线性泛函。\(K^+\) 是 \(X'\) 中的一个闭凸锥(在弱*拓扑或范数拓扑下)。
2. 闭包与对偶:此时,\((K^+)^+\)(即 \(K^+\) 在 \(X\) 中的对偶,记为 \(K^{++}\))等于 \(K\) 的闭包 \(\overline{K}\)(在 \(X\) 的原始拓扑下),只要 \(K\) 是凸锥。即 \(K^{++} = \overline{K}\)。这推广了有限维的 \((K^*)^* = K\)(有限维中凸锥自动闭)。
3. 在希尔伯特空间中的应用:在希尔伯特空间 \(H\) 中,利用里斯表示定理,可将对偶锥与正交补联系起来。例如,对于一个闭凸锥 \(K \subset H\),有 \(K^+ \cong \{ y \in H : \langle y, x \rangle \geq 0, \forall x \in K \}\),并且 \(K \cap (-K) = \{0\}\)(点锥)的条件与投影算子等有密切联系。
第六步:核心应用领域
凸锥与对偶锥的理论是以下领域的基石:
- 凸优化与数学规划:在最优化问题中,可行域常由凸锥定义(如线性规划的非负象限、二阶锥规划、半定规划中的半正定锥)。最优性条件(如库恩-塔克条件)和对偶理论强烈依赖于对偶锥的概念。对偶锥描述了“可行方向”与“价格”或“拉格朗日乘子”之间的关系。
- 泛函分析中的序结构:许多函数空间(如 \(L^p\) 空间、连续函数空间)可以赋予由凸锥定义的部分序。例如,在实值函数空间中,由“几乎处处非负”的函数构成的锥定义了逐点(或几乎处处)的序关系。对偶锥则对应于此序下的“正线性泛函”。
- 算子理论:在算子代数中,正元(如 \( C^*\)-代数中的正元)的集合构成一个凸锥。这个锥的对偶(在适当的意义下)与代数上的正泛函(态)密切相关,这是GNS构造等理论的基础。
- 偏微分方程与变分不等式:许多自由边界问题或接触问题可以表述为在凸锥(如非负性锥)上求能量极小的问题。解的存在唯一性及刻画依赖于锥的几何及其对偶性质。
总结:凸锥是一个兼具齐次性和凸性的集合,是描述“方向性”和“非负性”的基本工具。其对偶锥由所有在该锥上非负的(连续)线性泛函构成,它们互为对方的“探测器”和“界定者”。在闭凸的情形下,二者构成完美的对偶对。这套理论通过将几何、代数和对偶性融为一体,为优化、序结构、算子理论和变分分析提供了统一的框架和强有力的工具。