凸锥与对偶锥(Convex Cones and Dual Cones)
字数 3368 2025-12-10 14:54:49
凸锥与对偶锥(Convex Cones and Dual Cones)
好的,我们将循序渐进地讲解“凸锥与对偶锥”,这是泛函分析和凸分析中的一个基础且重要的几何概念。
第一步:从集合到锥(Cone)
首先,我们脱离线性结构,只考虑一个向量空间(如实数域R上的向量空间X)中的一个子集K。
- 锥的定义: 我们说K是一个锥(Cone),如果对于任意元素 \(x \in K\) 和任意非负实数 \(t \geq 0\),都有 \(t x \in K\)。
- 直观理解: 你可以想象一个以原点为顶点的“无限延伸的锥体”。从原点出发,如果一条射线上有一个点属于锥K,那么整条射线(从原点向外)上的所有点都属于K。注意:根据定义,原点0本身必须属于任何锥(取t=0即可)。
- 例子:
- 整个平面\(\mathbb{R}^2\)。
- 第一象限:\(\{ (x, y) \in \mathbb{R}^2 : x \geq 0, y \geq 0 \}\)。
- 上半平面:\(\{ (x, y) \in \mathbb{R}^2 : y \geq 0 \}\)。
- 由单个向量\(v\)张开的射线:\(\{ t v : t \geq 0 \}\)。
- \(\mathbb{R}^3\)中所有第一卦限的点,即所有坐标非负的点。
第二步:凸锥(Convex Cone)
锥的定义只考虑了“数乘”的封闭性。现在我们加入“加法”的封闭性,但要求具有特定结构。
- 凸锥的定义: 一个子集K既是锥,又是凸集,则称为凸锥。
- 等价刻画: 对于一个子集K,它是凸锥当且仅当:对于任意 \(x, y \in K\) 和任意非负实数 \(s, t \geq 0\),都有 \(s x + t y \in K\)。
- 验证: 取s=t=1,可知对加法封闭(但注意,这里的y不一定是-x,所以不构成线性空间)。取y=0,可知是锥。结合两者,可知是凸集(因为凸组合 \(\lambda x + (1-\lambda)y\) 可以写成 \(s x + t y\), 其中 \(s = \lambda, t = 1-\lambda \geq 0\))。
- 直观理解: 一个“没有凹陷”的锥。它不仅包含从原点出发的射线,还包含这些射线中任意两点连成的整个线段(这个线段也被锥“包裹”着)。
- 例子:
- 上面的例子1,2,4,5都是凸锥。例子3(上半平面)也是凸锥。
- 非凸锥的例子: 在 \(\mathbb{R}^2\) 中,取两个不相交的射线,比如正x轴和负x轴的并集:\(\{ (x,0) : x \geq 0 \} \cup \{ (x,0) : x \leq 0 \}\)。这是一个锥(数乘封闭),但不是凸锥,因为点(1,0)和(-1,0)都在锥内,但它们的中点(0,0)到(1,0)的线段虽然在其中,但连接两点的线段(穿过原点另一侧的部分)并不全在锥内。更简单的非凸锥是“V”字形(两个不同方向的射线),例如 \(\{ (x,y) : y = |x| \}\), 点(1,1)和(-1,1)的连线就不在集合内。
第三步:引入对偶空间与对偶配对
为了定义“对偶锥”,我们需要一个框架来描述一个空间中的锥与它的对偶空间中的锥之间的关系。
- 设定: 设X是一个实向量空间(在泛函分析中,通常是赋范空间,如Banach空间或Hilbert空间)。用 \(X^*\) 表示X的(拓扑)对偶空间,即所有连续线性泛函 \(f: X \to \mathbb{R}\) 构成的空间。
- 对偶配对: 我们使用尖括号表示对偶配对:对于 \(x \in X\) 和 \(f \in X^*\), 记 \(\langle f, x \rangle := f(x)\)。 这个记号强调了f作用在x上,是双线性的。
第四步:对偶锥(Dual Cone)的定义与理解
现在,假设K是X中的一个锥(通常是闭凸锥,这一点很重要)。
- 定义: 锥K的对偶锥,记作 \(K^*\) 或 \(K^+\), 是 \(X^*\) 中的一个子集,定义为:
\[ K^* := \{ f \in X^* : \langle f, x \rangle \geq 0 \ \text{对所有} \ x \in K \}. \]
- 逐句解读:
- \(K^*\) 是对偶空间 \(X^*\) 中的集合。
- 它的元素是连续线性泛函 \(f\)。
3. 入选标准是:这个泛函f作用在锥K中的任意向量x上,结果必须是非负的实数。
- 几何意义: 对偶锥 \(K^*\) 由所有“在锥K上非负”的线性泛函组成。你可以把每个 \(f \in K^*\) 想象成空间X中的一个“测试平面”(等位面 \(\{x: f(x)=c\}\) 是超平面),它把整个锥K都“放”在了它非负的那一侧(包含零等位面)。
- 基本性质: 无论原锥K的性质如何,根据定义,\(K^*\) 总是 \(X^*\) 中的一个闭凸锥。
- 闭性: 因为条件 \(\langle f, x \rangle \geq 0\) 对于每个固定的x,定义了 \(X^*\) 中的一个闭半空间。而 \(K^*\) 是所有这些闭半空间的交集,所以是闭的。
- 凸锥: 容易验证,如果 \(f, g \in K^*\), 且 \(s, t \geq 0\), 则 \(s f + t g \in K^*\)。
第五步:关键特例与进一步概念(双对偶锥)
- 自对偶锥: 在一些特别对称的情况下,我们可以把 \(X\) 和 \(X^*\) 等同起来(例如在Hilbert空间 \(H\) 中,通过Riesz表示定理,\(H^*\) 可以与 \(H\) 本身等同)。此时,我们可以讨论 \(K \subset H\) 和它的对偶锥 \(K^* \subset H\)。
- 一个锥 \(K\) 被称为自对偶的,如果 \(K^* = K\)。
- 最重要的例子: Hilbert空间 \(H = \mathbb{R}^n\) 中的非负象限锥 \(\mathbb{R}^n_+ = \{ x = (x_1, ..., x_n) : x_i \geq 0 \}\) 是自对偶的。在一般的Hilbert空间中,所有非负自伴算子构成的锥也是自对偶的。
- 双对偶锥: 由于 \(K^*\) 是 \(X^*\) 中的锥,我们可以再次取对偶,得到双对偶锥 \((K^*)^*\), 记作 \(K^{**}\)。 注意,\(K^{**}\) 是 \(X^{**}\)(X的双对偶空间)中的锥。
- 一个重要定理: 如果 \(K\) 是 \(X\) 中的一个闭凸锥,那么当我们把 \(X\) 自然地嵌入到它的双对偶空间 \(X^{**}\) 中时(即把 \(x \in X\) 看成 \(X^*\) 上的泛函:\(f \mapsto f(x)\)), 有 \(K^{**} = \overline{K}\)(K的闭包)。特别地,如果K本身是闭的,那么在嵌入的意义下,\(K^{**} = K\)。
- 意义: 这可以看作是“对偶操作是闭凸锥的“闭包”运算”。一个锥和它的双对偶锥(在嵌入意义下)只相差一个闭包。这类似于Hahn-Banach定理或分离定理的精神:一个闭凸锥可以用所有在它上面非负的线性泛函来完美地刻画。
总结:
“凸锥”是兼具锥性和凸性的几何对象。“对偶锥”则从一个对偶(线性函数)的视角来刻画原锥:它由所有在原锥上取非负值的线性泛函构成。这对概念是研究凸优化(如锥规划)、变分不等式、偏微分方程的解的正则性(如正性保持)、算子理论和Banach空间几何(如正锥、正规锥)的基石。其核心思想在于几何对象(锥)与代数/对偶对象(非负线性泛函的集合)之间的对应。