凸分析与变分分析中常见的集值映射的连续性与可测性
字数 4098 2025-12-20 07:39:15
好的,我注意到列表中尚未包含 凸分析与变分分析中常见的集值映射的连续性与可测性 这个重要主题。我将以此为本次讲解的词条。
凸分析与变分分析中常见的集值映射的连续性与可测性
这个主题研究的是将空间中的点映射到集合(通常是另一个空间的子集)的“函数”。理解其连续性和可测性是研究最优化问题、微分包含、集值动力系统以及经济学均衡理论的基础。
我将从最基础的概念开始,逐步深入到更复杂的形式。
第1步:基础定义与动机
首先,我们需要明确什么是“集值映射”。
- 单值映射 vs. 集值映射:
- 我们通常学到的函数 \(f: X \to Y\) 是单值映射:对于每个输入 \(x \in X\),都有唯一确定的输出 \(f(x) \in Y\)。
- 集值映射(也称为对应、多值函数、集值函数)记作 \(F: X \rightrightarrows Y\)。它的特点是:对于每个输入 \(x \in X\),输出 \(F(x)\) 是 \(Y\) 的一个子集(可能是空集、单点集或多个点构成的集合)。记 \(F(x) \subseteq Y\)。
- 为什么研究它?
- 优化问题:参数化优化问题的最优解集,作为一个参数的函数,通常是一个集值映射。
- 例子:令 \(C \subset \mathbb{R}^n\) 为约束集,\(f(x, u)\) 为目标函数,其中 \(u\) 是参数。最优解集 \(S(u) = \arg\min_{x \in C} f(x, u)\) 就是一个从参数空间到 \(\mathbb{R}^n\) 的集值映射。
- 微分包含:\(\dot{x}(t) \in F(x(t))\),其中 \(F\) 是集值映射,用于描述具有不确定性的动力系统。
- 经济学:消费者的需求对应、生产者的供给对应,都是价格的集值映射。
第2步:连续性概念——上半连续
单值函数的连续性不能直接推广,因为“极限”的概念对于集合来说很复杂。我们引入两个最重要的连续性概念,它们分别从“不会突然膨胀”和“不会突然收缩”两个角度来刻画。
- 图形(Graph):
- 集值映射 \(F: X \rightrightarrows Y\) 的图形定义为:
\[ \text{gph}(F) = \{ (x, y) \in X \times Y \mid y \in F(x) \}. \]
* 研究连续性常与图形的拓扑性质有关。
- 上半连续性:
- 直观:当输入 \(x\) 在 \(x_0\) 附近轻微变动时,输出集合 \(F(x)\) 不会突然变得比 \(F(x_0)\) 大很多。更精确地说,任何试图“逃出” \(F(x_0)\) 的序列,其极限点仍然在 \(F(x_0)\) 内。
- 序列定义:设 \(X, Y\) 为度量空间,\(F: X \rightrightarrows Y\)。称 \(F\) 在 \(x_0\) 处是上半连续的,如果对于任意满足 \(x_n \to x_0\) 的序列 \(\{x_n\}\),以及任意满足 \(y_n \in F(x_n)\) 的序列 \(\{y_n\}\),如果 \(y_n \to y_0\),则必有 \(y_0 \in F(x_0)\)。
- 拓扑定义(等价):对于 \(Y\) 中任意开集 \(V\) 满足 \(F(x_0) \subset V\),都存在 \(x_0\) 的一个邻域 \(U\),使得对于所有 \(x \in U\),都有 \(F(x) \subset V\)。
- 关键理解:上半连续性关注的是外部近似。如果 \(F(x_0)\) 包含在一个开集 \(V\) 里,那么附近的 \(x\) 对应的 \(F(x)\) 也整个被包在 \(V\) 里。这保证了集合值不会“爆出来”。
第3步:连续性概念——下半连续
- 下半连续性:
- 直观:当输入 \(x\) 在 \(x_0\) 附近轻微变动时,输出集合 \(F(x)\) 不会突然变得比 \(F(x_0)\) 小很多。更精确地说,\(F(x_0)\) 中的任意一点,都可以被附近 \(F(x)\) 中的点序列逼近。
- 序列定义:称 \(F\) 在 \(x_0\) 处是下半连续的,如果对于任意 \(y_0 \in F(x_0)\) 和任意满足 \(x_n \to x_0\) 的序列 \(\{x_n\}\),都存在一个序列 \(\{y_n\}\) 满足 \(y_n \in F(x_n)\) 且 \(y_n \to y_0\)。
- 拓扑定义(等价):对于 \(Y\) 中任意开集 \(V\) 满足 \(F(x_0) \cap V \ne \emptyset\),都存在 \(x_0\) 的一个邻域 \(U\),使得对于所有 \(x \in U\),都有 \(F(x) \cap V \ne \emptyset\)。
- 关键理解:下半连续性关注的是内部近似。如果 \(F(x_0)\) 碰到了开集 \(V\),那么附近的 \(x\) 对应的 \(F(x)\) 也一定会碰到 \(V\)。这保证了集合值不会“塌缩”到内部某些点无法从外部逼近。
第4步:连续性与连续性
现在我们可以定义最强的连续性。
- 连续性:
- 称集值映射 \(F\) 在 \(x_0\) 处是连续的,如果它在 \(x_0\) 处同时是上半连续和下半连续的。
- 这个定义完美地推广了单值连续函数:对于一个单值函数 \(f\),可以看作集值映射 \(F(x) = \{f(x)\}\)。验证可知,这里的上半连续和下半连续定义都等价于 \(f\) 在 \(x_0\) 处的(单值)连续性。
第5步:可测性概念
当我们的定义域 \(X\) 是一个测度空间(例如概率空间)时,我们需要讨论集值映射的可测性,以便进行积分等操作。
- 基础:可测空间与集值映射:
- 设 \((\Omega, \mathcal{A})\) 是一个可测空间(\(\mathcal{A}\) 是 \(\Omega\) 上的 \(\sigma\)-代数),\(Y\) 是一个可分的度量空间(例如 \(\mathbb{R}^n\))。考虑集值映射 \(F: \Omega \rightrightarrows Y\)。
- 目标是定义 \(F\) 在某种意义下是“可测的”。
- 可测性的等价刻画:
有几种常见的等价定义方式,它们都指向同一个本质。
- 图形可测:\(\text{gph}(F) \in \mathcal{A} \otimes \mathcal{B}(Y)\),其中 \(\mathcal{B}(Y)\) 是 \(Y\) 的Borel \(\sigma\)-代数。这很强,但不总是最容易验证。
- 弱可测性(最常用):对于 \(Y\) 中任意闭集 \(C\),原像集
\[ F^{-1}(C) := \{\omega \in \Omega \mid F(\omega) \cap C \ne \emptyset \} \]
属于 \(\mathcal{A}\)。注意这里的原像定义是针对“交非空”的。
- 等价于:对于 \(Y\) 中任意开集 \(G\),集合 \(F^{-1}(G)\) 属于 \(\mathcal{A}\)。
- 直观:弱可测性意味着,通过观察输出集合 \(F(\omega)\) 是否与给定的闭(开)集有交集,所确定的事件是可测的。
- 可测选择定理(核心工具):
- 定理(Kuratowski-Ryll-Nardzewski选择定理):如果 \(F: \Omega \rightrightarrows Y\) 是闭值的(即每个 \(F(\omega)\) 是闭集)且弱可测,则存在一个可测选择 \(f: \Omega \to Y\)。即,存在一个(单值)可测函数 \(f\),使得对于所有 \(\omega \in \Omega\),有 \(f(\omega) \in F(\omega)\)。
- 意义:这个定理是将集值分析问题转化为单值分析问题的桥梁。例如,定义集值映射的积分(Aumann积分)时,就需要考虑所有可测选择的积分集合。
第6步:总结与联系
- 连续性 vs. 可测性:
- 连续性是拓扑概念,研究当自变量在拓扑意义下变动时,因变量(集合)的稳定行为。上半连续和下半连续提供了两个互补的稳定性视角。
- 可测性是测度论概念,研究原像集是否落在给定的 \(\sigma\)-代数中,为积分理论铺路。
- 重要事实:
- 如果 \(F: X \rightrightarrows Y\) 是上半连续的且取紧值(即 \(F(x)\) 是紧集),则它的图形 \(\text{gph}(F)\) 是闭的。反之,如果图形闭且 \(Y\) 是紧的,则 \(F\) 是上半连续的。
- 在凸分析的许多应用中(如次微分映射 \(\partial f(x)\)),我们经常讨论映射的图闭性或某种上半连续性。
- 可测选择定理确保了弱可测的闭值集值映射“内部”存在足够多的可测单值函数,这是研究随机优化、随机微分包含等问题的基石。
通过以上六个步骤,我们循序渐进地从集值映射的基本定义,走到了其最重要的两种分析性质——连续性与可测性——的核心。理解这些概念是进一步学习集值分析、变分分析和非光滑优化理论的关键。