分析学词条:柯西-施瓦茨不等式
柯西-施瓦茨不等式是分析学乃至整个数学中一个极为重要且应用广泛的不等式。它揭示了内积与范数之间的一种基本关系。我将从最熟悉的内积空间(欧几里得空间)开始,逐步深入,讲解它的各种形式、证明、几何意义以及在一些重要空间(如\(L^2\)空间)中的推广和应用。
第一步:从熟悉的欧几里得空间开始
在二维或三维的几何空间中,我们知道两个向量\(\vec{a}\)和\(\vec{b}\)的点积(内积)定义为:
\[\vec{a} \cdot \vec{b} = |\vec{a}|\, |\vec{b}| \cos \theta \]
其中\(\theta\)是两向量间的夹角,\(|\vec{a}|\)表示向量\(\vec{a}\)的长度(范数)。
由于\(|\cos \theta| \leq 1\),我们立即得到:
\[|\vec{a} \cdot \vec{b}| \leq |\vec{a}|\, |\vec{b}| \]
这就是欧几里得空间中柯西-施瓦茨不等式的形式。它说明向量点积的绝对值不超过它们长度的乘积。当且仅当两向量共线(即\(\cos \theta = \pm 1\))时取等号。
推广到\(n\)维欧几里得空间\(\mathbb{R}^n\),对任意两个向量\(\mathbf{x} = (x_1, x_2, \dots, x_n)\)和\(\mathbf{y} = (y_1, y_2, \dots, y_n)\),它们的内积是\(\langle \mathbf{x}, \mathbf{y} \rangle = \sum_{i=1}^{n} x_i y_i\),范数为\(|\mathbf{x}| = \sqrt{\sum_{i=1}^{n} x_i^2}\)。柯西-施瓦茨不等式写为:
\[\left| \sum_{i=1}^{n} x_i y_i \right| \leq \sqrt{\sum_{i=1}^{n} x_i^2} \ \sqrt{\sum_{i=1}^{n} y_i^2} \]
或者两边平方:
\[\left( \sum_{i=1}^{n} x_i y_i \right)^2 \leq \left( \sum_{i=1}^{n} x_i^2 \right) \left( \sum_{i=1}^{n} y_i^2 \right) \]
第二步:在一般内积空间中的表述
内积空间是欧几里得空间的抽象推广。设\(V\)是一个(实或复)向量空间,其上定义了内积\(\langle \cdot, \cdot \rangle\),满足正定性、共轭对称性和线性性。由内积可诱导出范数:\(\|x\| = \sqrt{\langle x, x \rangle}\)。
柯西-施瓦茨不等式 的一般形式为:对任意向量\(x, y \in V\),有
\[|\langle x, y \rangle| \leq \|x\| \, \|y\| \]
等号成立当且仅当\(x\)和\(y\)线性相关(即存在标量\(\lambda\)使得\(y = \lambda x\)或\(x\)为零向量)。
第三步:一个经典而巧妙的证明
考虑一个实内积空间(复数的情形类似)。对任意实数\(t\),考虑函数:
\[p(t) = \langle x - t y, \ x - t y \rangle = \|x\|^2 - 2t \langle x, y \rangle + t^2 \|y\|^2 \geq 0 \]
因为内积的正定性,这个关于\(t\)的二次多项式非负。一个二次多项式\(At^2 + Bt + C \geq 0\)对一切\(t\)成立的充要条件是判别式非正,即\(B^2 - 4AC \leq 0\)。这里\(A = \|y\|^2\), \(B = -2\langle x, y \rangle\), \(C = \|x\|^2\)。代入得:
\[(-2\langle x, y \rangle)^2 - 4\|y\|^2 \|x\|^2 \leq 0 \]
化简即得:
\[\langle x, y \rangle^2 \leq \|x\|^2 \|y\|^2 \]
开平方即得不等式。等号成立时,判别式为0,二次方程有重根\(t_0\),使得\(p(t_0)=0\),即\(\|x - t_0 y\| = 0\),所以\(x = t_0 y\),两者线性相关。
这个证明巧妙地利用了“范数非负”这一基本性质和二次函数的性质。
第四步:在平方可积函数空间\(L^2\)中的形式
在分析学中,一个极其重要的应用是在勒贝格可积函数空间\(L^2(\Omega)\)上,其中\(\Omega\)是一个测度空间(例如区间\([a, b]\))。\(L^2\)空间由所有满足\(\int_{\Omega} |f|^2 < \infty\)的可测函数构成。其内积定义为:
\[\langle f, g \rangle = \int_{\Omega} f(x) \overline{g(x)} \, d\mu(x) \]
对应的范数是\(\|f\|_2 = \sqrt{\int_{\Omega} |f|^2}\)。
\(L^2\)空间中的柯西-施瓦茨不等式 为:对任意\(f, g \in L^2(\Omega)\),有
\[\left| \int_{\Omega} f(x) \overline{g(x)} \, d\mu(x) \right| \leq \sqrt{ \int_{\Omega} |f(x)|^2 \, d\mu(x)} \ \sqrt{ \int_{\Omega} |g(x)|^2 \, d\mu(x)} \]
或者写作:
\[\left| \int f \bar{g} \right| \leq \|f\|_2 \cdot \|g\|_2 \]
这个不等式是证明\(L^2\)空间是完备的希尔伯特空间,以及讨论傅里叶级数、正交基等问题的基石。它也直接蕴含着重要的赫尔德不等式在\(p=q=2\)时的特例。
第五步:几何解释与三角不等式
不等式\(|\langle x, y \rangle| \leq \|x\| \|y\|\)可以重新写为:
\[-1 \leq \frac{\langle x, y \rangle}{\|x\| \|y\|} \leq 1 \]
这允许我们在一般内积空间中定义向量夹角\(\theta\)的余弦:\(\cos \theta = \frac{\langle x, y \rangle}{\|x\| \|y\|}\)。因此,柯西-施瓦茨不等式保证了“余弦”的绝对值不超过1,与我们欧几里得几何的直觉一致。
由柯西-施瓦茨不等式,可以很容易地推导出三角不等式(这是范数必须满足的公理之一):
\[\|x + y\|^2 = \langle x+y, x+y \rangle = \|x\|^2 + 2\operatorname{Re}\langle x, y \rangle + \|y\|^2 \]
利用\(2\operatorname{Re}\langle x, y \rangle \leq 2|\langle x, y \rangle| \leq 2\|x\|\|y\|\),可得:
\[\|x + y\|^2 \leq \|x\|^2 + 2\|x\|\|y\| + \|y\|^2 = (\|x\| + \|y\|)^2 \]
开方即得\(\|x + y\| \leq \|x\| + \|y\|\)。这展示了柯西-施瓦茨不等式是连接内积与范数之间更深层结构的桥梁。
第六步:一个重要应用实例——相关系数的界限
在概率论与统计学中,对于两个随机变量\(X\)和\(Y\),其协方差定义为\(\operatorname{Cov}(X, Y) = E[(X-\mu_X)(Y-\mu_Y)]\),标准差为\(\sigma_X = \sqrt{E[(X-\mu_X)^2]}\)。相关系数\(\rho_{XY}\)定义为:
\[\rho_{XY} = \frac{\operatorname{Cov}(X, Y)}{\sigma_X \sigma_Y} \]
如果我们把期望\(E\)看作一种“内积”,即\(\langle X, Y \rangle = E[XY]\)(在零均值的随机变量空间中),那么柯西-施瓦茨不等式直接给出:
\[|E[XY]| \leq \sqrt{E[X^2]} \sqrt{E[Y^2]} \]
用\(X-\mu_X\)和\(Y-\mu_Y\)替换上式中的\(X\)和\(Y\),立即得到\(|\operatorname{Cov}(X, Y)| \leq \sigma_X \sigma_Y\),从而:
\[|\rho_{XY}| \leq 1 \]
这保证了相关系数始终在\([-1, 1]\)之间。等号成立对应完全线性相关。
总结
柯西-施瓦茨不等式是一个从具体几何直观(向量夹角)抽象出来,在极为广泛的数学框架(内积空间、希尔伯特空间、概率空间)中都成立的深刻结论。它不仅是证明其他重要结论(如三角不等式、赫尔德不等式)的有力工具,其本身也蕴含着内积结构的核心特性——即“投影”和“正交”的概念可以通过它来严格量化。从有限维的\(\mathbb{R}^n\)到无限维的\(L^2\)函数空间,它都扮演着统一和奠基的角色。