数学物理方程中的变分原理
变分原理是数学物理中一个深刻而强大的工具,它将许多物理定律和微分方程边值问题的求解,转化为某个泛函的极值(通常是极小值)问题。我们可以这样循序渐进地理解它:
- 从函数的极值到泛函的极值
- 函数的极值:在微积分中,我们熟悉如何求一个函数 \(f(x)\) 的极值。我们通过令其一阶导数为零(\(f'(x) = 0\))来找到可能的极值点(驻点)。
- 泛函的极值:变分法处理的对象是“函数的函数”,即泛函。一个泛函 \(J[y]\) 将整个函数 \(y(x)\) 映射为一个实数。例如,连接两点的曲线长度就是一个泛函,它的值取决于你所选择的路径(函数)。变分法的核心问题就是:在所有满足一定边界条件(如 \(y(x_1) = y_1\), \(y(x_2) = y_2\) )的函数中,哪一个函数能使泛函 \(J[y]\) 取极值?
- 最简泛函与欧拉-拉格朗日方程
- 考虑最基本也是最常见的一类泛函:
\[ J[y] = \int_{x_1}^{x_2} F(x, y(x), y'(x)) dx \]
其中 \(F\) 是一个已知的关于三个变量的函数。
- 可以证明,使该泛函取极值的函数 \(y(x)\) 必须满足一个必要条件,即欧拉-拉格朗日方程:
\[ \frac{\partial F}{\partial y} - \frac{d}{dx} \left( \frac{\partial F}{\partial y'} \right) = 0 \]
* 这是一个二阶常微分方程。求解这个方程,并结合边界条件,我们就能找到那个可能的“极值函数”。
- 变分原理在物理中的体现:最小作用量原理
- 这是变分原理在物理学中最著名、最基础的应用。在经典力学中,一个粒子系统的运动轨迹由哈密顿原理决定:在从时刻 \(t_1\) 到 \(t_2\) 的所有可能路径中,系统实际运动的路径是使作用量 \(S\) 取驻值(通常是极小值)的那一条。
- 作用量 \(S\) 是一个泛函,定义为拉格朗日函数 \(L\)(动能与势能之差)对时间的积分:
\[ S[\mathbf{q}(t)] = \int_{t_1}^{t_2} L(\mathbf{q}(t), \dot{\mathbf{q}}(t), t) dt \]
其中 \(\mathbf{q}(t)\) 是广义坐标,描述了系统的位形。
- 对作用量 \(S\) 应用欧拉-拉格朗日方程,我们直接得到拉格朗日方程:
\[ \frac{\partial L}{\partial q_i} - \frac{d}{dt} \left( \frac{\partial L}{\partial \dot{q_i}} \right) = 0 \quad (i=1,2,\dots,n) \]
这就是系统运动的微分方程。因此,整个牛顿力学的规律可以被囊括在一个简洁的变分原理之中。
- 从常微分到偏微分:场论的视角
- 变分原理同样适用于由偏微分方程描述的连续体系(如场、弹性体、流体)。
- 此时,我们考虑的不再是依赖于路径 \(\mathbf{q}(t)\) 的作用量,而是依赖于场函数 \(\phi(x, y, z, t)\) 的作用量密度的积分。泛函通常写作:
\[ S[\phi] = \int_{\Omega} \mathcal{L}(\phi, \partial_\mu \phi, x^\mu) d\Omega \]
其中 \(\mathcal{L}\) 是拉格朗日密度,\(\Omega\) 是时空区域。
- 对场的作用量 \(S[\phi]\) 取变分,并令其为零,我们得到场论的欧拉-拉格朗日方程:
\[ \frac{\partial \mathcal{L}}{\partial \phi} - \partial_\mu \left( \frac{\partial \mathcal{L}}{\partial (\partial_\mu \phi)} \right) = 0 \]
* **举例**:
- 对于静电势 \(\phi(x,y,z)\),其场方程是拉普拉斯方程 \(\nabla^2 \phi = 0\)。这个方程可以从要求静电场能量泛函 \(U[\phi] = \frac{\epsilon_0}{2} \int |\nabla \phi|^2 dV\) 取极小值推导出来。
* 在量子力学中,薛定谔方程可以从一个变分原理(通常称为瑞利-里兹变分法)导出,该原理要求系统的能量期望值在真实的波函数下取极小。
- 变分原理的威力与数值应用
- 统一性:它为物理学中看似不同的领域(力学、电磁学、量子力学、广义相对论)提供了一个统一的数学框架。物理定律被表述为某个量(作用量)取极值。
- 便捷性:在处理复杂系统或有约束的系统时,直接写出其作用量并应用变分原理,往往比尝试列出所有微分方程更为简便。
- 数值方法的基础:变分原理直接催生了强大的数值方法,如里兹法和有限元法。这些方法的基本思想是,不去直接求解困难的微分方程,而是在一个有限的函数空间中寻找使泛函近似取极值的函数,从而将连续的微分方程问题转化为离散的线性代数问题。