数学物理方程中的变分法
好的,我们开始学习“数学物理方程中的变分法”。这个方法的核心思想是:许多描述物理规律的微分方程,实际上等价于某个“量”(通常是能量或作用量)取极值(极大值、极小值或驻值)的要求。我们将一步步揭示这个深刻的联系。
第一步:从最速降线问题到变分法的基本概念
想象一个简单的问题:一个小球在重力作用下,从A点沿无摩擦的轨道滑到更低的一点B,什么样的轨道形状能使下滑时间最短?这就是著名的“最速降线”问题。
-
函数的函数——泛函:
- 我们熟悉的函数是
y = f(x),即一个数x映射到另一个数y。 - 在这里,我们考虑的对象是整个一条曲线
y(x)。下滑时间T并不依赖于一个特定的x值,而是依赖于我们所选择的整个曲线形状y(x)。因此,时间T是函数y(x)的函数。我们称这种“函数的函数”为泛函,记作T[y(x)]。
- 我们熟悉的函数是
-
泛函的极值——变分问题:
- 在微积分中,我们求函数
f(x)的极值,是找那个使函数值取极值的点x₀。 - 在变分法中,我们求泛函
T[y(x)]的极值,是找那条使泛函值(下滑时间)取极值的函数(曲线)y₀(x)。
- 在微积分中,我们求函数
-
变分:
- 函数求极值时,我们考虑自变量
x的微小变化dx,称为微分。 - 泛函求极值时,我们考虑函数
y(x)本身的微小变化。我们假设使泛函取极值的正确曲线是y(x),然后考虑一个与它“接近”的曲线y(x) + εη(x),其中η(x)是一个任意的微小扰动函数(通常在端点固定,即η(a) = η(b) = 0),ε是一个小参数。函数y(x)的这个改变量εη(x),就称为函数y(x)的变分,记作δy。
- 函数求极值时,我们考虑自变量
第二步:欧拉-拉格朗日方程——变分法的核心定理
现在,我们想知道,什么样的曲线 y(x) 能使某个泛函 J[y] = ∫ₐᵇ L(x, y(x), y‘((x)) dx 取极值?这里的被积函数 L 是关于 x, y, y’ 的已知函数,称为拉格朗日量。
-
推导:
-
考虑带扰动的曲线:
Y(x) = y(x) + εη(x)。 -
相应的泛函值为:
J(ε) = ∫ₐᵇ L(x, y+εη, y’+εη‘) dx。注意现在J是参数ε的函数。 -
如果
y(x)是极值曲线,那么对于任意的扰动η(x),函数J(ε)都应在ε=0处取极值。根据普通微积分的费马引理,必须有dJ/dε|_(ε=0) = 0。 -
计算这个导数,利用链式法则并分部积分,同时利用边界条件
η(a)=η(b)=0,我们可以得到极值曲线y(x)必须满足的必要条件:∂L/∂y - d/dx (∂L/∂y’) = 0
-
-
方程的意义:
- 这个方程就是欧拉-拉格朗日方程。它是一个关于未知函数
y(x)的微分方程。 - 它告诉我们:一个泛函
J[y]取极值的必要条件,是其对应的函数y(x)满足欧拉-拉格朗日方程。 这样,我们就把一个求泛函极值的“变分问题”,转化为了求解一个微分方程的“微分问题”。
- 这个方程就是欧拉-拉格朗日方程。它是一个关于未知函数
第三步:从力学到微分方程——最小作用量原理
这是变分法在数学物理中最辉煌的应用。
-
力学的基本原理:
- 牛顿力学用
F=ma(向量形式)来描述物体运动。这是一个微分方程。 - 然而,自然界似乎有一种“经济性”:一个力学系统(如单摆、行星)的实际运动路径,是使得一个叫做“作用量”的泛函取极值(通常是极小值)的那条路径。这称为哈密顿原理或最小作用量原理。
- 牛顿力学用
-
作用量与拉格朗日量:
- 作用量 S 是一个泛函:
S = ∫_(t₁)^(t₂) L dt。 - 其中的被积函数
L就是拉格朗日量,对于一个保守系统,它定义为系统的动能 T 减去势能 V,即L = T - V。
- 作用量 S 是一个泛函:
-
从原理到方程:
-
根据哈密顿原理,真实运动轨迹
q(t)(这里q是广义坐标,比如位置x或角度θ)是使作用量S取驻值的路径。 -
现在,我们把
S看作泛函S[q(t)] = ∫ L(t, q(t), q‘((t)) dt。 -
直接应用欧拉-拉格朗日方程(只需将之前的
x换成时间t,y换成广义坐标q),我们立即得到:∂L/∂q - d/dt (∂L/∂q’) = 0
-
这就是拉格朗日方程。对于不同的系统,写出其动能和势能,代入这个方程,就能直接得到其运动方程。
-
第四步:实例:从变分法推导牛顿第二定律
让我们用一个最简单的例子来验证这个强大的框架。
- 系统: 一维空间中,质量为
m的粒子,在势场V(x)中运动。 - 拉格朗日量: 动能
T = (1/2)mẋ²,势能V = V(x)。所以L = T - V = (1/2)mẋ² - V(x)。 - 计算欧拉-拉格朗日方程的各项:
∂L/∂x = - dV/dx(这就是力F)∂L/∂ẋ = mẋ(这就是动量p)d/dt (∂L/∂ẋ) = d/dt (mẋ) = mẍ(这就是ma)
- 代入方程:
[∂L/∂x] - [d/dt (∂L/∂ẋ)] = 0[-dV/dx] - [mẍ] = 0- 整理得:
mẍ = -dV/dx - 因为
F = -dV/dx,所以我们得到了 F = ma。
看,我们从“作用量取极值”这一条基本原理,自然而然地推导出了牛顿第二定律。这展示了变分法作为一种更基本、更统一的理论框架的威力。
总结
数学物理方程中的变分法,通过以下步骤将物理问题数学化:
- 识别泛函:将物理规律(如最小作用量原理、最小势能原理)表述为一个泛函的极值问题。
- 建立拉格朗日量:找到描述系统能量的关键函数
L。 - 应用欧拉-拉格朗日方程:将变分问题转化为等价的微分方程。
- 求解微分方程:解这个方程,得到的解就是使物理系统满足基本规律的函数(如运动轨迹、平衡形状等)。
这个方法不仅提供了推导微分方程的新途径,其强大的形式不变性也使其成为处理复杂系统(如相对论、电动力学、量子力学)的基石。