变分法 是处理泛函 的数学 领域,和处理函数的普通微积分 相对。譬如,这样的泛函 可以通过未知函数的积分和它的导数来构造。变分法最终寻求的是极值 函数:它们使得泛函取得极大或极小值。有些曲线 上的经典问题采用这种形式表达:一个例子是最速降线 ,在重力作用下一个粒子沿着该路径可以在最短时间从点A到达不直接在它底下的一点B。在所有从A到B的曲线中必须极小化代表下降时间的表达式。
变分法的关键定理是欧拉-拉格朗日方程 。它对应于泛函的临界点 。在寻找函数的极大和极小值时,在一个解附近的微小变化的分析给出一阶的一个近似。它不能分辨是找到了最大值或者最小值(或者都不是)。
变分法在理论物理 中非常重要:在拉格朗日力学 中,以及在最小作用量原理 在量子力学 的应用中。变分法提供了有限元方法 的数学基础,它是求解边界值问题 的强力工具。它们也在材料学中研究材料平衡中大量使用。而在纯数学中的例子有,黎曼 在调和函数 中使用狄利克雷原理 。
同样的材料可以出现在不同的标题中,例如希尔伯特空间 技术,莫尔斯理论 ,或者辛几何 。变分 一词用于所有极值泛函问题。微分几何 中的测地线 的研究是很显然的变分性质的领域。极小曲面 (肥皂泡 )上也有很多研究工作,称为普拉托问题 。
变分法可能是从约翰·伯努利 (1696)提出最速曲线 (brachistochrone curve)问题开始出现的。[ 1] 它立即引起了雅各布·伯努利 和洛必达 (Marquis de l'Hôpital)的注意。但欧拉 首先详尽的阐述了这个问题。他的贡献始于1733年,他的《变分原理》(Elementa Calculi Variationum)寄予了这门科学这个名字。欧拉 对这个理论的贡献非常大。
勒让德 (1786)确定了一种方法,但在对极大和极小的区别不完全令人满意。牛顿 和莱布尼茨 也是在早期关注这一学科,对于这两者的区别Vincenzo Brunacci(1810)、高斯 (1829)、泊松 (1831)、Mikhail Ostrogradsky(1834)、和雅可比 (1837)都曾做出过贡献。Sarrus(1842)的由柯西 (1844)浓缩和修改的是一个重要的具有一般性的成就。Strauch(1849)、Jellett(1850)、Otto Hesse(1857)、Alfred Clebsch(1858)、和Carll(1885)写了一些其他有价值的论文和研究报告,但可能那个世纪最重要的成果是Weierstrass所取得的。他关于这个理论的著名教材是划时代的,并且他可能是第一个将变分法置于一个稳固而不容置疑的基础上的。1900年希尔伯特 发表的23个问题中的第20和23个问题促进了其更深远的发展。
在20世纪希尔伯特 、埃米·诺特 、列奧尼達·托內利 、昂利·勒貝格 和雅克·阿达马 等人做出重要贡献。Marston Morse将变分法应用在莫尔斯理论 中。Lev Pontryagin、Ralph Rockafellar和Clarke广义变分法最优控制理论 发展了新的数学工具。
在理想情形下,一函數的极大值及极小值會出現在其導數 為 0 {\displaystyle 0} 的地方。同樣地,求解變分問題時也可以先求解相關的欧拉-拉格朗日方程 。以下以尋找連接平面上兩點 ( x 1 , y 1 ) {\displaystyle (x_{1},y_{1})} 和 ( x 2 , y 2 ) {\displaystyle (x_{2},y_{2})} 最短曲線的例子,說明求解的過程。曲線的長度為
A [ f ] = ∫ x 1 x 2 1 + [ f ′ ( x ) ] 2 d x {\displaystyle A[f]=\int _{x_{1}}^{x_{2}}{\sqrt {1+[f'(x)]^{2}}}\,dx} 其中
f ′ ( x ) = d f d x , {\displaystyle f'(x)={\frac {df}{dx}},\,} f ( x 1 ) = y 1 , {\displaystyle f(x_{1})=y_{1},\,} f ( x 2 ) = y 2 {\displaystyle f(x_{2})=y_{2}\,} 。 函數 f {\displaystyle f} 至少需為一階可微的函數。若 f 0 {\displaystyle f_{0}} 是一個局部最小值 ,而 f 1 {\displaystyle f_{1}} 是一個在端點 x 1 {\displaystyle x_{1}} 及 x 2 {\displaystyle x_{2}} 取值为零并且至少有一階導數的函數,則可得到以下的式子
A [ f 0 ] ≤ A [ f 0 + ϵ f 1 ] {\displaystyle A[f_{0}]\leq A[f_{0}+\epsilon f_{1}]} 其中 ϵ {\displaystyle \epsilon } 為任意接近 0 {\displaystyle 0} 的數字。
因此 A [ f 0 + ϵ f 1 ] {\displaystyle A[f_{0}+\epsilon f_{1}]} 對 ϵ {\displaystyle \epsilon } 的導數(A的一階導數 )在 ϵ = 0 {\displaystyle \epsilon =0} 時必為 0 {\displaystyle 0} :
d d ϵ ∫ x 1 x 2 1 + [ f 0 ′ ( x ) + ϵ f 1 ′ ( x ) ] 2 d x | ϵ = 0 = ∫ x 1 x 2 ( f 0 ′ ( x ) + ϵ f 1 ′ ( x ) ) f 1 ′ ( x ) 1 + [ f 0 ′ ( x ) + ϵ f 1 ′ ( x ) ] 2 | ϵ = 0 d x = ∫ x 1 x 2 f 0 ′ ( x ) f 1 ′ ( x ) 1 + [ f 0 ′ ( x ) ] 2 d x = 0 {\displaystyle {\frac {d}{d\epsilon }}\int _{x_{1}}^{x_{2}}\left.{\sqrt {1+[f_{0}'(x)+\epsilon f_{1}'(x)]^{2}}}dx\right|_{\epsilon =0}=\int _{x_{1}}^{x_{2}}\left.{\frac {(f_{0}'(x)+\epsilon f_{1}'(x))f_{1}'(x)}{\sqrt {1+[f_{0}'(x)+\epsilon f_{1}'(x)]^{2}}}}\right|_{\epsilon =0}dx=\int _{x_{1}}^{x_{2}}{\frac {f_{0}'(x)f_{1}'(x)}{\sqrt {1+[f_{0}'(x)]^{2}}}}\,dx=0}
此條件可視為在可微分函數的空間中, A [ f 0 ] {\displaystyle A[f_{0}]} 在各方向的導數均為 0 {\displaystyle 0} 。若假設 f 0 {\displaystyle f_{0}} 二階可微(或至少弱微分 存在),則利用分部積分法 可得
∫ x 1 x 2 f 1 ( x ) d d x [ f 0 ′ ( x ) 1 + [ f 0 ′ ( x ) ] 2 ] d x = 0 , {\displaystyle \int _{x_{1}}^{x_{2}}f_{1}(x){\frac {d}{dx}}\left[{\frac {f_{0}'(x)}{\sqrt {1+[f_{0}'(x)]^{2}}}}\right]\,dx=0,} 其中 f 1 {\displaystyle f_{1}} 為在兩端點皆為0的任意二階可微函數。這是變分法基本引理 的一個特例:
I = ∫ x 1 x 2 f 1 ( x ) H ( x ) d x = 0 {\displaystyle I=\int _{x_{1}}^{x_{2}}f_{1}(x)H(x)dx=0} , 其中 f 1 {\displaystyle f_{1}} 為在兩端點皆為 0 {\displaystyle 0} 的任意可微函數。
若存在 x = x ^ {\displaystyle x={\hat {x}}} 使 H ( x ) > 0 {\displaystyle H(x)>0} ,則在 x ^ {\displaystyle {\hat {x}}} 周圍有一區間的H也是正值。可以選擇 f 1 {\displaystyle f_{1}} 在此區間外為 0 {\displaystyle 0} ,在此區間內為非負值,因此 I > 0 {\displaystyle I>0} ,和前提不合。若存在 x = x ^ {\displaystyle x={\hat {x}}} 使 H ( x ) < 0 {\displaystyle H(x)<0} ,也可證得類似的結果。因此可得到以下的結論:
d d x [ f 0 ′ ( x ) 1 + [ f 0 ′ ( x ) ] 2 ] = 0 {\displaystyle {\frac {d}{dx}}\left[{\frac {f_{0}'(x)}{\sqrt {1+[f_{0}'(x)]^{2}}}}\right]=0} , 由結論可推得下式:
d 2 f 0 d x 2 = 0 {\displaystyle {\frac {d^{2}f_{0}}{dx^{2}}}=0} , 因此兩點間最短曲線為一直線。
在一般情形下,則需考慮以下的計算式
A [ f ] = ∫ x 1 x 2 L ( x , f , f ′ ) d x {\displaystyle A[f]=\int _{x_{1}}^{x_{2}}L(x,f,f')dx} , 其中f 需有二階連續的導函數。在這種情形下,拉格朗日量L在極值 f 0 {\displaystyle f_{0}} 处滿足欧拉-拉格朗日方程
− d d x ∂ L ∂ f ′ + ∂ L ∂ f = 0 {\displaystyle -{\frac {d}{dx}}{\frac {\partial L}{\partial f'}}+{\frac {\partial L}{\partial f}}=0} , 不過在此處,欧拉-拉格朗日方程只是有極值的必要條件 ,並不是充分條件。
費馬原理 指出:光會沿着兩端點之間所需光程 最短的路徑前進。假設 y = f ( x ) {\displaystyle y=f(x)} 為光的路徑,則光程可以下式表示:
A [ f ] = ∫ x = x 0 x 1 n ( x , f ( x ) ) 1 + f ′ ( x ) 2 d x {\displaystyle A[f]=\int _{x=x_{0}}^{x_{1}}n(x,f(x)){\sqrt {1+f'(x)^{2}}}dx} , 其中折射率 n ( x , y ) {\displaystyle n(x,y)} 依材料特性而定。
若選擇 f ( x ) = f 0 ( x ) + ϵ f 1 ( x ) {\displaystyle f(x)=f_{0}(x)+\epsilon f_{1}(x)} ,則 A {\displaystyle A} 的一階導數( A {\displaystyle A} 對 ϵ {\displaystyle \epsilon } 的微分)為:
δ A [ f 0 , f 1 ] = ∫ x = x 0 x 1 [ n ( x , f 0 ) f 0 ′ ( x ) f 1 ′ ( x ) 1 + f 0 ′ ( x ) 2 + n y ( x , f 0 ) f 1 1 + f 0 ′ ( x ) 2 ] d x {\displaystyle \delta A[f_{0},f_{1}]=\int _{x=x_{0}}^{x_{1}}\left[{\frac {n(x,f_{0})f_{0}'(x)f_{1}'(x)}{\sqrt {1+f_{0}'(x)^{2}}}}+n_{y}(x,f_{0})f_{1}{\sqrt {1+f_{0}'(x)^{2}}}\right]dx} , 將括號中的第一項用分部積分處理,可得歐拉-拉格朗日方程
− d d x [ n ( x , f 0 ) f 0 ′ 1 + f 0 ′ 2 ] + n y ( x , f 0 ) 1 + f 0 ′ ( x ) 2 = 0 {\displaystyle -{\frac {d}{dx}}\left[{\frac {n(x,f_{0})f_{0}'}{\sqrt {1+f_{0}'^{2}}}}\right]+n_{y}(x,f_{0}){\sqrt {1+f_{0}'(x)^{2}}}=0} 。 光線的路徑可由上述的積分式而得。
當光進入或離開透鏡面時,折射率會有不連續的變化。考慮
n ( x , y ) = n − if x < 0 {\displaystyle n(x,y)=n_{-}\quad {\hbox{if}}\quad x<0} , n ( x , y ) = n + if x > 0 {\displaystyle n(x,y)=n_{+}\quad {\hbox{if}}\quad x>0} , 其中 n − {\displaystyle n_{-}} 和 n + {\displaystyle n_{+}} 是常數。在x <0或x >0的區域,歐拉-拉格朗日方程均和以上描述的相同。因為折射率在二個區域均為定值,在二個區域光都以直線前進。而在x =0的位置,f 必須連續,不過f' 可以不連續。在上述二個區域用分部積分的方式解歐拉-拉格朗日方程,則其變分量為
δ A [ f 0 , f 1 ] = f 1 ( 0 ) [ n − f 0 ′ ( 0 − ) 1 + f 0 ′ ( 0 − ) 2 − n + f 0 ′ ( 0 + ) 1 + f 0 ′ ( 0 + ) 2 ] {\displaystyle \delta A[f_{0},f_{1}]=f_{1}(0)\left[n_{-}{\frac {f_{0}'(0_{-})}{\sqrt {1+f_{0}'(0_{-})^{2}}}}-n_{+}{\frac {f_{0}'(0_{+})}{\sqrt {1+f_{0}'(0_{+})^{2}}}}\right]} 。 和 n − {\displaystyle n_{-}} 相乘的係數是入射角的正弦值,和 n + {\displaystyle n_{+}} 相乘的係數則是折射角的正弦值。若依照斯涅爾定律 ,上述二項的乘積相等,因此上述的變分量為0。因此斯涅爾定律所得的路徑也就是要求光程一階變分量為0的路徑。
費馬原理可以用向量的形式表示:令 X = ( x 1 , x 2 , x 3 ) {\displaystyle X=(x_{1},x_{2},x_{3})} ,而t 為其參數, X ( t ) {\displaystyle X(t)} 是曲線C 參數化的表示,而令 X ˙ ( t ) {\displaystyle {\dot {X}}(t)} 為其法線向量。因此在曲線上的光程長為
A [ C ] = ∫ t = t 0 t 1 n ( X ) X ˙ ⋅ X ˙ d t {\displaystyle A[C]=\int _{t=t_{0}}^{t_{1}}n(X){\sqrt {{\dot {X}}\cdot {\dot {X}}}}dt} 。 上述積分和t無關,因此也和C 的參數表示方式無關。使曲線最短的歐拉-拉格朗日方程有以下的對稱形式
d d t P = X ˙ ⋅ X ˙ ∇ n {\displaystyle {\frac {d}{dt}}P={\sqrt {{\dot {X}}\cdot {\dot {X}}}}\nabla n} , 其中
P = n ( X ) X ˙ X ˙ ⋅ X ˙ {\displaystyle P={\frac {n(X){\dot {X}}}{\sqrt {{\dot {X}}\cdot {\dot {X}}}}}} 。 依P的定義可得下式
P ⋅ P = n ( X ) 2 {\displaystyle P\cdot P=n(X)^{2}} 。 因此上述積分可改為下式
A [ C ] = ∫ t = t 0 t 1 P ⋅ X ˙ d t {\displaystyle A[C]=\int _{t=t_{0}}^{t_{1}}P\cdot {\dot {X}}\,dt} 。 依照上式,若可以找到一個函數ψ,其梯度为P ,則以上的積分A 就可以由在積分端點上ψ的差求得。以上求解曲線使積分量不變的問題就和ψ的level surface有關。為了要找到滿足此條件的函數ψ,需要對控制光線傳動的波動方程式進行進一步的研究。
最优控制 的理论是变分法的一个推广。
^ Gelfand, I. M. ; Fomin, S. V. Silverman, Richard A. , 编. Calculus of variations Unabridged repr. Mineola, N.Y.: Dover Publications. 2000: 3 [2013-05-22 ] . ISBN 978-0486414485 . (原始内容存档 于2019-05-03). Fomin, S.V. and Gelfand, I.M. : Calculus of Variations, Dover Publ., 2000 Lebedev, L.P. and Cloud, M.J.: The Calculus of Variations and Functional Analysis with Optimal Control and Applications in Mechanics, World Scientific, 2003, pages 1-98 Charles Fox: An Introduction to the Calculus of Variations, Dover Publ., 1987 Forsyth, A.R.: Calculus of Variations, Dover, 1960 Sagan, Hans: Introduction to the Calculus of Variations, Dover, 1992 Weinstock, Robert: Calculus of Variations with Applications to Physics and Engineering, Dover, 1974 Clegg, J.C.: Calculus of Variations, Interscience Publishers Inc., 1968 Elsgolc, L.E.: Calculus of Variations, Pergamon Press Ltd., 1962