Calcul des variations

Le calcul des variations (ou calcul variationnel) est, en mathématiques et plus précisément en analyse fonctionnelle, un ensemble de méthodes permettant de minimiser une fonctionnelle. Celle-ci, qui est à valeurs réelles, dépend d'une fonction qui est l'inconnue du problème. Il s'agit donc d'un problème de minimisation dans un espace fonctionnel de dimension infinie.

Le calcul des variations s'est développé depuis le milieu du XVIII^e siècle jusqu'aujourd'hui ; son dernier avatar est la théorie de la commande optimale, datant de la fin des années 1950. Le calcul des variations a des applications dans de nombreux domaines :

L'inconnue étant une courbe paramétrée, on recherche une courbe de longueur minimale (ou extrémale), autrement dit une géodésique ; c'est une question fondamentale en géométrie différentielle ;
L'inconnue étant une surface, on recherche, pour un périmètre donné, la surface d'aire maximale (problème d'isopérimétrie) ;
En physique, le principe de moindre action affirme que les mouvements d'un système matériel se produisent de manière, sinon à minimiser l'action, du moins à rendre celle-ci stationnaire. Ces mouvements peuvent donc être déterminés en minimisant ou en rendant stationnaire cette fonctionnelle, ce qui fait du calcul des variations un outil fondamental pour les physiciens (formulation variationnelle des équations de la physique) ;
Une condition nécessaire d'extremum (ou plus généralement de stationnarité) de la fonctionnelle est l'équation d'Euler-Lagrange. Or, il arrive que le but qu'on se propose soit précisément la résolution d'une équation différentielle qu'on montre (en résolvant le « problème inverse du calcul des variations ») être l'équation d'Euler-Lagrange d'un problème variationnel ; la résolution de celui-ci (effectuée, par exemple, en passant au formalisme hamiltonien) fournit la solution de celle-là.

Les principaux résultats du calcul des variations « classique », qui fait l'objet de cet article sont :

L'équation d'Euler-Lagrange (condition nécessaire du premier ordre) ;
Les conditions de transversalité (dans le cas de problèmes à extrémités variables) ;
Les conditions du second ordre de minimum faible de Legendre et de Jacobi ;
Les conditions du second ordre de minimum fort de Weierstrass ;
La relation entre formalisme lagrangien et le formalisme hamiltonien (transformation de Legendre) ;
Les équations de Hamilton-Jacobi et le théorème de Jacobi ;
Enfin, pour ses applications à la physique, le théorème de Noether.

Historique[modifier | modifier le code]

Sans aller jusqu'au problème de la reine Didon, on peut faire remonter les principes variationnels à Pierre de Fermat (1657) et Christian Huygens (1690) pour l'étude de la propagation de la lumière (principe de Fermat et principe de Huygens-Fresnel). Néanmoins, le calcul des variations est né en 1696, avec le problème de la courbe brachistochrone, posé par Jean Bernoulli (à la suite de Galilée dans son Dialogue sur les deux grands systèmes du monde paru en 1632)^[1] ; il s’agit d’un problème de temps minimal (comme l’indique la racine grecque de brachistochrone : « βραχιστος (brachistos) », « le plus court » ; « χρονος (chronos) », « temps »). Ce problème fut résolu par Jean et Jacques Bernoulli, Gottfried Wilhelm Leibniz, Isaac Newton, Guillaume François Antoine de l'Hôpital et Ehrenfried Walther von Tschirnhaus. La solution de Jacques Bernoulli se fondait sur le principe d'Huygens et l'idée du front d'onde ; elle préfigurait l'équation de Hamilton-Jacobi. Celle de Jean Bernoulli était fondée sur une analogie avec la propagation de la lumière et le principe de Fermat, ainsi que la loi de Descartes. Celle de Leibniz, enfin, était fondée sur l'approximation de la courbe par des lignes brisées et était le premier pas vers l'équation d'Euler-Lagrange^[2].

Le second pas a été accompli par Euler, élève de Jean Bernoulli : Euler a ébauché à partir de considérations géométriques la méthode des « petites variations » en 1744. Joseph-Louis Lagrange a introduit le vocable « calcul des variations » vers 1760^[1] et a donné sa forme actuelle à la solution d'Euler. Adrien-Marie Legendre a complété en 1786 l'équation d'Euler-Lagrange, qui est une condition du premier ordre, par la condition du second ordre qui porte son nom. Ces résultats ont été rassemblés par Lagrange dans sa Théorie des fonctions analytiques, parue en 1797 ; Lagrange a également introduit les variables canoniques en 1811 dans sa Mécanique analytique (bien qu'elles aient été attribuées à William Rowan Hamilton par Charles Gustave Jacob Jacobi)^[1]. L'équation d'Euler-Lagrange a été étendue au cas du calcul des variations à intégrales multiples en 1834 par Mikhaïl Ostrogradski^[3] (généralisant un résultat obtenu en 1831 par Siméon Denis Poisson sur le même sujet). L'équation d'Hamilton-Jacobi a été introduite en premier lieu par Hamilton dans son Second Essay on a General Method in Dynamics en 1835 à l'occasion d'un problème de mécanique. Jacobi a complété la condition du second ordre de Legendre en 1837, avec la théorie des « points conjugués »^[4] et a reformulé la contribution de Hamilton, cette fois dans un contexte général, dans ses Vorlesungen über Dynamik (1842). Alfred Clebsch a généralisé en 1858 les résultats de Legendre et de Jacobi^[5]. Eduard Heine a établi le lemme fondamental du calcul des variations en 1870^[6]. Il revenait à Karl Weierstrass, dans ses cours professés à l'université de Berlin, notamment celui de 1879, de définir la notion d'extremum fort, et d'établir la condition qui porte son nom, ainsi que la « condition d'arrondissement des angles » (également obtenue, indépendamment, par G. Erdmann en 1877^[7]). Paul David Gustave du Bois-Reymond^[8]^,^[9] a établi son fameux lemme en 1879 : cette extension du lemme fondamental du calcul des variations permet d'établir de manière plus satisfaisante l'équation d'Euler-Lagrange. Enfin, David Hilbert a établi le théorème de l'intégrale invariante (qui clarifie la théorie de Weierstrass) et résolu le problème de Dirichlet^[10] (le problème de calcul de variations à intégrales multiples le plus célèbre) en 1900. Les principaux résultats du calcul des variations classique avaient dès lors été obtenus.

Néanmoins, des compléments substantiels ont été apportés au tournant du XX^e siècle par Hermann Amandus Schwarz (généralisation du théorème de Weierstrass entre 1898 et 1899) et Adolf Kneser^[11] (condition de transversalité, 1900). Oskar Bolza^[12] et Harris Hancock^[13] ont réalisé indépendamment en 1904 deux synthèses de tous les travaux précédents ; leur lecture est encore très instructive. Christian Gustav Adolph Mayer (en) a introduit en 1905 les « champs de Mayer » qui généralisent les champs d'extrémales de Weierstrass ; il a également réalisé une étude fine des « arcs anormaux ». William Fogg Osgood^[14] et Jacques Hadamard^[15]^,^[16] ont continué d'étudier entre 1900 et 1906 le calcul des variations avec intégrale multiple. On peut encore citer les contributions de la première moitié du XX^e siècle dues à Emmy Noether (théorème de Noether^[17] : obtenu en 1918, il est la formulation mathématique des lois de conservation en physique - de l'énergie, de l'impulsion, du moment cinétique, etc.) ; à Alfréd Haar (le lemme de Haar, datant des années 1926-1932, peut être vu comme une extension du lemme de Du Bois-Reymond au cas d'intégrales multiples)^[18]^,^[19] ; et à Constantin Carathéodory^[20] (Hermann Boerner (de) parlait de l'approche de Carathéodory en 1953 comme « der Königsweg der Variationsrechnung », littéralement « la voie royale du calcul des variations »). Gilbert Ames Bliss et ses élèves, dont Magnus Hestenes, ont réalisé pendant plus de vingt ans une étude détaillée du problème de Bolza, étude dont les résultats ont été rassemblés dans la vaste synthèse que sont les Lectures on the Calculus of Variations^[1] de Bliss. Mentionnons encore George David Birkhoff et son élève Marston Morse^[21] (théorie de Morse). La théorie de Morse a été généralisée par Richard Palais et Stephen Smale en 1964 (condition de compacité de Palais-Smale)^[22]^,^[23].

Le calcul des variations a connu un profond renouveau dans les années 1950 avec le développement de la théorie de la commande optimale, sous l'impulsion de Lev Pontriaguine^[24] et Richard Bellman^[25]^,^[26]. Le formalisme de Pontryagin et de Bellman est une extension et une amélioration du formalisme hamiltonien classique, et clarifie la formulation de Carathéodory^[27]. On peut encore mentionner les contributions, postérieures à 1960, de Jacques-Louis Lions, Ivar Ekeland et Jean-Pierre Aubin. Le calcul des variations « non lisse » développé vers la fin des années 1980 par Frank H. Clarke, est un apport significatif^[28]. Le calcul des variations reste en mathématiques un domaine fort actif. Les mathématiciens qui ont contribué à son développement sont extrêmement nombreux (ils comprennent la plupart des grands noms du XIX^e siècle et du début du XX^e, et même le célèbre philosophe Edmund Husserl, élève des mathématiciens Leo Königsberger, Leopold Kronecker et Karl Weierstrass ; Husserl a soutenu en 1883 sa thèse Beiträge zur Variationsrechnung). N'ont été mentionnés plus haut que certains parmi les plus notables de ces mathématiciens.

Un domaine d'application important du calcul des variations est l'étude des géodésiques sur une variété munie d'une connexion affine, et plus particulièrement des géodésiques minimales dans un espace de Riemann^[29]. L'étude locale des géodésiques minimales sur une surface a été réalisée, à la suite de Carl Friedrich Gauss, par Jacobi (théorie des points conjugués) et Pierre-Ossian Bonnet (qui a démontré le résultat que Jacobi avait énoncé sans démonstration)^[30]. Ces travaux ont été complétés par Kneser, Tullio Levi-Civita et Élie Cartan (ce dernier ayant donné de l'équation géodésique sa forme intrinsèque^[31]). Le problème global n'a cessé d'être à l'ordre du jour et a donné naissance à la théorie de Morse, déjà évoquée.

Problèmes fondamentaux du calcul des variations[modifier | modifier le code]

Problème à extrémités fixes[modifier | modifier le code]

C'est le problème le plus simple, parfois appelé problème de Lagrange.

Soit $[t 0, t f]$ un intervalle de la droite réelle et $Ω 1$ , $Ω 2$ des ouverts non vides dans un espace vectoriel normé $X$ qu'on peut supposer de dimension finie. Soit d'autre part

{\mathcal {L}}:[t_{0},t_{f}]\times \Omega _{1}\times \Omega _{2}\rightarrow \mathbb {R} :(t,x,u)\mapsto {\mathcal {L}}(t,x,u)

une fonction appelée lagrangien, supposée continûment différentiable (en abrégé : de classe ${\mathcal {C}}^{1})$ ainsi que sa différentielle partielle ${\frac {\partial {\mathcal {L}}}{\partial u}}$ .

Le problème de Lagrange consiste à déterminer (si elle existe) une fonction suffisamment régulière $x=x(.):t\mapsto x(t)\in \Omega _{1}$

telle que $x (t 0) = x 0$ et $x (t f) = x f$ , où $x 0$ et $x f$ sont des points fixés de $Ω 1$ ,
avec ${\dot {x}}(t)\in \Omega _{2}\left(t\in [t_{0},t_{f}]\right)$ ,
et minimisant la fonctionnelle $J$ définie par

J(x(.))=\int _{t_{0}}^{t_{f}}{\mathcal {L}}\left(t,x(t),{\dot {x}}\left(t\right)\right)\mathrm {d} t

.

Problème à extrémités variables[modifier | modifier le code]

Nous considérons maintenant un problème plus général où ni les bornes d'intégration $t 0$ et $t f$ , ni les points $x 0$ et $x f$ , ne sont fixés. La fonctionnelle à minimiser est

J(x(.))=K(t_{0},x_{0},t_{f},x_{f})+\int _{t_{0}}^{t_{f}}{\mathcal {L}}\left(t,x(t),{\dot {x}}(t)\right)\mathrm {d} t

avec les contraintes $(t_{0},x_{0})\in {\mathcal {V}}_{0}$ , $(t_{f},x_{f})\in {\mathcal {V}}_{f}$ , où ${\mathcal {V}}_{0}$ et ${\mathcal {V}}_{f}$ sont des sous-variétés de ${\mathcal {I}}\times \Omega _{1}$ , ${\mathcal {I}}$ désignant un intervalle compact de la droite réelle. La fonction ${\mathcal {L}}$ vérifie les mêmes hypothèses que ci-dessus et la fonction $K$ est continûment différentiable.

La fonctionnelle ci-dessus est mixte (du fait de la présence du terme $K (t 0, x 0, t f, x f)$ ) et le problème correspondant est appelé le problème de Bolza. On se ramène au cas d'une fonctionnelle intégrale (problème de Lagrange avec extrémités variables) en définissant une inconnue supplémentaire $y$ définie à une constante près par ${\dot {y}}={\frac {1}{t_{f}-t_{0}}}K\left(t_{0},x_{0},t_{f},x_{f}\right)$ , puisque alors $J = J (x (.), y (.)))$ où

J\left(x(.),y(.)\right)=\int _{t_{0}}^{t_{f}}\left({\mathcal {L}}\left(t,x(t),{\dot {x}}(t)\right)+{\dot {y}}(t)\right)\mathrm {d} t

.

On peut aussi se ramener au cas d'un problème de la forme dite du problème de Mayer

J({\hat {x}}(.))={\hat {K}}\left(t_{0},{\hat {x}}_{0},t_{f},{\hat {x}}_{f}\right)

en posant ${\dot {z}}={\mathcal {L}}\left(t,x,{\dot {x}}\right),\,{\hat {x}}_{0}=(x_{0},z_{0}),\,{\hat {x}}_{f}=(x_{f},z_{f})$ et

{\hat {K}}\left(t_{0},{\hat {x}}_{0},t_{f},{\hat {x}}_{f}\right)=K\left(t_{0},x_{0},t_{f},x_{f}\right)+z_{f}-z_{0}

.

Minimum faible et minimum fort[modifier | modifier le code]

Si, dans ce qui précède, on recherche des minima globaux, le problème est en général sans solution. On est donc conduit à rechercher des minima locaux. Par définition, $x^{\ast }$ minimise localement $J (x)$ si $J(x)-J(x^{\ast })\geq 0$ pour toute fonction suffisamment régulière $x$ dans un voisinage suffisamment petit de $x^{\ast }$ . Il reste à préciser quel type de régularité on impose à $x^{\ast }$ et, puisqu'on a ici affaire à un problème en dimension infinie, par quelle norme on définit les voisinages de 0.

Une première possibilité consiste à imposer à $x^{\ast }$ d'être de classe ${\mathcal {C}}^{1}$ , c'est-à-dire continûment dérivable, donc d'appartenir à l'espace ${\mathcal {C}}^{1}\left({\mathcal {I}},\mathbf {X} \right)$ des fonctions continûment dérivables de ${\mathcal {I}}$ dans $X$ . On peut munir cet espace de la norme

\left\Vert x\right\Vert _{1}=\sup \limits _{t\in {\mathcal {I}}}\left(\left\Vert x(t)\right\Vert +\left\Vert {\dot {x}}(t)\right\Vert \right)

qui en fait un espace de Banach qu'on notera ${\mathcal {E}}^{1}$ .

Une autre possibilité consiste à imposer seulement à $x^{\ast }$ d'être continûment dérivable par morceaux, c'est-à-dire continue, et ayant une dérivée continue sauf en un nombre fini de points, et ayant en ces points une dérivée à gauche et une dérivée à droite. Soit $K{\mathcal {C}}^{1}\left({\mathcal {I}},\mathbf {X} \right)$ l'espace des fonctions continûment dérivables par morceaux par morceaux de ${\mathcal {I}}$ dans $X$ . On peut munir cet espace de la norme

\Vert x\Vert _{0}=\sup \limits _{t\in {\mathcal {I}}}\left(\Vert x(t)\Vert \right)

qui en fait un espace vectoriel normé, non complet, qu'on notera ${\mathcal {E}}^{0}$ .

Définition — Un minimum local de $J$ sur ${\mathcal {E}}^{1}$ (resp. ${\mathcal {E}}^{0}$ ) est appelé un minimum local faible (resp. fort).

On montre que, sous les hypothèses qui ont été précisées, la fonction $J:x\mapsto J(x)$ est différentiable sur ${\mathcal {E}}^{1}$ , mais non sur ${\mathcal {E}}^{0}$ . Il s'ensuit que la minimisation faible relève du calcul différentiel classique dans un espace de Banach, ce qui n'est pas le cas de la minimisation forte.

Remarque sur la notion de minimum fort[modifier | modifier le code]

Pour la formulation de la notion de minimum fort, d'autres espaces fonctionnels que $K{\mathcal {C}}^{1}\left({\mathcal {I}},\mathbf {X} \right)$ sont possibles : on peut notamment le remplacer par $W^{1,1}\left({\mathcal {I}},\mathbf {X} \right)$ , l'espace des fonctions absolument continues de ${\mathcal {I}}$ dans $X$ (on a $W^{1,1}\left({\mathcal {I}},\mathbf {X} \right)\supset K{\mathcal {C}}^{1}\left({\mathcal {I}},\mathbf {X} \right)$ ) ; dans certains cas, $J (x (.))$ admet un minimum sur $W^{1,1}\left({\mathcal {I}},\mathbf {X} \right)$ mais non sur $K{\mathcal {C}}^{1}\left({\mathcal {I}},\mathbf {X} \right)$ comme l'a montré Leonida Tonelli en 1915^[32]. Néanmoins, nous nous limiterons dans ce qui suit à la définition donnée plus haut qui permet d'éviter quelques difficultés.

Notons qu'une fonction continûment dérivable qui fournit un minimum local fort fournit nécessairement un minimum local faible. Par suite, pour une fonction continûment dérivable, une condition nécessaire de minimum local faible (voir, ci-dessous, la partie (A) du théorème de Jacobi-Weierstrass) est également une condition nécessaire de minimum local fort. Au contraire, une condition suffisante de minimum local fort (voir, ci-dessous, la condition suffisante de minimum fort de Weierstrass) est également une condition suffisante de minimum local faible, compte tenu du schéma logique, valide pour une fonction de classe ${\mathcal {C}}^{1}$ :

condition suffisante de minimum fort ⇒ minimum fort ⇒ minimum faible ⇒ condition nécessaire de minimum faible

Problèmes isopérimétriques[modifier | modifier le code]

Ces problèmes consistent à minimiser une fonctionnelle $J 0 (x (.))$ sous les contraintes $J_{i}(x(.))=0\,(i=1,\dots ,m)$ avec

J_{i}(x(.))=\int _{t_{0}}^{t_{f}}{\mathcal {L}}_{i}\left(t,x(t),{\dot {x}}(t)\right)\mathrm {d} t

,

toutes les fonctions ${\mathcal {L}}_{i}(i=0,\dots ,m)$ vérifiant les mêmes hypothèses que la fonction ${\mathcal {L}}$ ci-dessus.

Problèmes à intégrale multiple[modifier | modifier le code]

Soit $D$ une variété de dimension n, éventuellement à bord, et

J\left(u(.)\right)=\int _{D}{\mathcal {L}}\left(x,u,{\frac {\partial u}{\partial x}}\right)\mathrm {d} x

,

$x$ étant la variable (plus haut notée $t$ ), $u = u (.) : D \to X$ la fonction inconnue (plus haut notée $x$ ), où $X$ est un espace vectoriel normé, ${\frac {\partial u}{\partial x}}$ sa différentielle, et $d x = d x 1 ... d x n$ la mesure de Lebesgue. On suppose ${\mathcal {L}}$ de classe ${\mathcal {C}}^{2}$ . Le problème considéré ici consiste à déterminer, si elle existe, une fonction $u:x\mapsto u(x)$ de classe ${\mathcal {C}}^{2}$ qui minimise $J (u)$ ^[33].

Formalisme lagrangien[modifier | modifier le code]

Condition du premier ordre[modifier | modifier le code]

Première variation[modifier | modifier le code]

Considérons le problème de Lagrange à extrémités fixes (le problème à extrémités variables conduit à ajouter les conditions de transversalité : voir, infra, le § Pseudo-hamiltonien et principe du maximum ; conditions de transversalité). Soit $εh$ un accroissement de $x$ , où $h$ est une fonction continûment dérivable telle que $h (t 0) = h (t f) = 0$ (on notera ci-dessous ${\mathcal {A}}$ l'espace vectoriel formé des $h$ vérifiant ces conditions) et $ε$ est un nombre réel. Il en résulte un accroissement $ε δJ (x; h)$ de $J (x)$ , en négligeant les termes du second ordre en $ε$ pour $ε$ tendant vers 0. En effet, un développement limité au premier ordre donne

J(x+\varepsilon h)=J(x)+\varepsilon \delta J(x;h)+o(\varepsilon )

où $δJ (x; h)$ est la « première variation » de $J$ .

Dérivée de Gateaux et condition d'Euler[modifier | modifier le code]

Toute fonction $J$ , définie dans un voisinage de $x$ , et pour laquelle un tel développement limité existe est dite « dérivable au sens de Gateaux dans la direction de $h$ », et par définition

D_{G}J(x)(h)=\delta J\left(x;h\right)=\lim _{t\to 0 \atop t\neq 0}{\frac {J(x+th)-J(x)}{t}}

est la « dérivée de Gateaux » de $J$ au point $x$ dans la direction de $h$ . L'application $D_{G}J(x):{\mathcal {A}}\ni h\mapsto \delta J(x;h)$ est homogène (c.-à-d. $D G J (x)(αh) = α D G J (x)(h)$ pour tout réel $α$ ) mais n'est pas linéaire en général^[34].

Condition d'Euler — Soit

Ω

un ouvert d'un espace vectoriel normé (ou, plus généralement, d'un espace vectoriel topologique) et

J

une fonction dérivable au sens de Gateaux dans toutes les directions en un point

x^{\ast }\in \Omega

. Pour que

x *

minimise

J (x)

dans

Ω

, il est nécessaire que soit vérifiée la condition d'Euler (condition du premier ordre, ou de stationnarité de x^* pour $J$ ) :

D_{G}J(x^{\ast })=0

.

Démonstration

Supposons que $x *$ minimise $J (x)$ dans $Ω$ . Alors, pour tout $h$ , la fonction réelle $t\mapsto J(x^{\ast }+th)$ (définie au voisinage de 0) a un extremum local en 0. D'après le théorème de Fermat sur les points stationnaires, sa dérivée en 0 est donc nulle, c.-à-d. : $D G J (x *)(h) = 0$ .

Équation d'Euler-Lagrange[modifier | modifier le code]

Article détaillé : Équation d'Euler-Lagrange.

On a d'autre part

\delta J\left(x;h\right)=\int _{t_{0}}^{t_{f}}\left({\frac {\partial {\mathcal {L}}}{\partial x}}h+{\frac {\partial {\mathcal {L}}}{\partial {\dot {x}}}}{\dot {h}}\right)\mathrm {d} t

et on en déduit le théorème suivant :

Équation d'Euler-Lagrange — Soit $x *$ une fonction de classe ${\mathcal {C}}^{1}$ . La condition de stationnarité $D G J (x *) = 0$ est satisfaite si, et seulement si $x *$ est une extrémale, c'est-à-dire est solution de l'équation d'Euler-Lagrange

{\frac {\partial {\mathcal {L}}}{\partial x}}\left(t,x^{\ast }(t),{\dot {x}}^{\ast }(t)\right)-{\frac {\mathrm {d} }{\mathrm {d} t}}\left({\frac {\partial {\mathcal {L}}}{\partial {\dot {x}}}}\left(t,x^{\ast }(t),{\dot {x}}^{\ast }(t)\right)\right)=0

(EL) .

Il s'agit donc d'une condition nécessaire pour que $J (x *)$ soit un minimum (ou maximum) local faible de $J$

Démonstration

Il suffit d'écrire la condition d'Euler, puis d'appliquer le lemme de Du Bois-Reymond.

Applications : voir #Géodésiques d'une variété riemannienne. L'équation d'Euler-Lagrange permet aussi de déterminer la courbe brachistochrone.

Remarques sur l'équation d'Euler-Lagrange[modifier | modifier le code]

Une démonstration classique de cette équation (présentée dans l'article lié) utilise une intégration par parties et le lemme fondamental du calcul des variations, mais n'est licite que si ${\dot {x}}^{\ast }$ et ${\frac {\partial {\mathcal {L}}}{\partial {\dot {x}}}}$ sont de classe C¹. C'est pourquoi l'utilisation du lemme de du Bois-Reymond, pour lequel il suffit de supposer $x *$ et ${\mathcal {L}}$ de classe C¹, est préférable.
Pour que la fonction $x^{\ast }\in {\mathcal {E}}^{0}$ fournisse un minimum local fort, il est encore nécessaire, comme on le verra plus loin (#Pseudo-hamiltonien et principe du maximum ; conditions de transversalité), qu'elle soit solution de l'équation d'Euler-Lagrange dans chaque intervalle dans lequel elle est continûment dérivable. Si $x *$ est seulement supposée absolument continue, l'équation d'Euler-Lagrange doit être vérifiée presque partout.

Cas des problèmes isopérimétriques[modifier | modifier le code]

On introduit des multiplicateurs de Lagrange $\lambda _{i}(i=0,1,...,n)$ où $\lambda _{0}\in \left\{0,1\right\}$ , et on forme la quantité (appelée Lagrangien, mais dans un sens qui n'est pas à confondre avec le précédent, d'où la majuscule employée)

J\left(x\right)=\sum \limits _{i=0}^{m}\lambda _{i}J_{i}(x)=\int _{t_{0}}^{t_{f}}{\mathcal {L}}\left(t,x(t),{\dot {x}}(t)\right)\mathrm {d} t

avec

{\mathcal {L}}(t,x,u)=\sum \limits _{i=0}^{m}\lambda _{i}{\mathcal {L}}_{i}(t,x,u)

.

Une condition nécessaire pour que $x *$ soit solution du problème isométrique est qu'il existe des multiplicateurs de Lagrange comme ci-dessus, non tous nuls, tels que $x *$ rende stationnaire $J (x)$ ^[35]. Cette stationnarité équivaut à la satisfaction de la même équation d'Euler-Lagrange que plus haut.

Application : voir #Problème de Didon.

Remarque sur les multiplicateurs de Lagrange[modifier | modifier le code]

Si les différentielles $DJ i (x *) (i = 1,..., m)$ sont linéairement indépendantes, on a nécessairement $λ 0 = 1$ : c'est alors la formulation classique du théorème des multiplicateurs de Lagrange.

Cas des problèmes à intégrale multiple[modifier | modifier le code]

Avec les notations introduites lors de la position du problème (§ Problèmes à intégrale multiple), une condition nécessaire de stationnarité, si l'on se restreint aux extrémales de classe $C^{2}$ (pour les extrémales de classe $C^{1}$ , on utilisera le lemme de Haar) est donnée par l'équation d'Ostrogradski (généralisation de l'équation d'Euler-Lagrange) :

{\frac {\partial {\mathcal {L}}}{\partial u}}-{\frac {\partial }{\partial x}}\left({\frac {\partial {\mathcal {L}}}{\partial \left({\frac {\partial u}{\partial x}}\right)}}\right)=0

où ${\frac {\partial u}{\partial x}}$ désigne la différentielle de u ; on peut également noter cette différentielle $du:D\rightarrow L(\mathbb {R} ^{n},\mathbf {X} )$ , où $L(\mathbb {R} ^{n},\mathbf {X} )$ est l'espace des applications linéaires de $\mathbb {R} ^{n}$ dans $X$ . Lorsque $\mathbf {X} =\mathbb {R} ^{m}$ , l'équation d'Ostrogradski peut s'expliciter comme suit :

{\frac {\partial {\mathcal {L}}}{\partial u_{j}}}-\sum \limits _{i=1}^{n}{\frac {\partial }{\partial x_{i}}}\left({\frac {\partial {\mathcal {L}}}{\partial \left({\frac {\partial u_{j}}{\partial x_{i}}}\right)}}\right)=0\ (j=1,...,m).

Les fonctions u vérifiant ces conditions sont de nouveau appelées extrémales.

Démonstration

Soit $h\in C^{2}(D)$ et $ε > 0$ . On a

\delta J(u;h):=\lim _{\varepsilon \rightarrow 0}\left(J(u+\varepsilon h)-J(u)\right)/\varepsilon =\int _{D}\left({\frac {\partial {\mathcal {L}}}{\partial u}}\cdot h+{\frac {\partial {\mathcal {L}}}{\partial \left({\frac {\partial u}{\partial x}}\right)}}\cdot {\frac {\partial h}{\partial x}}\right)\mathrm {d} x

.

On a

{\frac {\partial {\mathcal {L}}}{\partial \left({\frac {\partial u}{\partial x}}\right)}}\cdot {\frac {\partial h}{\partial x}}={\frac {\partial }{\partial x}}\left({\frac {\partial {\mathcal {L}}}{\partial \left({\frac {\partial u}{\partial x}}\right)}}\cdot h\right)-{\frac {\partial }{\partial x}}\left({\frac {\partial {\mathcal {L}}}{\partial \left({\frac {\partial u}{\partial x}}\right)}}\right)\cdot h

et par conséquent

\delta J(u;h)=\int _{D}\left({\frac {\partial {\mathcal {L}}}{\partial u}}-{\frac {\partial }{\partial x}}\left({\frac {\partial {\mathcal {L}}}{\partial \left({\frac {\partial u}{\partial x}}\right)}}\right)\right)\cdot h\mathrm {d} x+\int _{D}{\frac {\partial }{\partial x}}\left({\frac {\partial {\mathcal {L}}}{\partial \left({\frac {\partial u}{\partial x}}\right)}}\cdot h\right)\mathrm {d} x

.

D'après le théorème de la divergence (ou d'Ostrogradski), dans sa version à n variables^[36], la seconde intégrale est égale à l'intégrale de surface

\int _{\partial D}{\frac {\partial {\mathcal {L}}}{\partial \left({\frac {\partial u}{\partial x}}\right)}}\cdot h\cdot {\overrightarrow {n}}d\sigma

où ${\overrightarrow {n}}$ est le vecteur unitaire sortant de $D$ de la normale à $\partial D$ et $d σ$ est la mesure superficielle. Cette seconde intégrale est nulle si l'on prend $h$ s'annulant sur $\partial D$ , et il reste alors

\delta J\left(u;h\right)=\int _{D}\left({\frac {\partial {\mathcal {L}}}{\partial u}}-{\frac {\partial }{\partial x}}\left({\frac {\partial {\mathcal {L}}}{\partial \left({\frac {\partial u}{\partial x}}\right)}}\right)\right)\cdot h\cdot \mathrm {d} x

.

La condition de stationnarité entraîne que $δJ (u *; h) = 0$ pour toute fonction $h\in C^{2}(D)$ s'annulant sur $\partial D$ , et le théorème énoncé est maintenant une conséquence du lemme fondamental du calcul des variations.

Application : voir le § Problème de Dirichlet.

Conditions du second ordre de minimum faible[modifier | modifier le code]

Désormais nous considérons le problème de Lagrange et nous supposons ${\mathcal {L}}$ de classe ${\mathcal {C}}^{2}$ , ainsi que ses différentielles partielles ${\frac {\partial {\mathcal {L}}}{\partial x}}$ et ${\frac {\partial {\mathcal {L}}}{\partial {\dot {x}}}}$ , et $X$ . On recherche dans ce paragraphe une des conditions du second ordre de minimum local faible.

Seconde variation[modifier | modifier le code]

Soit $x *$ une extrémale, pour laquelle on a donc, par définition, $δJ (x *) = 0$ , et faisons un développement limité au second ordre de $J (x * + εh)$ . Sous l'hypothèse ci-dessus, la différentielle seconde $D^{2}J(x^{\ast })\in L_{2}({\mathcal {E}}^{1};\mathbb {R} )$ de $J$ existe au point $x *$ (où $L_{2}({\mathcal {E}}^{1};\mathbb {R} )$ est l'espace des formes bilinéaires continues sur ${\mathcal {E}}^{1}\times {\mathcal {E}}^{1}$ ) et

J(x^{\ast }+\varepsilon h)=J(x^{\ast })+\varepsilon ^{2}\delta ^{2}J(x^{\ast };h)+o(\varepsilon ^{2})

où $δ 2 J (x *; h) = 1 / 2 D 2 J (x *)•(h, h)$ . La quantité $δ 2 J (x *; h)$ est appelée la seconde variation de $J$ au point $x *$ . Il vient

\delta ^{2}J(x^{\ast };h)={\frac {1}{2}}\int _{t_{0}}^{t_{f}}\left({\frac {\partial ^{2}{\mathcal {L}}}{\partial x^{2}}}\cdot (h,h)+2{\frac {\partial ^{2}{\mathcal {L}}}{\partial x\partial {\dot {x}}}}\left({\dot {h}},h\right)+{\frac {\partial ^{2}{\mathcal {L}}}{\partial {\dot {x}}^{2}}}\cdot \left({\dot {h}},{\dot {h}}\right)\right)\mathrm {d} t

où pour abréger on a écrit ${\frac {\partial ^{2}{\mathcal {L}}}{\partial x^{2}}}$ pour ${\frac {\partial ^{2}{\mathcal {L}}}{\partial x^{2}}}(t,x^{\ast }(t),{\dot {x}}^{\ast }(t))$ , etc. En intégrant les second terme par parties on obtient

\delta ^{2}J(x^{\ast };h)={\frac {1}{2}}\int _{t_{0}}^{t_{f}}\left({\frac {\partial ^{2}{\mathcal {L}}}{\partial {\dot {x}}^{2}}}\cdot \left({\dot {h}},{\dot {h}}\right)+\left({\frac {\partial ^{2}{\mathcal {L}}}{\partial x^{2}}}-{\frac {\mathrm {d} }{\mathrm {d} t}}\left({\frac {\partial ^{2}{\mathcal {L}}}{\partial x\partial {\dot {x}}}}\right)\right)(h,h)\right)\mathrm {d} t

soit donc

\delta ^{2}J(x^{\ast };h)={\frac {1}{2}}\int _{t_{0}}^{t_{f}}\left(P(t)\cdot \left({\dot {h}},{\dot {h}}\right)+Q(t)\cdot (h,h)\right)\mathrm {d} t

avec

P(t)={\frac {\partial ^{2}{\mathcal {L}}}{\partial {\dot {x}}^{2}}}\left(t,x^{\ast }(t),{\dot {x}}^{\ast }(t)\right)

,

Q(t)={\frac {\partial ^{2}{\mathcal {L}}}{\partial x^{2}}}\left(t,x^{\ast }(t),{\dot {x}}^{\ast }(t)\right)-{\frac {\mathrm {d} }{\mathrm {d} t}}\left({\frac {\partial ^{2}{\mathcal {L}}}{\partial x\partial {\dot {x}}}}\left(t,x^{\ast }(t),{\dot {x}}^{\ast }(t)\right)\right)

.

Condition de Legendre[modifier | modifier le code]

La quantité $δ 2 J (x *; h)$ doit être non négative pour tout accroissement $h$ de classe ${\mathcal {C}}^{1}$ tel que $h (t 0) = h (t f) = 0$ . On montre^[37] qu'une condition nécessaire pour qu'il en soit ainsi est que la forme bilinéaire symétrique $P (t)$ (définissant le premier terme de l'intégrale ci-dessus) soit semi-définie positive, ce qu'on écrira sous la forme $P(t)\geq 0$ : c'est la condition faible de Legendre (ou de Legendre-Clebsch). En effet, dans l'intégrale $δ 2 J (x *; h)$ , le terme

{\frac {1}{2}}\int _{t_{0}}^{t_{f}}\left(P(t)\cdot \left({\dot {h}},{\dot {h}}\right)\right)\mathrm {d} t

« prédomine », dans le sens où l'on peut construire des fonctions réelles, définies dans $[t 0, t f]$ , nulles en $t 0$ et $t f$ , de petite amplitude et dont la dérivée est de grande amplitude (alors qu'une fonction nulle en $t 0$ et $t f$ , dont la dérivée est de petite amplitude sur $[t 0, t f]$ , est nécessairement de petite amplitude).

Remarque : cas du calcul des variations à intégrale multiple[modifier | modifier le code]

(Voir les §§ Problèmes à intégrale multiple et Cas des problèmes à intégrale multiple). La condition faible de Legendre, qui porte alors le nom de condition de Legendre-Hadamard, s'écrit $P(x)\geq 0$ où

P\left(x\right)={\frac {\partial ^{2}{\mathcal {L}}}{\partial v^{2}}}\left(x,u^{\ast }(x),v^{\ast }(x)\right)\ {\textrm {avec}}\ v={\frac {\partial u}{\partial x}}

.

Condition de Jacobi[modifier | modifier le code]

Reste que les deux termes de l'intégrale $\delta ^{2}J(x^{\ast };h)$ doivent être considérés simultanément. Si h est la fonction nulle, il est clair que $δ 2 J (x *; h) = 0$ . Par conséquent, cette fonction nulle doit minimiser $δ 2 J (x *; h)$ , avec les conditions aux limites $h (t 0) = h (t f) = 0$ , dans un voisinage de 0 dans ${\mathcal {E}}^{1}$ (« problème de minimisation secondaire »). Ceci conduit à étudier l'équation d'Euler-Lagrange (EL) associée à ce problème secondaire. Il s'agit de l'équation de Jacobi

Q(t)\cdot h-{\frac {\mathrm {d} }{\mathrm {d} t}}\left(P(t)\cdot {\dot {h}}\right)=0\qquad (\mathrm {J} )

.

Définition — Un point $τ \in ] t 0, t f]$ est dit conjugué à $t 0$ (ou : $x * (τ)$ est dit conjugué à $x * (t 0)$ ) si l'équation de Jacobi (J) admet une solution ${\bar {h}}$ telle que ${\bar {h}}(t_{0})={\bar {h}}(\tau )=0$ et $P(\tau ){\dot {\bar {h}}}(\tau )\neq 0$ .

Dans le cas usuel (et seulement envisagé par Jacobi), où $det P (τ) \neq 0$ , cette dernière condition équivaut à ${\dot {\bar {h}}}(\tau )\neq 0$ .

S'il existe un point conjugué à $t 0$ dans l'intervalle $] t 0, t f [$ , il existe une solution non nulle $h$ rendant stationnaire $δ 2 J (x *; h)$ . Alors pour tout $ε > 0$ , $ε h$ rend stationnaire $δ 2 J (x *; h)$ .

On montre le résultat suivant dans le cas où la condition forte de Legendre $P (t) > 0, t \in [t 0, t f]$ , est vérifiée :

L'accroissement nul $h = 0$ donne un minimum local faible strict pour $δ 2 J (x *; h)$ parmi les accroissements $h$ de classe ${\mathcal {C}}^{1}$ tels que $h (t 0) = h (t f) = 0$ , si et seulement si la condition forte de Jacobi est satisfaite : il n'existe pas de point conjugué à $t 0$ dans l'intervalle $[t 0, t f]$ .

Weierstrass a obtenu en 1877 le théorème suivant^[38] :

Théorème de Jacobi-Weierstrass — (A) Une condition nécessaire pour que $x *$ donne un minimum local faible pour le problème de Lagrange à extrémités fixes est que

(I) L'équation d'Euler-Lagrange (EL) soit vérifiée, ainsi que les conditions aux limites

x * (t 0) = x 0, x * (t f) = x f

;

(II) La condition faible de Legendre

P (t) \geq 0, \forall t \in [t 0, t f]

soit vérifiée ;

(III) La condition faible de Jacobi soit satisfaite : « Il n'y a pas de point conjugué à

t 0

dans l'intervalle

] t 0, t f [

».

(B) Une condition suffisante pour que $x *$ donne un minimum local faible strict pour le problème de Lagrange à extrémités fixes est que

(I') : condition identique à (I) ;

(II') La condition forte de Legendre

P (t) > 0, \forall t \in [t 0, t f]

(où

P (t) > 0

signifie que la forme bilinéaire symétrique

P (t)

est définie positive) soit vérifiée ;

(III') La condition forte de Jacobi soit satisfaite : « Il n'y a pas de point conjugué à

t 0

dans l'intervalle

[t 0, t f]

».

Application : voir #Principe d'action stationnaire de Hamilton.

Remarque : cas d'un intégrande ne dépendant pas de l'inconnue[modifier | modifier le code]

Supposons que ${\mathcal {L}}={\mathcal {L}}(t,{\dot {x}})$ . La condition forte de Jacobi devient alors triviale si la condition forte de Legendre est vérifiée. Par suite, une condition suffisante pour que $x *$ donne un minimum local faible strict est que la condition d'Euler-Lagrange et la condition forte de Legendre soient toutes deux satisfaites.

Ce résultat est encore valable dans le cas des problèmes à intégrale multiple (§§ Problèmes à intégrale multiple et Cas des problèmes à intégrale multiple) lorsque ${\mathcal {L}}={\mathcal {L}}(x,{\frac {\partial u}{\partial x}})$ ^[39]. Comme application, voir le § Problème de Dirichlet.

Remarque : cas convexe[modifier | modifier le code]

Supposons que la condition forte de Legendre soit satisfaite ( $P (t) > 0$ ) et que de plus $Q (t) \geq 0$ , ceci pour tout $t \in [t 0, t f]$ . Alors il est clair que $δ 2 J (x *; h) > 0$ pour tout $h \neq 0$ de classe ${\mathcal {C}}^{1}$ tel que $h (t 0) = h (t f) = 0$ . Par suite, il n'y a pas de point conjugué à $t 0$ dans l'intervalle $[t 0, t f]$ , et un minimum local faible strict de $J$ est atteint au point $x *$ . Ceci généralise la remarque précédente.

Remarque : cas convexe avec intégrale multiple[modifier | modifier le code]

Dans le cas d'un problème à intégrale multiple, considérons la forme bilinéaire symétrique

\left(\upsilon ,\xi \right)\mapsto {\frac {\partial ^{2}{\mathcal {L}}}{\partial u^{2}}}\left(x,u^{\ast }(x),v^{\ast }(x)\right)\cdot (\upsilon ,\upsilon )+2{\frac {\partial ^{2}{\mathcal {L}}}{\partial u\partial v}}\left(x,u^{\ast }(x),v^{\ast }(x)\right)\cdot (\upsilon ,\xi )+{\frac {\partial ^{2}{\mathcal {L}}}{\partial v^{2}}}\left(x,u^{\ast }(x),v^{\ast }(x)\right)\cdot (\xi ,\xi )

avec les notations déjà introduites dans ce cas (i.e. $v={\frac {\partial u}{\partial x}}$ ). Supposons cette forme définie positive pour tout $x\in D$ . Alors la variation seconde de $J$ est strictement positive pour tout accroissement non nul et suffisamment petit h de $u *$ dans ${\mathcal {C}}^{1}(D)$ , s'annulant sur la frontière de D, et par conséquent un minimum local faible strict est obtenu pour $u = u *$ ^[40].

Conditions de minimum fort[modifier | modifier le code]

Fonction de Weierstrass[modifier | modifier le code]

Considérons de nouveau le problème de Lagrange à extrémités fixes, en supposant ${\mathcal {L}}$ de classe $C^{2}$ , mais cherchons cette fois un minimum local fort. Définissons en fonction du lagrangien ${\mathcal {L}}(t,x,u)$ la fonction de Weierstrass ou « excessus »

{\mathcal {E}}(t,x,u;w)={\mathcal {L}}(t,x,w)-{\mathcal {L}}(t,x,u)-{\frac {\partial {\mathcal {L}}}{\partial u}}(t,x,u)\cdot (w-u)

.

La condition nécessaire de Weierstrass peut s'obtenir soit directement, grâce aux « variations en aiguille » introduites par Weierstrass^[41], soit, comme on va le voir plus loin, comme une conséquence du principe du maximum de la commande optimale.

Condition nécessaire de minimum fort — Pour que $x^{\ast }\in {\mathcal {C}}^{1}\left(\left[t_{0},t_{f}\right],\Omega \right)$ fournisse un minimum local fort, il faut que les conditions nécessaires (I), (II), (III) de minimum faible du théorème de Jacobi soient satisfaites, ainsi que la condition faible de Weierstrass (IV) : pour tout $t \in [t 0, t f]$ ,

{\mathcal {E}}\left(t,x^{\ast }(t),{\dot {x}}^{\ast }(t);w\right)\geq 0,\forall w\in \mathbf {X}

.

La condition suffisante de Weierstrass est une conséquence directe sa formule intégrale, explicitée et démontrée plus bas en utilisant les apports de Hilbert, de Poincaré et de E. Cartan. Cette relation fondamentale conduit au résultat suivant :

Condition suffisante de minimum fort (Weierstrass, 1879) — Soit $x^{\ast }\in {\mathcal {C}}^{1}\left(\left[t_{0},t_{f}\right],\Omega \right)$ une courbe admissible, $\Gamma =\left\{t,x^{\ast }(t),{\dot {x}}^{\ast }(t):t\in [t_{0},t_{f}]\right\}$ , et V un voisinage de $Γ$ dans ${\mathcal {I}}\times \mathbf {X} \times \mathbf {X}$ . Pour que $x *$ fournisse un minimum local fort, il suffit que les conditions suffisantes (I), (II'), (III') de minimum faible du théorème de Jacobi-Weierstrass soient satisfaite, ainsi que la condition forte de Weierstrass (IV') :

{\mathcal {E}}(t,x,u;w)\geq 0,\forall (t,x,u,w):(t,x,u)\in V,(t,x,w)\in V.

Si de plus ${\mathcal {E}}(t,x,u;w)>0$ pour $w\neq u$ , ce minimum est strict.

Remarque sur la condition suffisante de minimum fort[modifier | modifier le code]

La formule de Taylor d'ordre 2 avec reste de Lagrange s'écrit

{\mathcal {L}}(t,x,u+h)={\mathcal {L}}(t,x,u)+{\frac {\partial {\mathcal {L}}}{\partial u}}(t,x,u)\cdot h+{\frac {\partial ^{2}{\mathcal {L}}}{\partial u^{2}}}(t,x,u+\theta h)\cdot (h,h)

où $θ \in ]0 ; 1[$ .

En prenant $θ = w - u$ , on voit donc que la condition forte de Weierstrass est satisfaite si

{\frac {\partial ^{2}{\mathcal {L}}}{\partial {\dot {x}}^{2}}}(t,x,u)\geq 0,\forall (t,x,u)\in V.

(condition suffisante de minimum fort). De plus, ${\mathcal {E}}(t,x,u;w)>0(w\neq u)$ si

{\frac {\partial ^{2}{\mathcal {L}}}{\partial {\dot {x}}^{2}}}(t,x,u)>0,\forall (t,x,u)\in V.

(condition suffisante de minimum fort strict).

Formalisme hamiltonien[modifier | modifier le code]

On considère à présent le problème à extrémités variables. Il suffit, comme on l'a vu, de considérer le problème de Lagrange, puisque celui de Bolza s'y ramène (cela simplifie les conditions de transversalité ci-dessous). Les fonctions ${\mathcal {L}}$ et ${\frac {\partial {\mathcal {L}}}{\partial {\dot {x}}}}$ sont supposées continûment différentiables et $X$ est supposé de dimension finie.

Pseudo-hamiltonien et principe du maximum ; conditions de transversalité[modifier | modifier le code]

On appelle pseudo-hamiltonien la fonction

{\mathcal {H}}:{\mathcal {I}}\times \Omega \times \mathbf {X} \times \mathbf {X} ^{\prime }\rightarrow \mathbb {R}

(où $X'$ est le dual de $X$ ) définie par

{\mathcal {H}}\left(t,x,u,p^{\prime }\right)=\left\langle p^{\prime }|u\right\rangle -{\mathcal {L}}(t,x,u)

.

(où $\left\langle .|.\right\rangle$ est le crochet de dualité).

Le dual de $\mathbb {R} \times \mathbf {X}$ est identifié avec $\mathbb {R} \times \mathbf {X} ^{\prime }$ . Soit les deux équations canoniques de Hamilton

{\dot {x}}^{\ast }={\frac {\partial {\mathcal {H}}}{\partial p^{\prime }}}\left(t,x^{\ast },u^{\ast },p^{\prime \ast }\right)

,

{\dot {p}}^{\prime \ast }=-{\frac {\partial {\mathcal {H}}}{\partial x}}\left(t,x^{\ast },u^{\ast },p^{\prime \ast }\right)

.

Notons $T_{\left(t_{f}^{\ast },x_{f}^{\ast }\right)}\left({\mathcal {V}}_{f}\right)$ l'espace tangent à la variété ${\mathcal {V}}_{f}$ au point $\left(t_{f}^{\ast },x_{f}^{\ast }\right)$ et $N_{\left(t_{f}^{\ast },x_{f}^{\ast }\right)}\left({\mathcal {V}}_{f}\right)$ l'orthogonal de $T_{\left(t_{f}^{\ast },x_{f}^{\ast }\right)}\left({\mathcal {V}}_{f}\right)$ dans $\mathbb {R} \times \mathbf {X} ^{\prime }$ , c'est-à-dire l'ensemble des formes linéaires continues $k^{\prime }\in \mathbb {R} \times \mathbf {X} ^{\prime }$ telles que $\left\langle k^{\prime }|h\right\rangle =0,\forall h\in T_{\left(t_{f}^{\ast },x_{f}^{\ast }\right)}\left({\mathcal {V}}_{f}\right)$ . On définit de même $T_{\left(t_{0}^{\ast },x_{0}^{\ast }\right)}\left({\mathcal {V}}_{0}\right)$ et $N_{\left(t_{0}^{\ast },x_{0}^{\ast }\right)}\left({\mathcal {V}}_{0}\right)$

On appelle conditions de transversalité les relations

\left(-{\mathcal {H}}\left(t_{f}^{\ast },x_{f}^{\ast },u^{\ast }(t_{f}^{\ast }),p^{\prime \ast }\left(t_{f}^{\ast }\right)\right),p^{\prime \ast }\left(t_{f}^{\ast }\right)\right)\in N_{\left(t_{f}^{\ast },x_{f}^{\ast }\right)}\left({\mathcal {V}}_{f}\right)

,

\left(-{\mathcal {H}}\left(t_{0}^{\ast },x_{0}^{\ast },u^{\ast }(t_{0}^{\ast }),p^{\prime \ast }\left(t_{0}^{\ast }\right)\right),p^{\prime \ast }\left(t_{0}^{\ast }\right)\right)\in N_{\left(t_{0}^{\ast },x_{0}^{\ast }\right)}\left({\mathcal {V}}_{0}\right)

,

La première d'entre elles est justifiée plus loin. Le résultat suivant est une conséquence du principe du maximum de la commande optimale^[24] :

Principe du maximum du calcul des variations — Pour que $x *$ (supposée continument dérivable par morceaux) fournisse un minimum local fort, il est nécessaire qu'il existe un vecteur adjoint $p^{\prime \ast }\in KC^{1}\left({\mathcal {I}};\mathbf {X} ^{\prime }\right)$ pour lequel les deux équations canoniques et les conditions de transversalité soient satisfaites, que la fonction $t\mapsto {\mathcal {H}}\left(t,x^{\ast }(t),u^{\ast }(t),p^{\prime \ast }(t)\right)$ soit continue, et que le principe du maximum

{\mathcal {H}}\left(t,x^{\ast }(t),{\dot {x}}^{\ast }(t),p^{\prime \ast }(t)\right)\geq {\mathcal {H}}\left(t,x^{\ast }(t),u,p^{\prime \ast }(t)\right),\forall u\in \mathbf {X}

soit vérifié en tout point $t\in \left[t_{0}^{\ast },t_{f}^{\ast }\right]$ auquel $x *$ est continûment dérivable^[42]. On a en tout point où ${\dot {x}}^{\ast }$ et $p' *$ sont continues (donc sauf en un nombre fini de points) l'égalité (E) :

{\frac {\mathrm {d} }{\mathrm {d} t}}{\mathcal {H}}\left(t,x^{\ast }(t),{\dot {x}}^{\ast }\left(t\right),\lambda ^{\ast },p^{\prime \ast }(t)\right)={\frac {\partial }{\partial t}}{\mathcal {H}}\left(t,x^{\ast }(t),{\dot {x}}^{\ast }(t),p^{\prime \ast }(t)\right)

et en particulier, si le pseudo-hamiltonien ${\mathcal {H}}$ ne dépend pas explicitement du temps,

{\mathcal {H}}\left(x^{\ast }(t),{\dot {x}}^{\ast }(t),p^{\prime \ast }(t)\right)=C^{te}

.

Cas particuliers des conditions de transversalité[modifier | modifier le code]

Nous supposons maintenant que la variété ${\mathcal {V}}_{f}$ soit de la forme ${\mathcal {T}}_{f}\times {\mathcal {X}}_{f}$ où ${\mathcal {T}}_{f}$ et ${\mathcal {X}}_{f}$ sont des sous-variétés de ${\mathcal {\mathbb {R} }}$ et de $X$ , respectivement. L'équation de transversalité s'écrit donc

(a)

{\mathcal {H}}\left(t_{f}^{\ast },x_{f}^{\ast },{\dot {x}}^{\ast }\left(t_{f}^{\ast }\right),p^{\prime \ast }\left(t_{f}^{\ast }\right)\right)\in N_{t_{f}^{\ast }}\left({\mathcal {T}}_{f}\right)

,

(b)

p^{\prime \ast }\left(t_{f}^{\ast }\right)\in N_{t_{f}^{\ast }}\left({\mathcal {X}}_{f}\right)

.

Dans le cas d'un instant final libre, on a ${\mathcal {T}}_{f}={\mathcal {\mathbb {R} }}$ , par conséquent $N_{t_{f}^{\ast }}\left({\mathcal {T}}_{f}\right)=0$ et (a) devient

(a')

{\mathcal {H}}\left(t_{f}^{\ast },x_{f}^{\ast },{\dot {x}}^{\ast }\left(t_{f}^{\ast }\right),p^{\prime \ast }\left(t_{f}^{\ast }\right)\right)=0

alors que dans le cas d'un instant final fixé, ${\mathcal {T}}_{f}=\left\{t_{f}\right\}$ et $N_{t_{f}^{\ast }}\left({\mathcal {T}}_{f}\right)=\{0\}$ , donc (a) est trivialement vérifiée. Dans les deux cas on a une équation: (a') dans le premier, $t f * = t f$ dans le second.

Dans le cas d'un état final libre, on a ${\mathcal {X}}_{f}=\mathbf {X}$ , par conséquent $N_{x_{f}^{\ast }}\left({\mathcal {X}}_{f}\right)=0$ et (b) devient

(b')

p^{\prime \ast }\left(t_{f}^{\ast }\right)=0

.

Dans le cas d'un état final fixé, ${\mathcal {X}}_{f}=\left\{x_{f}\right\}$ et $N_{x_{f}^{\ast }}\left({\mathcal {X}}_{f}\right)=\left\{0\right\}$ , donc (b) est trivialement vérifiée. Dans les deux cas on a n équations, si $X$ est de dimension n : (b') dans le premier, $x f * = x f$ dans le second.

Le même raisonnement s'applique évidemment pour la condition initiale.

Équation d'Euler-Lagrange, conditions de Legendre et de Weierstrass[modifier | modifier le code]

Montrons que les conditions nécessaires de minimum local fort données plus haut, à l'exception de la condition de Jacobi, sont des conséquences du principe du maximum du calcul des variations, et ceci bien qu'on se place ici dans le contexte plus général d'extrémités éventuellement variables (la condition de Jacobi classique n'est valide que dans le cas d'extrémités fixes envisagé plus haut ; néanmoins une condition analogue, faisant intervenir la notion de point focal, due à Kneser, a été obtenue dans le cas d'une extrémité finale libre^[12]^,^[43]).

Les équations canoniques s'écrivent encore

{\dot {x}}^{\ast }(t)=u^{\ast }(t)

,

{\dot {p}}^{\ast }(t)={\frac {\partial {\mathcal {L}}}{\partial x}}\left(t,x^{\ast }(t),u^{\ast }(t)\right)

.

Le principe du maximum implique au premier ordre l'équation d'Euler (ou de stationnarité)

{\frac {\partial {\mathcal {H}}}{\partial u}}\left(t,x^{\ast }(t),u^{\ast }(t),p^{\prime \ast }(t)\right)=0

,

autrement dit, en utilisant la première équation canonique,

p^{\prime \ast }(t)={\frac {\partial {\mathcal {L}}}{\partial {\dot {x}}}}\left(t,x^{\ast }(t),{\dot {x}}^{\ast }(t)\right)

.

La seconde équation canonique implique donc maintenant l'équation d'Euler-Lagrange (EL) en chaque point auquel $x *$ est continûment dérivable. D'autre part, on a

{\mathcal {H}}(t,x,u,p^{\prime })-{\mathcal {H}}(t,x,w,p^{\prime })={\mathcal {L}}(t,x,w)-{\mathcal {L}}(t,x,u)-\left\langle p^{\prime }|w-u\right\rangle

.

Par conséquent, en utilisant l'expression de $p' *(t)$ qui vient d'être obtenue, on voit que le principe du maximum implique la condition faible de Weierstrass. Celle-ci à son tour implique la condition faible de Legendre.

Conditions d'arrondissement des angles de Weierstrass-Erdmann[modifier | modifier le code]

Le principe du maximum implique que les fonctions

t\mapsto p^{\prime \ast }(t)={\frac {\partial {\mathcal {L}}}{\partial {\dot {x}}}}\left(t,x^{\ast }(t),{\dot {x}}^{\ast }(t)\right)

,

t\mapsto {\mathcal {H}}(t,x^{\ast }(t),{\dot {x}}^{\ast }(t),p^{\prime \ast }(t))={\frac {\partial {\mathcal {L}}}{\partial x}}\left(t,x^{\ast }(t),u^{\ast }(t)\right)\cdot {\dot {x}}^{\ast }(t)-{\mathcal {L}}\left(t,x^{\ast }(t),{\dot {x}}^{\ast }\left(t\right)\right)

sont continues. Ce sont les deux conditions d'arrondissement des angles de Weierstrass–Erdmann (en).

On dit que le lagrangien est régulier (au sens de Hilbert) si

\det \left({\frac {\partial ^{2}{\mathcal {L}}}{\partial {\dot {x}}^{2}}}(t,x,u)\right)\neq 0\left((t,x,u)\in {\mathcal {I}}\times \Omega \times \mathbf {X} \right).

Corollaire — Supposons $\mathbf {X} =\mathbb {R}$ et le lagrangien régulier. Alors toute fonction $x *$ (supposée continûment dérivable par morceaux) donnant un minimum fort est continûment dérivable.

Démonstration

Supposons qu'en un point $t \in ] t 0, t f [$ , ${\dot {x}}^{\ast }$ admette une limite à gauche $u 1$ différente de sa limite à droite $u 2$ . Pour fixer les idées, supposons $u 1 < u 2$ . Soit $\varphi (u)={\frac {\partial {\mathcal {L}}}{\partial {\dot {x}}}}\left(t,x^{\ast }(t),u\right)$ . Cette fonction admet une dérivée ${\frac {\mathrm {d} \varphi }{\mathrm {d} u}}(w)={\frac {\partial ^{2}{\mathcal {L}}}{\partial {\dot {x}}^{2}}}\left(t,x^{\ast }(t),w\right)$ . La première condition d'arrondissement des angles implique $φ (u 1) = φ (u 2)$ , par conséquent il existe $w\in ]u_{1},u_{2}[$ telle que ${\frac {\mathrm {d} \varphi }{\mathrm {d} u}}(w)=0$ , ce qui est impossible. Par conséquent, $u 1 = u 2$ .

Différentiabilité des extrémales[modifier | modifier le code]

Hilbert a montré le résultat suivant en utilisant le théorème des fonctions implicites : si ${\mathcal {L}}$ de classe ${\mathcal {C}}^{n}(n\geq 2)$ et le lagrangien est régulier, alors une extrémale $x *$ de classe ${\mathcal {C}}^{1}$ sur un intervalle est de classe ${\mathcal {C}}^{n}$ sur cet intervalle^[1]. Par conséquent, dans les conditions du corollaire ci-dessus, $x *$ est de classe ${\mathcal {C}}^{n}$

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

Calcul des variations

Historique[modifier | modifier le code]

Problèmes fondamentaux du calcul des variations[modifier | modifier le code]

Problème à extrémités fixes[modifier | modifier le code]

Problème à extrémités variables[modifier | modifier le code]

Minimum faible et minimum fort[modifier | modifier le code]

Remarque sur la notion de minimum fort[modifier | modifier le code]

Problèmes isopérimétriques[modifier | modifier le code]

Problèmes à intégrale multiple[modifier | modifier le code]

Formalisme lagrangien[modifier | modifier le code]

Condition du premier ordre[modifier | modifier le code]

Première variation[modifier | modifier le code]

Dérivée de Gateaux et condition d'Euler[modifier | modifier le code]

Équation d'Euler-Lagrange[modifier | modifier le code]

Remarques sur l'équation d'Euler-Lagrange[modifier | modifier le code]

Cas des problèmes isopérimétriques[modifier | modifier le code]

Remarque sur les multiplicateurs de Lagrange[modifier | modifier le code]

Cas des problèmes à intégrale multiple[modifier | modifier le code]

Conditions du second ordre de minimum faible[modifier | modifier le code]

Seconde variation[modifier | modifier le code]

Condition de Legendre[modifier | modifier le code]

Remarque : cas du calcul des variations à intégrale multiple[modifier | modifier le code]

Condition de Jacobi[modifier | modifier le code]

Remarque : cas d'un intégrande ne dépendant pas de l'inconnue[modifier | modifier le code]

Remarque : cas convexe[modifier | modifier le code]

Remarque : cas convexe avec intégrale multiple[modifier | modifier le code]

Conditions de minimum fort[modifier | modifier le code]

Fonction de Weierstrass[modifier | modifier le code]

Remarque sur la condition suffisante de minimum fort[modifier | modifier le code]

Formalisme hamiltonien[modifier | modifier le code]

Pseudo-hamiltonien et principe du maximum ; conditions de transversalité[modifier | modifier le code]

Cas particuliers des conditions de transversalité[modifier | modifier le code]

Équation d'Euler-Lagrange, conditions de Legendre et de Weierstrass[modifier | modifier le code]

Conditions d'arrondissement des angles de Weierstrass-Erdmann[modifier | modifier le code]

Différentiabilité des extrémales[modifier | modifier le code]

€4.95