Знайти x і y , що максимізують f (x , y ) за умови, що g (x , y ) = c (показана червоним). Метод невизначених множників або метод невизначених множників Лагранжа — метод знаходження умовного локального екстремуму , запропонований італійським математиком Жозефом-Луї Лагранжем . Метод дозволяє звести задачу з пошуку умовного екстремуму до задачі на знаходження безумовного екстремуму.
Нехай потрібно знайти екстремум функції n змінних F ( x 1 , x 2 , … , x n ) {\displaystyle F(x_{1},x_{2},\ldots ,x_{n})} за s умов
g i ( x 1 , x 2 , … , x n ) = 0 {\displaystyle g_{i}(x_{1},x_{2},\ldots ,x_{n})=0} , де i = 1 , 2 , … , s {\displaystyle i=1,2,\ldots ,s} . Вводячи s невизначених множників Лагранжа λ i {\displaystyle \lambda _{i}} , побудуємо функцію Лагранжа
Φ ( x 1 , x 2 , … , x n , λ 1 , λ 2 , … , λ s ) = F ( x 1 , x 2 , … , x n ) − ∑ i = 1 s λ i g i ( x 1 , x 2 , … , x n ) {\displaystyle \Phi (x_{1},x_{2},\ldots ,x_{n},\lambda _{1},\lambda _{2},\ldots ,\lambda _{s})=F(x_{1},x_{2},\ldots ,x_{n})-\sum _{i=1}^{s}\lambda _{i}g_{i}(x_{1},x_{2},\ldots ,x_{n})} . Задача знаходження умовного оптимуму зводиться до розв'язування системи n+s рівнянь із n+s змінними:
∂ Φ ( x 1 , x 2 , … , x n , λ 1 , λ 2 , … , λ s ) ∂ x i = 0 , i = 1 , 2 , … , n {\displaystyle {\frac {\partial \Phi (x_{1},x_{2},\ldots ,x_{n},\lambda _{1},\lambda _{2},\ldots ,\lambda _{s})}{\partial x_{i}}}=0,\qquad i=1,2,\ldots ,n} , ∂ Φ ( x 1 , x 2 , … , x n , λ 1 , λ 2 , … , λ s ) ∂ λ j = g j ( x 1 , x 2 , … , x n ) = 0 , j = 1 , 2 , … , s {\displaystyle {\frac {\partial \Phi (x_{1},x_{2},\ldots ,x_{n},\lambda _{1},\lambda _{2},\ldots ,\lambda _{s})}{\partial \lambda _{j}}}=g_{j}(x_{1},x_{2},\ldots ,x_{n})=0,\qquad j=1,2,\ldots ,s} . Метод невизначених множників Лагранжа широко використовується в математичній і теоретичній фізиці . За допомогою цього методу отримані рівняння Лагранжа першого роду , які дозволяють формально ввести сили реакції в фізичні задачі із в'язями . Невизначені множники Лагранжа використовує також варіаційний метод в квантовій механіці .
Знайти прямокутник із найбільшою площею за заданого периметра p.
Позначимо сторони прямокутника x та y. Потрібно знайти максимум функції
S = x y {\displaystyle S=xy} за умови
2 x + 2 y = p {\displaystyle 2x+2y=p} . Вводимо множник Лагранжа λ {\displaystyle \lambda } і шукаємо безумовний екстремум функції
F ( x , y , λ ) = x y − λ ( 2 x + 2 y − p ) {\displaystyle F(x,y,\lambda )=xy-\lambda (2x+2y-p)} Беручи похідні отримуємо систему рівнянь
∂ F ( x , y , λ ) ∂ x = y − 2 λ = 0 {\displaystyle {\frac {\partial F(x,y,\lambda )}{\partial x}}=y-2\lambda =0} ∂ F ( x , y , λ ) ∂ y = x − 2 λ = 0 {\displaystyle {\frac {\partial F(x,y,\lambda )}{\partial y}}=x-2\lambda =0} ∂ F ( x , y , λ ) ∂ λ = 2 x + 2 y − p = 0 {\displaystyle {\frac {\partial F(x,y,\lambda )}{\partial \lambda }}=2x+2y-p=0} Підставляючи значення y = 2 λ {\displaystyle y=2\lambda } та x = 2 λ {\displaystyle x=2\lambda } в останнє рівняння, отримуємо
λ = p 8 {\displaystyle \lambda ={\frac {p}{8}}} x = y = p 4 {\displaystyle x=y={\frac {p}{4}}} . S m a x = p 2 16 {\displaystyle S_{max}={\frac {p^{2}}{16}}} Отже, найбільшу площу серед прямокутників із заданим периметром має квадрат .
Ілюстрація задачі оптимізації з обмеженнями Цей приклад вимагає складніших обчислень, але це все що задача з одним обмеженням.
Припустимо, що потрібно знайти найбільші значення
f ( x , y ) = x 2 y {\displaystyle f(x,y)=x^{2}y} за умови, що x {\displaystyle x} - і y {\displaystyle y} -координати лежать на колі з центром в початку координат з радіусом 3 {\displaystyle {\sqrt {3}}} . Тобто з таким обмеженням
g ( x , y ) = x 2 + y 2 − 3 = 0. {\displaystyle g(x,y)=x^{2}+y^{2}-3=0.} Через те, що маємо лише одне обмеження, то маємо і лише один множник, скажімо λ {\displaystyle \lambda } .
Обмеження g ( x , y ) {\displaystyle g(x,y)} тотожна нулю на колі радіуса 3 {\displaystyle {\sqrt {3}}} . Будь-яке кратне g ( x , y ) {\displaystyle g(x,y)} можна додати до g ( x , y ) {\displaystyle g(x,y)} не змінивши при цьому g ( x , y ) {\displaystyle g(x,y)} у цікавій нам області (на колі, що задовольняє наше обмеження).
L ( x , y , λ ) = f ( x , y ) + λ ⋅ g ( x , y ) = x 2 y + λ ( x 2 + y 2 − 3 ) . {\displaystyle {\begin{aligned}{\mathcal {L}}(x,y,\lambda )&=f(x,y)+\lambda \cdot g(x,y)\\&=x^{2}y+\lambda (x^{2}+y^{2}-3).\end{aligned}}} звідки ми можемо порахувати градієнт :
∇ x , y , λ L ( x , y , λ ) = ( ∂ L ∂ x , ∂ L ∂ y , ∂ L ∂ λ ) = ( 2 x y + 2 λ x , x 2 + 2 λ y , x 2 + y 2 − 3 ) . {\displaystyle {\begin{aligned}\nabla _{x,y,\lambda }{\mathcal {L}}(x,y,\lambda )&=\left({\frac {\partial {\mathcal {L}}}{\partial x}},{\frac {\partial {\mathcal {L}}}{\partial y}},{\frac {\partial {\mathcal {L}}}{\partial \lambda }}\right)\\&=\left(2xy+2\lambda x,x^{2}+2\lambda y,x^{2}+y^{2}-3\right).\end{aligned}}} І отже:
∇ x , y , λ L ( x , y , λ ) = 0 ⟺ { 2 x y + 2 λ x = 0 x 2 + 2 λ y = 0 x 2 + y 2 − 3 = 0 ⟺ { x ( y + λ ) = 0 (i) x 2 = − 2 λ y (ii) x 2 + y 2 = 3 (iii) {\displaystyle \nabla _{x,y,\lambda }{\mathcal {L}}(x,y,\lambda )=0\quad \iff \quad {\begin{cases}2xy+2\lambda x=0\\x^{2}+2\lambda y=0\\x^{2}+y^{2}-3=0\end{cases}}\quad \iff \quad {\begin{cases}x(y+\lambda )=0&{\text{(i)}}\\x^{2}=-2\lambda y&{\text{(ii)}}\\x^{2}+y^{2}=3&{\text{(iii)}}\end{cases}}} (iii) це наше вихідне обмеження. (i) означає, що x = 0 {\displaystyle x=0} або λ = − y {\displaystyle \lambda =-y} . Якщо x = 0 {\displaystyle x=0} тоді з (iii) y = ± 3 {\displaystyle y=\pm {\sqrt {3}}} і далі λ = 0 {\displaystyle \lambda =0} з (ii). Якщо ж λ = − y {\displaystyle \lambda =-y} , підставляючи у (ii) маємо x 2 = 2 y 2 {\displaystyle x^{2}=2y^{2}} . Підставляючи у (iii) і розв'язуючи щодо y {\displaystyle y} мажмо y = ± 1 {\displaystyle y=\pm 1} . Отже існує шість критичних точок L {\displaystyle {\mathcal {L}}} :
( 2 , 1 , − 1 ) ; ( − 2 , 1 , − 1 ) ; ( 2 , − 1 , 1 ) ; ( − 2 , − 1 , 1 ) ; ( 0 , 3 , 0 ) ; ( 0 , − 3 , 0 ) . {\displaystyle ({\sqrt {2}},1,-1);\quad (-{\sqrt {2}},1,-1);\quad ({\sqrt {2}},-1,1);\quad (-{\sqrt {2}},-1,1);\quad (0,{\sqrt {3}},0);\quad (0,-{\sqrt {3}},0).} Обчислюючи функцію мети в цих точках знаходимо, що
f ( ± 2 , 1 ) = 2 ; f ( ± 2 , − 1 ) = − 2 ; f ( 0 , ± 3 ) = 0. {\displaystyle f(\pm {\sqrt {2}},1)=2;\quad f(\pm {\sqrt {2}},-1)=-2;\quad f(0,\pm {\sqrt {3}})=0.} Отже, функція мети досягає глобального максимуму (за умови обмеження) у ( ± 2 , 1 ) {\displaystyle (\pm {\sqrt {2}},1)} і глобального мінімуму в ( ± 2 , − 1 ) . {\displaystyle (\pm {\sqrt {2}},-1).} Точка ( 0 , 3 ) {\displaystyle (0,{\sqrt {3}})} це локальний мінімум f , {\displaystyle f,} а ( 0 , − 3 ) {\displaystyle (0,-{\sqrt {3}})} це локальний максимум f , {\displaystyle f,} що можна побачити використавши обрамлену матрицю Гесе для L ( x , y , 0 ) {\displaystyle {\mathcal {L}}(x,y,0)} .
Зауважте, що хоча ( 2 , 1 , − 1 ) {\displaystyle ({\sqrt {2}},1,-1)} це критична точка L {\displaystyle {\mathcal {L}}} , це не локальний екстремум L . {\displaystyle {\mathcal {L}}.} Маємо, що
L ( 2 + ε , 1 , − 1 + δ ) = 2 + δ ( ε 2 + ( 2 2 ) ε ) . {\displaystyle {\mathcal {L}}\left({\sqrt {2}}+\varepsilon ,1,-1+\delta \right)=2+\delta \left(\varepsilon ^{2}+\left(2{\sqrt {2}}\right)\varepsilon \right).} Маючи будь-який окіл ( 2 , 1 , − 1 ) {\displaystyle ({\sqrt {2}},1,-1)} , можна вибрати мале додатне ε {\displaystyle \varepsilon } і мале δ {\displaystyle \delta } будь-якого знаку, щоб отримати значення L {\displaystyle {\mathcal {L}}} як більше так і менше ніж 2 {\displaystyle 2} . Це можна також побачити з того, що матриця Гесе для L {\displaystyle {\mathcal {L}}} обчислена в цій точці (та й в будь-якій іншій знайденій критичній точці) являє собою невизначену матрицю . Кожна з критичних точок L {\displaystyle {\mathcal {L}}} це сідлова точка L {\displaystyle {\mathcal {L}}} .