Метод невизначених множників

	Метод невизначених множників
Названо на честь	Жозеф-Луї Лагранж
Досліджується в	Математичне програмування
Формула
Позначення у формулі	, і
Підтримується Вікіпроєктом	Вікіпедія:Проєкт:Математика
	Метод невизначених множників у Вікісховищі

Знайти $x$ і $y$ , що максимізують $f (x, y)$ за умови, що $g (x, y) = c$ (показана червоним).

Метод невизначених множників або метод невизначених множників Лагранжа — метод знаходження умовного локального екстремуму, запропонований італійським математиком Жозефом-Луї Лагранжем. Метод дозволяє звести задачу з пошуку умовного екстремуму до задачі на знаходження безумовного екстремуму.

Задача

Нехай потрібно знайти екстремум функції n змінних $F(x_{1},x_{2},\ldots ,x_{n})$ за s умов

g_{i}(x_{1},x_{2},\ldots ,x_{n})=0

, де

i=1,2,\ldots ,s

.

Опис методу

Вводячи s невизначених множників Лагранжа $\lambda _{i}$ , побудуємо функцію Лагранжа

\Phi (x_{1},x_{2},\ldots ,x_{n},\lambda _{1},\lambda _{2},\ldots ,\lambda _{s})=F(x_{1},x_{2},\ldots ,x_{n})-\sum _{i=1}^{s}\lambda _{i}g_{i}(x_{1},x_{2},\ldots ,x_{n})

.

Задача знаходження умовного оптимуму зводиться до розв'язування системи n+s рівнянь із n+s змінними:

{\frac {\partial \Phi (x_{1},x_{2},\ldots ,x_{n},\lambda _{1},\lambda _{2},\ldots ,\lambda _{s})}{\partial x_{i}}}=0,\qquad i=1,2,\ldots ,n

,

{\frac {\partial \Phi (x_{1},x_{2},\ldots ,x_{n},\lambda _{1},\lambda _{2},\ldots ,\lambda _{s})}{\partial \lambda _{j}}}=g_{j}(x_{1},x_{2},\ldots ,x_{n})=0,\qquad j=1,2,\ldots ,s

.

Використання

Метод невизначених множників Лагранжа широко використовується в математичній і теоретичній фізиці. За допомогою цього методу отримані рівняння Лагранжа першого роду, які дозволяють формально ввести сили реакції в фізичні задачі із в'язями. Невизначені множники Лагранжа використовує також варіаційний метод в квантовій механіці.

Приклад

Приклад 1

Знайти прямокутник із найбільшою площею за заданого периметра p.

Розв'язок

Позначимо сторони прямокутника x та y. Потрібно знайти максимум функції

S=xy

за умови

2x+2y=p

.

Вводимо множник Лагранжа $\lambda$ і шукаємо безумовний екстремум функції

F(x,y,\lambda )=xy-\lambda (2x+2y-p)

Беручи похідні отримуємо систему рівнянь

{\frac {\partial F(x,y,\lambda )}{\partial x}}=y-2\lambda =0

{\frac {\partial F(x,y,\lambda )}{\partial y}}=x-2\lambda =0

{\frac {\partial F(x,y,\lambda )}{\partial \lambda }}=2x+2y-p=0

Підставляючи значення $y=2\lambda$ та $x=2\lambda$ в останнє рівняння, отримуємо

\lambda ={\frac {p}{8}}

x=y={\frac {p}{4}}

.

S_{max}={\frac {p^{2}}{16}}

Отже, найбільшу площу серед прямокутників із заданим периметром має квадрат.

Приклад 2

Цей приклад вимагає складніших обчислень, але це все що задача з одним обмеженням.

Припустимо, що потрібно знайти найбільші значення

f(x,y)=x^{2}y

за умови, що $x$ - і $y$ -координати лежать на колі з центром в початку координат з радіусом ${\sqrt {3}}$ . Тобто з таким обмеженням

g(x,y)=x^{2}+y^{2}-3=0.

Через те, що маємо лише одне обмеження, то маємо і лише один множник, скажімо $\lambda$ .

Обмеження $g(x,y)$ тотожна нулю на колі радіуса ${\sqrt {3}}$ . Будь-яке кратне $g(x,y)$ можна додати до $g(x,y)$ не змінивши при цьому $g(x,y)$ у цікавій нам області (на колі, що задовольняє наше обмеження).

{\begin{aligned}{\mathcal {L}}(x,y,\lambda )&=f(x,y)+\lambda \cdot g(x,y)\\&=x^{2}y+\lambda (x^{2}+y^{2}-3).\end{aligned}}

звідки ми можемо порахувати градієнт:

{\begin{aligned}\nabla _{x,y,\lambda }{\mathcal {L}}(x,y,\lambda )&=\left({\frac {\partial {\mathcal {L}}}{\partial x}},{\frac {\partial {\mathcal {L}}}{\partial y}},{\frac {\partial {\mathcal {L}}}{\partial \lambda }}\right)\\&=\left(2xy+2\lambda x,x^{2}+2\lambda y,x^{2}+y^{2}-3\right).\end{aligned}}

І отже:

\nabla _{x,y,\lambda }{\mathcal {L}}(x,y,\lambda )=0\quad \iff \quad {\begin{cases}2xy+2\lambda x=0\\x^{2}+2\lambda y=0\\x^{2}+y^{2}-3=0\end{cases}}\quad \iff \quad {\begin{cases}x(y+\lambda )=0&{\text{(i)}}\\x^{2}=-2\lambda y&{\text{(ii)}}\\x^{2}+y^{2}=3&{\text{(iii)}}\end{cases}}

(iii) це наше вихідне обмеження. (i) означає, що $x=0$ або $\lambda =-y$ . Якщо $x=0$ тоді з (iii) $y=\pm {\sqrt {3}}$ і далі $\lambda =0$ з (ii). Якщо ж $\lambda =-y$ , підставляючи у (ii) маємо $x^{2}=2y^{2}$ . Підставляючи у (iii) і розв'язуючи щодо $y$ мажмо $y=\pm 1$ . Отже існує шість критичних точок ${\mathcal {L}}$ :

({\sqrt {2}},1,-1);\quad (-{\sqrt {2}},1,-1);\quad ({\sqrt {2}},-1,1);\quad (-{\sqrt {2}},-1,1);\quad (0,{\sqrt {3}},0);\quad (0,-{\sqrt {3}},0).

Обчислюючи функцію мети в цих точках знаходимо, що

f(\pm {\sqrt {2}},1)=2;\quad f(\pm {\sqrt {2}},-1)=-2;\quad f(0,\pm {\sqrt {3}})=0.

Отже, функція мети досягає глобального максимуму (за умови обмеження) у $(\pm {\sqrt {2}},1)$ і глобального мінімуму в $(\pm {\sqrt {2}},-1).$ Точка $(0,{\sqrt {3}})$ це локальний мінімум $f,$ а $(0,-{\sqrt {3}})$ це локальний максимум $f,$ що можна побачити використавши обрамлену матрицю Гесе для ${\mathcal {L}}(x,y,0)$ .

Зауважте, що хоча $({\sqrt {2}},1,-1)$ це критична точка ${\mathcal {L}}$ , це не локальний екстремум ${\mathcal {L}}.$ Маємо, що

{\mathcal {L}}\left({\sqrt {2}}+\varepsilon ,1,-1+\delta \right)=2+\delta \left(\varepsilon ^{2}+\left(2{\sqrt {2}}\right)\varepsilon \right).

Маючи будь-який окіл $({\sqrt {2}},1,-1)$ , можна вибрати мале додатне $\varepsilon$ і мале $\delta$ будь-якого знаку, щоб отримати значення ${\mathcal {L}}$ як більше так і менше ніж $2$ . Це можна також побачити з того, що матриця Гесе для ${\mathcal {L}}$ обчислена в цій точці (та й в будь-якій іншій знайденій критичній точці) являє собою невизначену матрицю. Кожна з критичних точок ${\mathcal {L}}$ це сідлова точка ${\mathcal {L}}$ .

Див. також

Умови Каруша — Куна — Такера

Джерела

Григорій Михайлович Фіхтенгольц. Курс диференціального та інтегрального числення. — 2024. — 2100+ с.(укр.)
Колмогоров А. М., Фомін С. В. Елементи теорії функцій та функціонального аналізу. — К.: Вища шк., 1974. — 456 с.