Гессиан функции

Гессиан функции — симметрическая квадратичная форма[1], описывающая поведение функции во втором порядке.

Для функции , дважды дифференцируемой в точке

или

где (или ) и функция задана на -мерном вещественном пространстве (или комплексном пространстве ) с координатами (или ). В обоих случаях гессиан — квадратичная форма, заданная на касательном пространстве, не меняющаяся при линейных преобразованиях переменных. Гессианом также часто называют и определитель матрицы см. ниже.

Матрица Гессе

[править | править код]

Матрица этой квадратичной формы образована вторыми частными производными функции. Если все производные существуют, то

Определитель этой матрицы называется определителем Гессе, или просто гессианом[источник не указан 4354 дня].

Матрицы Гессе используются в задачах оптимизации методом Ньютона. Полное вычисление матрицы Гессе может быть затруднительно, поэтому были разработаны квазиньютоновские алгоритмы, основанные на приближённых выражениях для матрицы Гессе. Наиболее известный из них — алгоритм Бройдена — Флетчера — Гольдфарба — Шанно.

Симметрия матрицы Гессе

[править | править код]

Смешанные производные функции f — это элементы матрицы Гессе, стоящие не на главной диагонали. Если они непрерывны, то порядок дифференцирования не важен:

Это можно также записать как

В этом случае матрица Гессе симметрична.

Критические точки функции

[править | править код]

Если градиент (её векторная производная) равен нулю в некоторой точке , то эта точка называется критической. Достаточным условием существования экстремума в этой точке является знакоопределённость гессиана f (понимаемого в данном случае как квадратичная форма), а именно:

  • если гессиан положительно определён, то  — точка локального минимума функции ,
  • если гессиан отрицательно определён, то  — точка локального максимума функции ,
  • если гессиан не является знакоопределённым (принимает как положительные, так и отрицательные значения) и невырожден , то  — седловая точка функции .

Вариации и обобщения

[править | править код]

Вектор-функции

[править | править код]

Если  — вектор-функция, то есть

то её вторые частные производные образуют не матрицу, а тензор ранга 3, который можно рассматривать как массив из матриц Гессе:

При данный тензор вырождается в обычную матрицу Гессе.

Окаймлённый гессиан

[править | править код]

При решении задачи нахождения условного экстремума функции с ограничениями

где , , для проверки достаточных условий экстремума можно использовать так называемый окаймлённый гессиан функции Лагранжа , который будет иметь вид[2]

Проверка достаточных условий экстремума заключается в вычислении знаков детерминантов определённого набора подматриц окаймлённого гессиана. Именно, если существуют и такие, что и

для , то в точке функция имеет строгий условный минимум. Если же

для , то в точке функция имеет строгий условный максимум[3].

Понятие введено Людвигом Отто Гессе (1844), который использовал другое название. Термин «гессиан» был введён Джеймсом Джозефом Сильвестром.

Примечания

[править | править код]
  1. Гессиан. Дата обращения: 2 апреля 2016. Архивировано 15 апреля 2016 года.
  2. Hallam, Arne Econ 500: Quantitative Methods in Economic Analysis I. Iowa State (7 октября 2004). Дата обращения: 14 апреля 2021. Архивировано 19 апреля 2021 года.
  3. Neudecker, Heinz. Matrix Differential Calculus with Applications in Statistics and Econometrics / Heinz Neudecker, Jan R. Magnus. — New York : John Wiley & Sons, 1988. — P. 136. — ISBN 978-0-471-91516-4.
  • Камынин Л.И. Математический анализ. Т. 1, 2. - 2001.
  • Кудрявцев Л.Д «Краткий курс математического анализа. Т.2. Дифференциальное и интегральное исчисления функций многих переменных. Гармонический анализ», ФИЗМАТЛИТ, 2002, — 424 с. — ISBN 5-9221-0185-4. Или любое другое издание.
  • Голубицкий М., Гийемин В. Устойчивые отображения и их особенности, — М.: Мир, 1977.