Перейти к содержанию

Преобразование Лежандра

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис

Преобразование Лежандра для заданной функции [math]\displaystyle{ f(x) }[/math] — это построение функции [math]\displaystyle{ f^*(p) }[/math], двойственной ей по Юнгу. Если исходная функция была определена на векторном пространстве [math]\displaystyle{ V }[/math], её преобразованием Лежандра будет функция, определённая на сопряжённом пространстве [math]\displaystyle{ V^* }[/math], то есть на пространстве линейных функционалов на пространстве [math]\displaystyle{ V }[/math].

Мотивация

Возможная мотивация может быть выражена в виде менее общего определения. Преобразование Лежандра — это такая замена функции и переменной, при которой старая производная принимается за новую переменную, а старая переменная — за новую производную.

Выражение для дифференциала

[math]\displaystyle{ df(x) = f'(x) \,dx }[/math]

в силу того, что [math]\displaystyle{ d(xf') = f' \,dx + x \,df' }[/math], может быть записано в виде

[math]\displaystyle{ d(xf' - f) = x \,df'. }[/math]

Если теперь принять, что

[math]\displaystyle{ F = xf' - f, \quad y = f'(x), }[/math]

что и является преобразованием Лежандра [math]\displaystyle{ (f, x) \to (F, y) }[/math], тогда

[math]\displaystyle{ dF(y) = F'(y) \,dy, \quad x = F'(y). }[/math]

При этом новая переменная [math]\displaystyle{ y }[/math] равна старой производной, а старая переменная [math]\displaystyle{ x }[/math] равна новой производной:

[math]\displaystyle{ y = f'(x), \quad x = F'(y). }[/math]

Определения могут отличаться знаком [math]\displaystyle{ F }[/math]. Если исходных переменных [math]\displaystyle{ x }[/math] больше, чем одна, преобразование Лежандра может быть осуществлено по любому подмножеству из них.

Определение

Аналитическое определение

Преобразованием Лежандра функции [math]\displaystyle{ f }[/math], заданной на подмножестве [math]\displaystyle{ M }[/math] векторного пространства [math]\displaystyle{ V }[/math], называется функция [math]\displaystyle{ f^* }[/math], определенная на подмножестве [math]\displaystyle{ M^* }[/math] сопряжённого пространства [math]\displaystyle{ V^* }[/math] по формуле

[math]\displaystyle{ f^*(p) = \sup_{x \in M} \big(\langle p, x \rangle - f(x)\big), \quad p \in M^* = \left\{p : \sup_{x \in M}\big(\langle p, x \rangle - f(x)\big) \lt \infty \right\}, }[/math]

где [math]\displaystyle{ \langle p, x \rangle }[/math] — значение линейного функционала [math]\displaystyle{ p }[/math] на векторе [math]\displaystyle{ x }[/math]. В случае гильбертова пространства [math]\displaystyle{ \langle p, x \rangle }[/math] — обычное скалярное произведение. В частном случае дифференцируемой функции, заданной в [math]\displaystyle{ \mathcal R^n }[/math], переход к сопряженной функции осуществляется по формулам

[math]\displaystyle{ f^*(p) = \langle p, x \rangle - f(x), \quad p = \frac{\partial f}{\partial x} = \operatorname{grad} f, }[/math]

причём [math]\displaystyle{ x }[/math] нужно выразить через [math]\displaystyle{ p }[/math] из второго уравнения.

Геометрический смысл

Для выпуклой функции [math]\displaystyle{ f(x) }[/math] её надграфик [math]\displaystyle{ \operatorname{epi} f = \{(x,y) \mid y \geqslant f(x)\} }[/math] есть выпуклое замкнутое множество, границей которого является график функции [math]\displaystyle{ f(x) }[/math]. Множество опорных гиперплоскостей к надграфику функции [math]\displaystyle{ f(x) }[/math] есть естественная область определения её преобразованием Лежандра [math]\displaystyle{ f^*(p). }[/math] Если [math]\displaystyle{ p }[/math] — опорная гиперплоскость (в нашем случае касательная) к надграфику, она пересекает ось [math]\displaystyle{ y }[/math] в некоторой единственной точке. Её [math]\displaystyle{ y }[/math]-координата, взятая со знаком минус, и есть значение функции [math]\displaystyle{ f^*(p) }[/math].

Соответствие [math]\displaystyle{ x \to p }[/math] определено однозначно в области, где функция [math]\displaystyle{ f(x) }[/math] дифференцируема. Тогда [math]\displaystyle{ p }[/math] — касательная гиперплоскость к графику [math]\displaystyle{ f(x) }[/math] в точке [math]\displaystyle{ x }[/math]. Обратное соответствие [math]\displaystyle{ p \to x }[/math] определено однозначно тогда и только тогда, когда функция [math]\displaystyle{ f(x) }[/math] строго выпукла. В этом случае [math]\displaystyle{ x }[/math] — единственная точка касания опорной гиперплоскости [math]\displaystyle{ p }[/math] с графиком функции [math]\displaystyle{ f(x). }[/math]

Если функция [math]\displaystyle{ f(x) }[/math] дифференцируема и строго выпукла, определено соответствие [math]\displaystyle{ p(x) \leftrightarrow df(x), }[/math] сопоставляющее гиперплоскости [math]\displaystyle{ p }[/math] дифференциал функции [math]\displaystyle{ f(x) }[/math] в точке [math]\displaystyle{ x }[/math]. Это соответствие взаимно однозначно и позволяет перенести область определения функции [math]\displaystyle{ f^*(p) }[/math] в пространство ковекторов [math]\displaystyle{ V^*, }[/math] которыми являются дифференциалы функции [math]\displaystyle{ f(x) }[/math].

В общем случае произвольной невыпуклой функции геометрический смысл преобразования Лежандра сохраняется. В силу опорного принципа, выпуклая оболочка надграфика [math]\displaystyle{ \varphi }[/math] является пересечением полупространств, задаваемых всеми опорными гиперплоскостями, поэтому для преобразования Лежандра существенна лишь выпуклая оболочка надграфика [math]\displaystyle{ \varphi }[/math]. Таким образом, случай произвольной функции легко сводится к случаю выпуклой. Функция даже не обязана быть дифференцируемой или непрерывной, её преобразование Лежандра всё равно будет выпуклой полунепрерывной снизу функцией.

Свойства

  1. Теорема Фенхеля — Моро: для собственной выпуклой полунепрерывной снизу функции f, заданной на рефлексивном пространстве, преобразование Лежандра является инволютивным, то есть [math]\displaystyle{ f^{**}(x) = f(x) }[/math]. Легко убедиться, что если выпуклым замыканием функции f является функция g, то f* = g*. Отсюда следует, что для невыпуклой функции, выпуклое замыкание которой — собственная функция,
    [math]\displaystyle{ f^{**}(x) = \operatorname{\overline{co}}f(x) }[/math],
    где [math]\displaystyle{ \operatorname{\overline{co}}f }[/math] — выпуклое замыкание функции f.
  2. Непосредственно из аналитического определения следует неравенство Юнга — Фенхеля:
    [math]\displaystyle{ f(x) + f^*(p) \geqslant \langle p, x \rangle }[/math], причём равенство достигается, только если p = F́(x).
    (Часто неравенством Юнга называют частный случай этого неравенства для функции [math]\displaystyle{ F(x) = x^a/a }[/math], a > 1.)
  3. В вариационном исчислении (и основанной на нём лагранжевой механике) преобразование Лежандра обычно применяется к лагранжианам действия [math]\displaystyle{ L(t, x, \dot x) }[/math] по переменной [math]\displaystyle{ \dot x }[/math]. Образом лагранжиана становится гамильтониан действия H(txp), а уравнения Эйлера — Лагранжа для оптимальных траекторий преобразуются в уравнения Гамильтона.
  4. Используя тот факт, что [math]\displaystyle{ p = \nabla_x f }[/math], легко показать, что [math]\displaystyle{ \nabla_p f^*(p) = -x }[/math].

Примеры

Степенная функция

Рассмотрим преобразование Лежандра функции [math]\displaystyle{ f(x) = x^n }[/math], ([math]\displaystyle{ n \gt 0 }[/math], [math]\displaystyle{ n \ne 1 }[/math]), определённой на [math]\displaystyle{ \mathbb{R^+} }[/math]. В случае чётного n можно рассматривать [math]\displaystyle{ \mathbb{R} }[/math].

[math]\displaystyle{ p(x) = \frac{df}{dx} = n \cdot x^{n-1}. }[/math]

Отсюда выражаем [math]\displaystyle{ x = x(p) }[/math], получаем

[math]\displaystyle{ x(p) = \left(\frac{p}{n}\right)^{\frac{1}{n - 1}}. }[/math]

Итого получаем преобразование Лежандра для степенной функции:

[math]\displaystyle{ f^*(p) = px - f(x) = \left(\frac{p}{n}\right)^{\frac{n}{n - 1}} \cdot (n - 1). }[/math]

Легко проверить, что повторное преобразование Лежандра даёт исходную функцию [math]\displaystyle{ f(x) }[/math].

Функция многих переменных

Рассмотрим функцию многих переменных, определённую на пространстве [math]\displaystyle{ \mathbb{R}^n }[/math] следующего вида:

[math]\displaystyle{ f(x) = \langle x, Ax \rangle + c. }[/math]

[math]\displaystyle{ A }[/math] действительная, положительно определённая матрица, [math]\displaystyle{ c }[/math] константа. Прежде всего убедимся, что сопряженное пространство, на котором определено преобразование Лежандра, совпадает с [math]\displaystyle{ \mathbb{R}^n }[/math]. Для этого нам нужно убедиться в существовании экстремума функции [math]\displaystyle{ \phi = \langle p, x \rangle - \langle x, Ax \rangle - c }[/math].

[math]\displaystyle{ \nabla_x \phi = p - 2Ax, }[/math]
[math]\displaystyle{ \nabla_x \nabla_x \phi = -2A. }[/math]

В силу положительной определённости матрицы [math]\displaystyle{ A }[/math], мы получаем, что точка экстремума является максимумом. Таким образом для каждого [math]\displaystyle{ p }[/math] существует супремум. Вычисление преобразования Лежандра проводится непосредственно:

[math]\displaystyle{ f^*(p) = \frac{1}{4} \langle p, A^{-1}p \rangle - c. }[/math]

Применения

Гамильтонова механика

В лагранжевой механике система описывается функцией Лагранжа. Для типичной задачи функция Лагранжа выглядит следующим образом:

[math]\displaystyle{ L(q, u) = \frac{1}{2} \langle u, Mu \rangle - V(q), }[/math]

[math]\displaystyle{ (q, u) \in \mathbb{R}^n \times \mathbb{R}^n }[/math], со стандартными евклидовым скалярным произведением. Матрица [math]\displaystyle{ M }[/math] считается действительной, положительно определённой. В том случае, когда лагранжиан не вырожден по скоростям, то есть

[math]\displaystyle{ p = \nabla_u L(q,u) \ne 0, }[/math]

можно сделать преобразование Лежандра по скоростям и получить новую функцию, называемую гамильтонианом:

[math]\displaystyle{ H(p, q) = pq' - L = \frac{1}{2} \langle p, M^{-1} p \rangle + V(q). }[/math]

Термодинамика

В термодинамике очень часто встречаются самые разные термодинамические функции, дифференциал которых выглядит в самом общем случае как

[math]\displaystyle{ dL = X\,dx + Y\,dy + Z\,dz + \ldots }[/math]

К примеру, дифференциал для внутренней энергии выглядит следующим образом:

[math]\displaystyle{ dE = T\,dS - P\,dV. }[/math]

Энергия тут представлена как функция переменных [math]\displaystyle{ S, V }[/math]. Подобные переменные называются естественными. Например, свободная энергия получается как преобразования Лежандра внутренней энергии:

[math]\displaystyle{ F = E - TS, }[/math]
[math]\displaystyle{ dF = -S\,dT - P\,dV. }[/math]

В общем случае, если мы хотим перейти от функции [math]\displaystyle{ L = L(x, y, z, \ldots) }[/math] к функции [math]\displaystyle{ L = L(X, y, z, \ldots) }[/math], то следует сделать преобразование Лежандра:

[math]\displaystyle{ L(X, y, z, \ldots) = L - xX, }[/math]
[math]\displaystyle{ dL(X, y, z, \ldots) = -x\,dX + Y\,dy + Z\,dz + \ldots }[/math]

Теория поля. Функциональное преобразование Лежандра

В квантовой теории поля очень часто используется функциональное преобразование Лежандра. Исходным объектом являются связные функции Грина, которые обозначаются [math]\displaystyle{ W(A) }[/math], где [math]\displaystyle{ A }[/math] — некоторые внешние поля. Преобразованием Лежандра по полю А называют следующую функцию[1]:

[math]\displaystyle{ \Gamma(\alpha) = W\big(A(\alpha)\big) - \int dx \cdot \alpha A. }[/math]

Знак интегрирование обычно не пишут. [math]\displaystyle{ \alpha }[/math] определяется следующим выражением[1]:

[math]\displaystyle{ \alpha(x) = \frac{\delta{W}}{\delta{A(x)}}, }[/math]

[math]\displaystyle{ \delta }[/math] означает вариационную производную. При помощи свойства вариационной производной несложно вывести следующее соотношение, связывающее [math]\displaystyle{ W }[/math] и [math]\displaystyle{ \Gamma }[/math]. Действительно:

[math]\displaystyle{ \delta(x - y) = \frac{\delta A(x)}{\delta A(y)} = \int dz\, \frac{\delta A(x)}{\delta \alpha(z)} \frac{\delta \alpha(z)}{\delta A(y)} = -\int dz\, \frac{\delta^2\Gamma}{\delta\alpha(x) \delta\alpha(z)} \frac{\delta^2 W}{\delta A(z) \delta A(y)}. }[/math]

Другими словами, функционалы [math]\displaystyle{ W_2 = \frac{\delta^2 W}{\delta A(z) \delta A(y)} }[/math] и [math]\displaystyle{ \Gamma_2 = \frac{\delta^2\Gamma}{\delta\alpha(x) \delta\alpha(z)} }[/math], с точностью до знака, являются обратными друг к другу. Символически это записывают следующим образом:

[math]\displaystyle{ W_2 \cdot \Gamma_2 = -1. }[/math]

Примечания

  1. 1,0 1,1 Васильев А. Н. Функциональные методы в квантовой теории поля и статистике. — Ленинград, 1976. — С. 81. — 295 с.

Литература