Равенство смешанных производных

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис

Смешанные частные производные одной и той же функции, отличающиеся лишь порядком (очерёдностью) дифференцирования, равны между собой при условии их непрерывности. Такое свойство называется равенством смешанных производных.

Само утверждение о равенстве смешанных производных в различных источниках упоминается как теорема Шварца, теорема Клеро или теорема Янга.

Теорема

Определение смешанной производной

Пусть дана достаточно гладкая (скалярная) функция [math]\displaystyle{ f }[/math] многих переменных:

[math]\displaystyle{ (1) \qquad f = f(x_1, x_2, \dots x_n) }[/math]

Мы можем взять частную производную этой функции по одному из аргументов [math]\displaystyle{ x_i }[/math], считая остальные аргументы постоянными параметрами. В результате мы получим новую функцию:

[math]\displaystyle{ (2) \qquad \phi(x_i) = {\partial f \over \partial x_i} \bigg|_{x_1,\dots x_{i-1}, x_{i+1}, \dots x_n = const} }[/math]

Эта новая функция тоже зависит от остальных аргументов как от параметров. То есть численное значение [math]\displaystyle{ \phi }[/math] в общем случае зависит от тех же переменных [math]\displaystyle{ x_1, x_2, \dots x_n }[/math], что и оригинальная функция [math]\displaystyle{ f }[/math]:

[math]\displaystyle{ (3) \qquad \phi = \phi(x_1, x_2, \dots x_n) }[/math]

Если функция [math]\displaystyle{ \phi }[/math] окажется достаточно гладкой, то мы можем и её продифференцировать, взяв частную производную по тому же самому или по другому аргументу [math]\displaystyle{ x_j }[/math]:

[math]\displaystyle{ (4) \qquad {\partial \phi \over \partial x_j} = {\partial^2 f \over \partial x_j \partial x_i} }[/math]

Если [math]\displaystyle{ j \ne i }[/math], то выражение в правой части равенства (4) называется смешанной производной.

Основа теоремы

Для гладкой функции многих переменных значение смешанной производной не зависит от порядка дифференцирования:

[math]\displaystyle{ (5) \qquad {\partial^2 f \over \partial x_i \partial x_j} = {\partial^2 f \over \partial x_j \partial x_i} }[/math]

Теорема является базовой в теории функций многих переменных и широко применяется в математической физике, теории дифференциальных уравнений в частных производных, дифференциальной геометрии.

Необходимая степень гладкости

Уточнять необходимую степень гладкости следует поэтапно.

  • 1. Справедливость для аналитической функции (теорема).
  • 2. Справедливость для более широкого класса функций, имеющих в окрестности точки только такие непрерывные производные:
[math]\displaystyle{ (6) \qquad {\partial f \over \partial x_i}, \; {\partial f \over \partial x_j}, \; {\partial^2 f \over \partial x_i \partial x_j}, {\partial^2 f \over \partial x_j \partial x_i} }[/math]
  • 3. Поскольку для фиксированных индексов [math]\displaystyle{ i,j }[/math] все производные из перечня (6) берутся при условии, что любой третий аргумент [math]\displaystyle{ x_k }[/math] является константой, то функция [math]\displaystyle{ f }[/math] (а также все производные (6)) может быть разрывной в отношении третьих аргументов. Например, составим функцию из двух слагаемых:
[math]\displaystyle{ f(x_1, x_2, \dots x_n) = \Phi(x_i, x_j) + Z(\dots x_{i-1}, x_{i+1}, \dots x_{j-1}, x_{j+1}, \dots) }[/math]

где первое слагаемое является гладкой функцией двух аргументов, а второе слагаемое разрывной во всех точках.

Дальнейшее уточнение гладкости функции нужно делать в ходе доказательства теоремы, оно будет сформулировано в самом конце.

Доказательство теоремы

Как указано выше, для доказательства теоремы можно не рассматривать зависимость функции от третьих аргументов. Поэтому для простоты записи изменим обозначения [math]\displaystyle{ x_i, x_j }[/math] на [math]\displaystyle{ x, y }[/math], то есть будем рассматривать такую функцию двух переменных:

[math]\displaystyle{ (7) \qquad f = f(x, y) }[/math]

Также для упрощения формул будем обозначать частные производные индексами внизу функции:

[math]\displaystyle{ (8) \qquad f_x(x, y) = {\partial f(x, y) \over \partial x}, \; f_y(x, y) = {\partial f(x, y) \over \partial y} }[/math]
[math]\displaystyle{ (8a) \qquad f_{xy} = {\partial^2 f \over \partial x \partial y}, \; f_{yx} = {\partial^2 f \over \partial y \partial x} }[/math]

Пусть в точке [math]\displaystyle{ (x, y) }[/math] существует смешанная производная:

[math]\displaystyle{ (9) \qquad f_{xy}(x, y) = \lim_{\Delta x \rightarrow 0} {f_y(x + \Delta x, y) - f_y(x, y) \over \Delta x} }[/math]

Предположим, что смешанная производная [math]\displaystyle{ f_{xy} }[/math] существует в точке [math]\displaystyle{ (x, y) }[/math], а также существует первая производная [math]\displaystyle{ f_y(x, y) }[/math] вдоль (горизонтальной) прямой [math]\displaystyle{ y = const }[/math].

Далее, разность производных равна производной от разности, поэтому превращаем формулу (9) в:

[math]\displaystyle{ (10) \qquad f_{xy}(x, y) = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} {\partial \over \partial y} \left [ f(x + \Delta x, y) - f(x, y) \right ] }[/math]

Это преобразование никаких дополнительных условий не накладывает, поскольку разность дифференцируемых функций всегда является функцией дифференцируемой.

Далее, разность в квадратных скобках формулы (10) можно записать в виде определённого интеграла от производной:

[math]\displaystyle{ (11) \qquad f_{xy} (x, y) = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} {\partial \over \partial y} \int_x^{x+\Delta x} f_x(\xi, y) d \xi }[/math]

Нужно, чтобы существовала частная производная [math]\displaystyle{ f_x }[/math] вдоль прямой [math]\displaystyle{ y = const }[/math].

Теперь частную производную по игрек в формуле (11) запишем согласно определению производной как предела:

[math]\displaystyle{ (12) \qquad f_{xy}(x, y) = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} {1 \over \Delta y} \left ( \int_x^{x + \Delta x} f_x(\xi, y + \Delta y) d \xi - \int_x^{x + \Delta x} f_x(\xi, y) d \xi \right ) }[/math]

Как видно, надо, чтобы частная производная [math]\displaystyle{ f_x }[/math] существовала не только на прямой [math]\displaystyle{ y = const }[/math], но в некоторой двухмерной окрестности точки [math]\displaystyle{ (x, y) }[/math].

Далее, разность интегралов равна интегралу от разности, причём под знак интеграла можно внести постоянный множитель [math]\displaystyle{ {1 \over \Delta y} }[/math]:

[math]\displaystyle{ (13) \qquad f_{xy} = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x} {f_x(\xi, y + \Delta y) - f_x(\xi, y) \over \Delta y} d \xi }[/math]

Это преобразование также не накладывает дополнительных условий, поскольку разность интегрируемых функций является функцией интегрируемой.

По теореме Лагранжа, подынтегральное выражение в формуле (13) равно производной в средней точке:

[math]\displaystyle{ (14) \qquad {f_x(\xi, y + \Delta y) - f_x(\xi, y) \over \Delta y} = f_{yx}(\xi, \eta) }[/math]

Средняя точка является функцией:

[math]\displaystyle{ (14a) \qquad \eta = \eta(\xi, \Delta y) }[/math],

значения которой лежат в интервале (если, например, [math]\displaystyle{ \Delta y \gt 0 }[/math])

[math]\displaystyle{ (14b) \qquad \eta \in \, [y, y + \Delta y] }[/math]

Для справедливости (14) нужно существование смешанной производной [math]\displaystyle{ f_{yx} = {\partial^2 f \over \partial y \partial x} }[/math] в некоторой двухмерной окрестности точки [math]\displaystyle{ (x, y) }[/math].

Для окончания доказательства надо принять, что смешанная производная непрерывна в точке [math]\displaystyle{ (x, y) }[/math] как функция двух переменных. Значение этой производной в близкой точке [math]\displaystyle{ (\xi, \eta) }[/math] равно с точностью до бесконечно малого слагаемого значению производной в точке [math]\displaystyle{ (x, y) }[/math]:

[math]\displaystyle{ (15) \qquad f_{yx}(\xi, \eta) = f_{yx}(x, y) + o(\xi - x, \eta -y) }[/math]

Смешанная производная [math]\displaystyle{ f_{yx} }[/math] существует в двухмерной окрестности точки [math]\displaystyle{ (x, y) }[/math] и непрерывна в этой точке как функция двух переменных.

Подставим (14) и (15) в (13):

[math]\displaystyle{ (16) \qquad f_{xy} = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x} (f_{yx}(x, y) + o(\xi - x, \eta -y)) d \xi }[/math]

Заметим, что формула (16) эквивалентна формуле (13) (хотя и в других обозначениях), а потому интеграл и обе границы существуют. Поскольку подынтегральная функция в (16) интегрируема, а первое слагаемое [math]\displaystyle{ f_{yx}(x,y) }[/math] является константой по переменной интегрирования [math]\displaystyle{ \xi }[/math], то второе слагаемое тоже оказывается интегрируемым, и мы можем разбить интеграл на сумму двух интегралов, первый из которых легко берётся как интеграл от константы:

[math]\displaystyle{ (17) \qquad \int_x^{x+\Delta x} (f_{yx}(x, y) + o(\xi - x, \eta -y)) d \xi = \int_x^{x+\Delta x} f_{yx}(x,y) d \xi + \int_x^{x+\Delta x} o(\xi - x, \eta -y) d \xi = }[/math]
[math]\displaystyle{ = f_{yx} \Delta x + \int_x^{x+\Delta x} o(\xi - x, \eta -y) d \xi }[/math]

После подстановки (17) в (16) мы можем вынести постоянное слагаемое сначала за пределы первой границы, а затем за пределы другой границы:

[math]\displaystyle{ (18) \qquad f_{xy} = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \left ( f_{yx}(x,y) \Delta x + \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x} o(\xi - x, \eta(\xi,\Delta y) -y) d \xi \right ) = }[/math]
[math]\displaystyle{ = f_{yx}(x, y) + \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x}o(\xi - x, \eta(\xi,\Delta y) -y) d \xi }[/math]

Покажем, что второе слагаемое в последнем выражении формулы (18) равно нулю. Возьмём произвольное положительное число [math]\displaystyle{ \epsilon }[/math]. Непрерывность смешанной производной [math]\displaystyle{ f_{yx} }[/math] в точке [math]\displaystyle{ (x, y) }[/math] означает, что существует такое положительное число [math]\displaystyle{ \delta }[/math], что для каждой точки [math]\displaystyle{ (\xi, \eta) }[/math] внутри квадрата [math]\displaystyle{ |\xi - x| \lt \delta, \; |\eta - y| \lt \delta }[/math] справедливо неравенство:

[math]\displaystyle{ (19) \qquad |o(\xi-x, \eta - y)| = |f_{yx}(\xi, \eta) - f_{yx}(x,y)| \lt \epsilon }[/math]

Если мы возьмём положительные числа [math]\displaystyle{ \Delta x \lt \delta, \; \Delta y \lt \delta }[/math], то интеграл в последнем слагаемом формулы (18) оценивается сверху:

[math]\displaystyle{ (20) \qquad \int_x^{x+\Delta x}o(\xi - x, \eta(\xi,\Delta y) -y) d \xi \lt \int_x^{x+\Delta x} \epsilon d \xi = \epsilon \Delta x }[/math]

Обозначим это слагаемое [math]\displaystyle{ L }[/math]

[math]\displaystyle{ (21) \qquad L = \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \int_x^{x+\Delta x}o(\xi - x, \eta(\xi,\Delta y) -y) d \xi \le \lim_{\Delta x \rightarrow 0} {1 \over \Delta x} \lim_{\Delta y \rightarrow 0} \epsilon \Delta x = \epsilon }[/math]

Аналогично (если взять [math]\displaystyle{ -\epsilon \lt \Delta x \lt 0 }[/math]), имеем оценку снизу:

[math]\displaystyle{ (22) \qquad L \ge -\epsilon }[/math]

Поскольку положительное число [math]\displaystyle{ \epsilon }[/math] может быть сколь угодно малым, то с необходимостью следует [math]\displaystyle{ L = 0 }[/math]. Теорема доказана.

Уточнение гладкости функции

Как видно в ходе доказательства, от функции требуется существование одной смешанной производной (например, [math]\displaystyle{ f_{xy} }[/math]) в точке, а также существование второй смешанной производной [math]\displaystyle{ f_{yx} }[/math] в двумерной окрестности точки и её непрерывность в этой точке. Из этого условия также следует существование производной [math]\displaystyle{ f_y }[/math] вдоль отрезка прямой [math]\displaystyle{ y = const }[/math] и существование производной [math]\displaystyle{ f_x }[/math] в двумерной окрестности точки.

Кроме того, существование [math]\displaystyle{ f_{xy} }[/math] в точке [math]\displaystyle{ (x, y) }[/math] следует из двух фактов: (а) существует производная [math]\displaystyle{ f_y }[/math] вдоль отрезка прямой [math]\displaystyle{ y = const }[/math], проходящей через точку [math]\displaystyle{ (x, y) }[/math], (б) смешанная производная [math]\displaystyle{ f_{yx} }[/math] существует и непрерывна в этой точке.

Пример

Рассмотрим функцию

[math]\displaystyle{ (23) \qquad f(x, y) = xy + y^2 \chi(y) }[/math]

где функция Дирихле [math]\displaystyle{ \chi(y) }[/math] равна нулю в рациональных точках [math]\displaystyle{ y={m \over n} }[/math] и единице в иррациональных. Функция (23) определена на всей плоскости; непрерывна (как функция двух переменных) вдоль прямой [math]\displaystyle{ y = 0 }[/math] и разрывна во всех других точках плоскости.

Везде существует непрерывная частная производная:

[math]\displaystyle{ (24) \qquad f_x(x, y) = {\partial f \over \partial x} = y }[/math]

а также одна из смешанных производных:

[math]\displaystyle{ (25) \qquad f_{yx}(x, y) = {\partial^2 f \over \partial y \partial x} = 1 }[/math]

Частная производная по игрек существует лишь в точках прямой [math]\displaystyle{ y=0 }[/math]:

[math]\displaystyle{ (26) \qquad f_y(x, 0) = x }[/math]

Также в этих же точках прямой существует вторая смешанная производная:

[math]\displaystyle{ (27) \qquad f_{xy}(x, 0) = \lim_{\Delta x \rightarrow 0} {f_y(x+\Delta x, 0) - f_y(x, 0) \over \Delta x} = 1 }[/math]

Как видим, для точек прямой [math]\displaystyle{ y = 0 }[/math] условия теоремы выполняются, и обе смешанные производные равны.

Контрпример

Рассмотрим функцию двух переменных [math]\displaystyle{ x, y }[/math]

[math]\displaystyle{ (28) \qquad f(x, y) = {|a x + b y|^3 \over \sqrt{x^2 + y^2}} }[/math]

где буквами [math]\displaystyle{ a, b }[/math] обозначены некоторые ненулевые параметры. Формула (28) задаёт непрерывную функцию всюду на плоскости за исключением начала координат [math]\displaystyle{ x=0, \; y=0 }[/math]. Мы можем доопределить функцию [math]\displaystyle{ f(x,y) }[/math] в начале координат

[math]\displaystyle{ (29) \qquad f(0,0) = 0 }[/math]

Согласно этим определениям функция будет непрерывной также и в начале координат, что можно видеть, представив формулу (28) в полярной системе координат (и направляя [math]\displaystyle{ r \rightarrow 0 }[/math]):

[math]\displaystyle{ (30) \qquad f(r, \phi) = (a^2+b^2)^{3 \over 2} \, r^2 |\sin(\phi + \phi_0)|^3 }[/math]

Покажем, что для этой доопределённой функции [math]\displaystyle{ f(x,y) }[/math] смешанные производные в начале координат существуют, но не равны между собой.

Сначала вычислим первые производные [math]\displaystyle{ f_x, \, f_y }[/math]. Как промежуточный результат, заметим, что функция «куб модуля» дважды дифференцируема, и её первая и вторая производные вычисляются по формулам:

[math]\displaystyle{ (31) \qquad {d \over d x} |x|^3 = 3 x |x| }[/math]
[math]\displaystyle{ (31a) \qquad {d^2 \over d x^2} |x|^3 = {d \over d x} (3 x |x|) = 6 |x| }[/math]

Теперь, учитывая (28) и (31), запишем первые производные функции [math]\displaystyle{ f(x,y) }[/math] в точке плоскости, отличной от начала координат ([math]\displaystyle{ r = \sqrt{x^2 + y^2} }[/math]):

[math]\displaystyle{ (32) \qquad f_x = 3 a {(a x + b y)|a x + b y| \over r} - {x \over r^3} |a x + b y|^3 }[/math]
[math]\displaystyle{ (33) \qquad f_y = 3 b {(a x + b y)|a x + b y| \over r} - {y \over r^3} |a x + b y|^3 }[/math]

Можно также вычислить первые производные в начале координат, исходя из определения производной:

[math]\displaystyle{ (32a) \qquad f_x(0, 0) = \lim_{x \rightarrow 0} {f(x, 0) - f(0,0) \over x} = \lim_{x \rightarrow 0} {|ax|^3 \over {x |x|}} = 0 }[/math]

Аналогично

[math]\displaystyle{ (33a) \qquad f_y(0, 0) = 0 }[/math]

Перейдём теперь к вычислению смешанных производных в начале координат:

[math]\displaystyle{ (34) \qquad f_{xy}(0, 0) = \lim_{x \rightarrow 0} {f_y(x, 0) - f_y(0,0) \over x} = \lim_{x \rightarrow 0} {1 \over x} \left ({3 b a x |a x| \over |x|} \right ) = 3 a b |a| }[/math]

Аналогичное вычисление даёт:

[math]\displaystyle{ (35) \qquad f_{yx}(0, 0) = 3 a b |b| }[/math]

Легко видеть, что формулы (34) и (35) дают разные результаты, если:

[math]\displaystyle{ (36) \qquad |a| \gt 0, \; |b| \gt 0, \; |a| \ne |b| }[/math]

Причина этого неравенства в том, что не выполняется условие теоремы — обе смешанные производные (хотя существуют везде) являются разрывными в начале координат.

Можно также рассмотреть функцию

[math]\displaystyle{ f(x, y) = {x y (x^2 - y^2) \over x^2 + y^2} }[/math]

Упрощенное доказательство для аналитических функций

Аналитическая функция двух переменных (по крайней мере локально) разлагается в сходящийся степенной ряд:

[math]\displaystyle{ (37) \qquad f(x, y) = \sum_{n, m = 0}^{\infty} a_{nm} (x - x_0)^n (y - y_0)^m }[/math]

Как известно, степенной ряд можно дифференцировать почленно в пределах его радиуса сходимости. Таким образом, найдём первые производные:

[math]\displaystyle{ (38) \qquad f_x = \sum_{n, m = 0}^{\infty} n a_{nm} (x - x_0)^{n-1} (y - y_0)^m }[/math]
[math]\displaystyle{ (39) \qquad f_y = \sum_{n, m = 0}^{\infty} m a_{nm} (x - x_0)^n (y - y_0)^{m-1} }[/math]

Повторное дифференцирование (38) и (39) даёт одну и ту же формулу для обеих смешанных производных:

[math]\displaystyle{ (40) \qquad f_{xy} = f_yx = \sum_{n, m = 0}^{\infty} n m a_{nm} (x - x_0)^{n-1} (y - y_0)^{m-1} }[/math]

См. также

Литература