Неравенство Коши — Буняковского

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис
(перенаправлено с «Неравенство Шварца»)

Неравенство Коши́ — Буняко́вского связывает норму и скалярное произведение векторов в евклидовом или гильбертовом пространстве. Это неравенство эквивалентно неравенству треугольника для нормы. Частный случай неравенства Гёльдера и неравенства Йенсена[1].

Неравенство Коши — Буняковского иногда, особенно в иностранной литературе, называют неравенством Шварца и неравенством Коши — Буняковского — Шварца, хотя работы Шварца на эту тему появились только спустя 25 лет после работ Буняковского[2]. Конечномерный случай этого неравенства называется неравенством Коши и был доказан Коши в 1821 году.

Формулировка

Пусть дано линейное пространство [math]\displaystyle{ L }[/math] со скалярным произведением [math]\displaystyle{ \langle x,\;y\rangle }[/math]. Пусть [math]\displaystyle{ \|x\| }[/math] — норма, порождённая скалярным произведением, то есть [math]\displaystyle{ \|x\|\equiv\sqrt{\langle x,\;x\rangle},\;\forall x\in L }[/math]. Тогда для любых [math]\displaystyle{ x,\;y\in L }[/math] имеем:

[math]\displaystyle{ |\langle x,\;y\rangle| \leqslant \|x\|\cdot\|y\|, }[/math]

причём равенство достигается тогда и только тогда, когда векторы [math]\displaystyle{ x }[/math] и [math]\displaystyle{ y }[/math] линейно зависимы (коллинеарны, или среди них есть нулевой).

Примеры

  • Важным частным случаем, часто использующимся в теории чисел, является случай, когда один из векторов полностью состоит из единиц:
[math]\displaystyle{ \left({ \sum \limits_{i=1}^{n} {x_i} }\right)^2 \le \left({\sum \limits_{i=1}^{n} {1}}\right) \sum \limits_{i=1}^{n} {{x_i}^2} = n \sum \limits_{i=1}^{n} {{x_i}^2} }[/math]
[math]\displaystyle{ \left|\sum\limits_{k=1}^\infty x_k\bar{y}_k\right|^2\leqslant\left(\sum_{k=1}^\infty|x_k|^2\right)\cdot\left(\sum_{k=1}^\infty|y_k|^2\right), }[/math]

где [math]\displaystyle{ \bar{y}_k }[/math] обозначает комплексное сопряжение [math]\displaystyle{ y_k }[/math].

[math]\displaystyle{ \left|\int\limits_X f(x)\overline{g(x)}\,\mu(dx)\right|^2\leqslant\left(\int\limits_X\left|f(x)\right|^2\,\mu(dx)\right)\cdot\left(\int\limits_X\left|g(x)\right|^2\,\mu(dx)\right). }[/math]
  • В пространстве случайных величин с конечным вторым моментом [math]\displaystyle{ L^2(\Omega,\;\mathcal{F},\;\mathbb{P}) }[/math] неравенство Коши — Буняковского имеет вид:
    [math]\displaystyle{ \mathrm{cov}^2(X,\;Y)\leqslant\mathrm{D}[X]\cdot\mathrm{D}[Y], }[/math]
где [math]\displaystyle{ \mathrm{cov} }[/math] обозначает ковариацию, а [math]\displaystyle{ \mathrm{D} }[/math] — дисперсию.
  • Для двух независимых случайных величин [math]\displaystyle{ \xi }[/math] и [math]\displaystyle{ \eta }[/math] неравенство Коши — Буняковского имеет вид:
    [math]\displaystyle{ \left [\mathbf{M} (\eta \cdot \xi) \right ]^2 \leqslant \mathbf{M}\left [ \eta^2 \cdot \xi^2 \right ] = \mathbf{M}\eta^2 \cdot \mathbf{M}\xi^2. }[/math]

Способы доказательства

Существует лишь несколько сущностно различных подходов к доказательству неравенства. Однако, ввиду его универсальности, одни и те же приводящие к нему формальные операции можно описывать в разных терминах. Из-за этого некоторые авторы представляют неравенство как имеющее чрезвычайно много доказательств.[3]

Для удобства изложения в данном разделе, когда не указано иное, описываются доказательства только для пространства конечной размерности над [math]\displaystyle{ \mathbb{R} }[/math], то есть для конечных последовательностей [math]\displaystyle{ (x_1, \dots, x_n) }[/math], [math]\displaystyle{ (y_1, \dots, y_n) }[/math].

Комбинаторный (через перестановочное неравенство)

Схема доказательства неравенства для одной последовательности через перестановочное неравенство.

Случай с вектором из единиц

Пусть [math]\displaystyle{ y_1=\dots=y_n=1 }[/math]. Раскрывая квадрат и делая замену [math]\displaystyle{ t=i-j }[/math], квадрат суммы можно разбить на блоки следующим образом:

[math]\displaystyle{ {\left({ \sum \limits_{i=1}^{n} {x_i} }\right)}^2 = \sum \limits_{i=1}^{n} \sum \limits_{j=1}^{n} {x_i x_j} = \sum \limits_{t=0}^{n-1} {\left({ \sum \limits_{j=1}^{n} {x_j x_{j+t}} }\right)}\ , }[/math]

где обозначения [math]\displaystyle{ x_{n+1}, x_{n+2},\dots }[/math] соответствуют [math]\displaystyle{ x_1, x_2, \dots }[/math]. Из перестановочного неравенства для двух копий последовательности [math]\displaystyle{ (x_1, \dots, x_n) }[/math] и перестановок

[math]\displaystyle{ \sigma_t(j) := ((t + j - 1) \mod{n}) + 1,\ \ \ t = 0, \dots, n-1 }[/math]

следует, что каждая из внутренних сумм не превышает [math]\displaystyle{ \sum \limits_{i=1}^{n} {x_i^2} }[/math].

Общий случай

Если все [math]\displaystyle{ y_i }[/math] – целые, то, раскрывая произведения [math]\displaystyle{ x_i y_i = \underbrace{x_i + \dots + x_i}_{y_i} }[/math] и применяя уже доказанный частный случай для получившихся [math]\displaystyle{ \sum \limits_{i=1}^{n} {y_i} }[/math] слагаемых, получим

[math]\displaystyle{ \left( \sum \limits_{i=1}^{n} {x_i y_i} \right)^2 = \left( \sum \limits_{i=1}^{n} {\underbrace{x_i + \dots + x_i}_{y_i}} \right)^2 \le \left( {\sum \limits_{i=1}^{n} {y_i}} \right) \left( {\sum \limits_{i=1}^{n} {\underbrace{x_i^2 + \dots + x_i^2}_{y_i}}} \right) = \left( {\sum \limits_{i=1}^{n} {y_i}} \right) \left( {\sum \limits_{i=1}^{n} {x_i^2 y_i}} \right)\ , }[/math]

Делением обоих частей на целые числа можно получить то же неравенство для рациональных [math]\displaystyle{ y_i }[/math], а из непрерывности сложения и умножения следует и обобщение для произвольных вещественных [math]\displaystyle{ y_i }[/math]. Это утверждение в точности соответствует неравенству Коши-Буняковского для последовательностей

[math]\displaystyle{ {x'}_i := x_i \sqrt{y_i} }[/math]
[math]\displaystyle{ {y'}_i := \sqrt{y_i} }[/math].

Поэтому неравенство для произвольных [math]\displaystyle{ ({x'}_i)_{i=1}^{n} }[/math], [math]\displaystyle{ ({y'}_i)_{i=1}^{n} }[/math] следует из возможности обратной замены

[math]\displaystyle{ x_i := \frac{{x'}_i}{{y'}_i} }[/math]
[math]\displaystyle{ y_i := {y'}_i^2 }[/math].

Вероятностный (через суммирование квадратов)

Идея (на примере дисперсии)

Самая известная реализация этого метода – рассмотрение дисперсии случайной величины. Очевидно, что если величина принимает неотрицательные значения, то её математическое ожидание также будет неотрицательно, поэтому

[math]\displaystyle{ \mathbb{E} \left[{ ({ X - \mathbb{E}[X] })^2 }\right] \ge 0 }[/math]

для любой случайной величины [math]\displaystyle{ X }[/math]. Благодаря линейности математического ожидания из этого следует, что

[math]\displaystyle{ 0 \le \mathbb{E} \left[{ ( X - \mathbb{E}[X] )^2 }\right] = \mathbb{E} \left[{ X^2 - 2 X \mathbb{E}[X] + \mathbb{E}[X]^2 }\right] = \mathbb{E}[X^2] - 2 \mathbb{E}[X] \mathbb{E}[X] + \mathbb{E}[X]^2 = \mathbb{E}[X^2] - \mathbb{E}[X]^2 }[/math]

Пусть все [math]\displaystyle{ y_i \gt 0 }[/math] и [math]\displaystyle{ B := \sum \limits_{i=1}^{n} {y_i} }[/math]. Для случайной величины [math]\displaystyle{ X }[/math], которая принимает значение [math]\displaystyle{ x_i }[/math] с вероятностью [math]\displaystyle{ \frac{y_i}{B} }[/math], это неравенство означает, что

[math]\displaystyle{ \left({ \sum \limits_{i=1}^{n} {x_i \frac{y_i}{B}} }\right)^2 = \mathbb{E}[X]^2 \le \mathbb{E}[X^2] = \sum \limits_{i=1}^{n} {x_i^2 \frac{y_i}{B}} \ , }[/math]

то есть

[math]\displaystyle{ \left({ \sum \limits_{i=1}^{n} {x_i y_i} }\right) \le B \sum \limits_{i=1}^{n} {x_i^2 y_i} = \left( {\sum \limits_{i=1}^{n} {y_i}} \right) \left({ \sum \limits_{i=1}^{n} {x_i^2 y_i} }\right) \ . }[/math]

Отсюда неравенство Коши-Буняковского можно получить той же заменой переменных, что и в случае с применением перестановочного неравенства.

Интерпретация и альтернативные формы

После замены переменных математическое ожидание описанной выше величины будет иметь вид

[math]\displaystyle{ \mathbb E[X] = \sum \limits_{i=1}^{n} {\frac{x_i}{y_i} \cdot \frac{y_i^2}{\sum \limits_{j=1}^{n} {y_j^2}}}\ . }[/math]

Поэтому вероятностное доказательство, в сущности рассматривает сумму

[math]\displaystyle{ \sum \limits_{i=1}^{n} { \left({ \frac{x_i}{y_i} - \sum \limits_{j=1}^{n} { \left({ \frac{x_j}{y_j} \cdot \frac{y_j^2}{\sum \limits_{k=1}^{n} {y_k^2}} }\right) } }\right)^2 \frac{y_i^2}{\sum \limits_{j=1}^{n} {y_j^2}} } \ . }[/math]

Из очевидной (ввиду возведения скобки в квадрат) неотрицательности этой суммы выводится соотношение между слагаемыми, получающимися при раскрытии скобки – двое из трёх таких слагаемых сокращаются в одно (различаются лишь на константу) за счёт структуры формулы. Изменяя нормировку (деление на суммы) с помощью внесения множителей под скобки и домножения константы, легко увидеть, что такой подход аналогичен использованию более наглядной суммы

[math]\displaystyle{ \sum \limits_{i=1}^{n} {{\left({ \frac{x_i}{ \sum \limits_{j=1}^{n} {x_j y_j} } - \frac{y_i}{ \sum \limits_{j=1}^{n} {y_j^2} } }\right)}^2} \ . }[/math]

Неравенства с такими суммами, записанные без привязки к вероятностным определениям, остаются корректным и без условия [math]\displaystyle{ y_i \gt 0 }[/math] из предыдущего раздела. В частности, для произвольного гильбертова пространства при [math]\displaystyle{ \langle{x, y}\rangle \in \mathbb{R} }[/math] можно рассмотреть неравенство

[math]\displaystyle{ 0 \le \left\vert\left\vert{ y - \frac{\langle{x,y}\rangle}{||x||^2} x }\right\vert\right\vert^2 \le \left\langle{ y - \frac{\langle{x,y}\rangle}{\langle{x,x}\rangle} x , y - \frac{\langle{x,y}\rangle}{\langle{x,x}\rangle} x }\right\rangle = \langle{y, y}\rangle - 2 \frac{\langle{x,y}\rangle}{\langle{x,x}\rangle} \langle{x, y}\rangle + \frac{\langle{x,y}\rangle^2}{\langle{x,x}\rangle^2} \langle{x, x}\rangle = \langle{y, y}\rangle - \frac{\langle{x,y}\rangle^2}{\langle{x,x}\rangle} \ , }[/math]

а при [math]\displaystyle{ \langle{x, y}\rangle \in \mathbb{C} \setminus \mathbb{R} }[/math] достаточно домножить [math]\displaystyle{ x }[/math] на комплексное число вида [math]\displaystyle{ e^{\varphi i}, \varphi \in \mathbb{R} }[/math] чтобы свести всё к первому случаю.

Аналогичным способом можно использовать другую, симметричную, сумму, где после раскрытия скобки сокращаются два крайних слагаемых (полученные возведением в квадрат), а не крайнее с центральным:

[math]\displaystyle{ \sum \limits_{i=1}^{n} {{\left({ \frac{x_i}{ \sqrt{ \sum \limits_{j=1}^{n} {x_j^2} } } - \frac{y_i}{ \sqrt{ \sum \limits_{j=1}^{n} {y_j^2} } } }\right)}^2} \ . }[/math]

или, что то же самое,

[math]\displaystyle{ \left\vert\left\vert{ \frac{x}{||x||} - \frac{y}{||y||} }\right\vert\right\vert^2 \ . }[/math]

Кроме вероятностной интерпретации, использование таких сумм может быть описано через оценку дискриминанта квадратного уравнения или неравенство между средним геометрическим и средним арифметическим.[4]

Прямой (через группировку множителей)

Ещё одна (впрочем, нуждающаяся в инструментарии двух предыдущих) идея состоит в представлении неравенства в виде

[math]\displaystyle{ \left({ \sum \limits_{i=1}^{n} {x_i y_i} }\right) \left({ \sum \limits_{j=1}^{n} {x_j y_j} }\right) = \sum \limits_{i=1}^{n} \sum \limits_{j=1}^{n} {(x_i y_j) (x_j y_i)} \le \sum \limits_{i=1}^{n} \sum \limits_{j=1}^{n} {(x_i y_j)^2} = \left({ \sum \limits_{i=1}^{n} {x_i^2} }\right) \left({ \sum \limits_{j=1}^{n} {y_j^2} }\right) \ . }[/math]

Такую форму можно доказать двумя способами:

  • сравнивав все слагаемые за один шаг, применив перестановочное неравенство для двух копий набора [math]\displaystyle{ (x_i y_j)_{(i,j) \in [1;n]^2} }[/math] и перестановки [math]\displaystyle{ \sigma(i,j) := (j,i) }[/math][5];

Применение случая n=2 к суммам

Неравенство можно получить с помощью индукции, шагом которой для перехода от [math]\displaystyle{ n }[/math] к [math]\displaystyle{ (n+1) }[/math]-ому слагаемому будет применение того же неравенства для двух слагаемых. Предположение индукции для последовательностей [math]\displaystyle{ (x_i)_{i=1}^{n} }[/math], [math]\displaystyle{ (y_i)_{i=1}^{n} }[/math] даёт неравенство

[math]\displaystyle{ \left({ \sum \limits_{i=1}^{n} {\color{red}{x_i} \color{blue}{y_i}} }\right) + x_{n+1} y_{n+1} \le \left({ \sum \limits_{i=1}^{n} {\color{red}{x_i}^2} }\right)^{\frac{1}{2}} \left({ \sum \limits_{i=1}^{n} {\color{blue}{y_i}^2} }\right)^{\frac{1}{2}} + x_{n+1} y_{n+1} }[/math]

А из случая [math]\displaystyle{ n=2 }[/math] для последовательностей [math]\displaystyle{ \left({ \left({ \sum \limits_{i=1}^{n} {{x_i}^2} }\right)^{\frac{1}{2}} , x_{n+1} }\right) }[/math], [math]\displaystyle{ \left({ \left({ \sum \limits_{i=1}^{n} {{y_i}^2} }\right)^{\frac{1}{2}}, y_{n+1} }\right) }[/math] легко видеть, что

[math]\displaystyle{ {\color{red}{ \left({ \sum \limits_{i=1}^{n} {{x_i}^2} }\right)^{\frac{1}{2}} }} {\color{blue}{ \left({ \sum \limits_{i=1}^{n} {{y_i}^2} }\right)^{\frac{1}{2}} }} + {\color{red}{x_{n+1}} \color{blue}{y_{n+1}}} \le \left({ {\color{red}{ \left({ \sum \limits_{i=1}^{n} {{x_i}^2} }\right)^{\frac{1}{2} \color{black}{\cdot 2}} }} + {\color{red}{x_{n+1}}^2} }\right) \left({ {\color{blue}{ \left({ \sum \limits_{i=1}^{n} {{y_i}^2} }\right)^{\frac{1}{2} \color{black}{\cdot 2}} }} + {\color{blue}{y_{n+1}}^2} }\right) = \left({ \sum \limits_{i=1}^{n+1} {x_i^2} }\right) \left({ \sum \limits_{i=1}^{n+1} {y_i^2} }\right) }[/math]

Таким образом неравенство доказывается для произвольного [math]\displaystyle{ n }[/math] индукцией с базой [math]\displaystyle{ n=2 }[/math]. Базу можно доказать любым из остальных способов (например, через неравенство [math]\displaystyle{ (x_1 y_2 - x_2 y_1)^2 \ge 0 }[/math]).[7] Также для [math]\displaystyle{ n=2 }[/math] существуют наглядные геометрические доказательства.[8][9]

Литература

Примечания

  1. См. доказательство 11 в Wu, 2009
  2. Bounjakowsky W. «Mémoires de l’Académie des sciences de St-Pétersbourg. 7 série», 1859, t. 1, № 9.
  3. Wu, 2009.
  4. См. доказательства 2 (при [math]\displaystyle{ x=\frac{\sum \limits_{i=1}^{n} {a_i b_i}}{\sum \limits_{i=1}^{n} {a_i^2}} }[/math]), 5 в Wu, 2009 для первой суммы и доказательства 3, 4, 8 там же для второй.
  5. См. доказательство 7 в Wu, 2009.
  6. См. доказательства 1, 6 (для случая [math]\displaystyle{ n=2 }[/math]) и 12 (после раскрытия индукции, то есть суммирования различных [math]\displaystyle{ S_{n+1} - S_n }[/math]) в Wu, 2009.
  7. См. доказательство 6 в Wu, 2009.
  8. Обзор доказательств неравенства Коши-Буняковского Архивная копия от 25 августа 2021 на Wayback Machine, (см. геометрические доказательства для [math]\displaystyle{ n=2 }[/math] на с. 15-18)
  9. Интерактивная демонстрация геометрического доказательства. Дата обращения: 25 августа 2021. Архивировано 25 августа 2021 года.