Отношение Рэлея

В математике для данной комплексной эрмитовой матрицы [math]\displaystyle{ M }[/math] и ненулевого вектора [math]\displaystyle{ x }[/math] отношение Рэлея^[1] [math]\displaystyle{ R(M, x) }[/math] определяется следующим образом^[2]^[3]:

[math]\displaystyle{ R(M,x) = {x^{*} M x \over x^{*} x}. }[/math]

Для действительных матриц условие эрмитовости матрицы сводится к её симметричности, а эрмитово сопряжение векторов [math]\displaystyle{ x^{*} }[/math] превращается в обычное транспонирование [math]\displaystyle{ x' }[/math]. Заметьте, что [math]\displaystyle{ R(M, c x) = R(M,x) }[/math] для любой вещественной константы [math]\displaystyle{ c \neq 0 }[/math]. Напомним, что эрмитова (как и симметричная вещественная) матрица имеет вещественные собственные значения. Можно показать, что для матрицы отношение Рэлея достигает минимального значения [math]\displaystyle{ \lambda_\min }[/math] (наименьшее собственное число матрицы [math]\displaystyle{ M }[/math]) когда [math]\displaystyle{ x }[/math] равен [math]\displaystyle{ v_\min }[/math] (соответствующий собственный вектор). Подобным образом можно показать, что [math]\displaystyle{ R(M, x) \leq \lambda_\max }[/math] и [math]\displaystyle{ R(M, v_\max) = \lambda_\max }[/math]. Отношение Рэлея используется в теореме Куранта-Фишера о минимаксе для получения всех значений собственных чисел^[4]. Используется оно и в алгоритмах нахождения собственных значений матрицы для получения приближения собственного значения из приближения собственного вектора. А именно, отношение является базой для итераций с отношением Рэлея^[en]^[5]^[6].

Множество значений отношения Рэлея называется числовым образом матрицы^[en]^[7]^[8].

Специальный случай ковариационных матриц

Ковариационная матрица M для многомерной статистической выборки A (матрицы наблюдений) может быть представлена в виде произведения A' A^[9]^[10]. Будучи симметричной вещественной матрицей, M имеет неотрицательные собственные значения и ортогональные (или приводимые к ортогональным) собственные вектора.

Во-первых то, что собственные значения [math]\displaystyle{ \lambda_i }[/math] не отрицательны:

[math]\displaystyle{ M v_i = A' A v_i = \lambda_i v_i }[/math]

[math]\displaystyle{ \Rightarrow v_i' A' A v_i = v_i' \lambda_i v_i }[/math]

[math]\displaystyle{ \Rightarrow \left\| A v_i \right\|^2 = \lambda_i \left\| v_i \right\|^2 }[/math]

[math]\displaystyle{ \Rightarrow \lambda_i = \frac{\left\| A v_i \right\|^2}{\left\| v_i \right\|^2} \geq 0. }[/math]

И, во-вторых, что собственные вектора [math]\displaystyle{ v_i }[/math] ортогональны друг другу:

[math]\displaystyle{ M v_i = \lambda _i v_i }[/math]

[math]\displaystyle{ \Rightarrow v_j' M v_i = \lambda _i v_j' v_i }[/math]

[math]\displaystyle{ \Rightarrow (M v_j )' v_i = \lambda _i v_j' v_i }[/math]

[math]\displaystyle{ \Rightarrow \lambda_j v_j ' v_i = \lambda _i v_j' v_i }[/math]

[math]\displaystyle{ \Rightarrow (\lambda_j - \lambda_i) v_j ' v_i = 0 }[/math]

[math]\displaystyle{ \Rightarrow v_j ' v_i = 0 }[/math] (если собственные значения различны — в случае одинаковых значений можно найти ортогональный базис).

Теперь покажем, что отношение Рэлея принимает максимальное значение на векторе, соответствующем наибольшее собственное значение. Разложим произвольный вектор [math]\displaystyle{ x }[/math] по базису собственных векторов v_i:

[math]\displaystyle{ x = \sum _{i=1} ^n \alpha _i v_i }[/math], где [math]\displaystyle{ \alpha_i = \frac{x'v_i}{v_i'v_i} = \frac{\langle x,v_i\rangle}{\left\| v_i \right\| ^2} }[/math] является проекцией x на [math]\displaystyle{ v_i }[/math]

Таким образом, равенство

[math]\displaystyle{ R(M,x) = \frac{x' A' A x}{x' x} }[/math]

можно переписать в следующем виде:

[math]\displaystyle{ R(M,x) = \frac{(\sum _{j=1} ^n \alpha _j v_j)' A' A (\sum _{i=1} ^n \alpha _i v_i)}{(\sum _{j=1} ^n \alpha _j v_j)' (\sum _{i=1} ^n \alpha _i v_i)} }[/math]

Поскольку собственные вектора ортогональны, последнее равенство превращается в

[math]\displaystyle{ R(M,x) = \frac{\sum _{i=1} ^n \alpha _i ^2 \lambda _i}{\sum _{i=1} ^n \alpha _i ^2} = \sum_{i=1}^n \lambda_i \frac{(x'v_i)^2}{ (x'x)( v_i' v_i)} }[/math]

Последнее равенство показывает, что отношение Рэлея является суммой квадратов косинусов углов между вектором [math]\displaystyle{ x }[/math] и каждым из собственных векторов [math]\displaystyle{ v_i }[/math], умноженных на соответствующее собственное значение.

Если вектор [math]\displaystyle{ x }[/math] максимизирует [math]\displaystyle{ R(M,x) }[/math], то все вектора, полученные из [math]\displaystyle{ x }[/math] умножением на скаляр ([math]\displaystyle{ k x }[/math] для [math]\displaystyle{ k \ne 0 }[/math]) также максимизируют R. Таким образом, задачу можно свести к нахождению максимума [math]\displaystyle{ \sum _{i=1} ^n \alpha _i ^2 \lambda _i }[/math] при условии [math]\displaystyle{ \sum _{i=1} ^n \alpha _i ^2 = 1 }[/math].

Поскольку все собственные числа не отрицательны, задача сводится к нахождению максимума выпуклой функции и можно показать, что он достигается при [math]\displaystyle{ \alpha _1 = 1 }[/math] и [math]\displaystyle{ \forall i \gt 1, \alpha _i = 0 }[/math] (собственные значения упорядочены по убыванию).

Таким образом, отношение Рэлея достигает максимума на собственном векторе, соответствующему максимальному собственному значению.

Тот же результат с использованием множителей Лагранжа

Тот же результат может быть получен с помощью множителей Лагранжа. Задача состоит в нахождении критических точек функции

[math]\displaystyle{ R(M,x) = x^T M x }[/math],

при постоянной величине [math]\displaystyle{ \|x\|^2 = x^Tx = 1. }[/math] То есть, нужно найти критические точки функции

[math]\displaystyle{ \mathcal{L}(x) = x^T M x -\lambda (x^Tx - 1), }[/math]

где [math]\displaystyle{ \lambda }[/math] — множитель Лагранжа. Для стационарных точек функции [math]\displaystyle{ \mathcal{L}(x) }[/math] выполняется равенство

[math]\displaystyle{ \frac{d\mathcal{L}(x)}{dx} = 0 }[/math]

[math]\displaystyle{ \therefore 2x^T M^T - 2\lambda x^T = 0 }[/math]

[math]\displaystyle{ \therefore M x = \lambda x }[/math]

и [math]\displaystyle{ R(M,x) = \frac{x^T M x}{x^T x} = \lambda \frac{x^Tx}{x^T x} = \lambda. }[/math]

Таким образом, собственные вектора [math]\displaystyle{ x_1 \ldots x_n }[/math] матрицы M являются критическими точками отношения Рэлея и их собственные значения [math]\displaystyle{ \lambda_1 \ldots \lambda_n }[/math] — соответствующими стационарными значениями.

Это свойство является базисом метода главных компонент и канонической корреляции.

Использование в теории Штурма — Лиувилля

Теория Штурма — Лиувилля заключается в исследовании линейного оператора

[math]\displaystyle{ L(y) = \frac{1}{w(x)}\left(-\frac{d}{dx}\left[p(x)\frac{dy}{dx}\right] + q(x)y\right) }[/math]

со скалярным произведением

[math]\displaystyle{ \langle{y_1,y_2}\rangle = \int_a^b w(x)y_1(x)y_2(x) \, dx }[/math],

где функции удовлетворяют некоторым специфичным граничным условиям в точках a и b. Отношение Рэлея здесь принимает вид

[math]\displaystyle{ \frac{\langle{y,Ly}\rangle}{\langle{y,y}\rangle} = \frac{\int_a^b{y(x)\left(-\frac{d}{dx}\left[p(x)\frac{dy}{dx}\right] + q(x)y(x)\right)}dx}{\int_a^b{w(x)y(x)^2}dx}. }[/math]

Иногда это отношение представляют в эквивалентном виде используя интегрирование по частям^[11]:

[math]\displaystyle{ \frac{\langle{y,Ly}\rangle}{\langle{y,y}\rangle} = \frac{\int_a^b{y(x)\left(-\frac{d}{dx}\left[p(x)y'(x)\right]\right)}dx + \int_a^b{q(x)y(x)^2} \, dx}{\int_a^b{w(x)y(x)^2} \, dx} }[/math]

[math]\displaystyle{ = \frac{-y(x)\left[p(x)y'(x)\right]|_a^b + \int_a^b{y'(x)\left[p(x)y'(x)\right]} \, dx + \int_a^b{q(x)y(x)^2} \, dx}{\int_a^b{w(x)y(x)^2} \, dx} }[/math]

[math]\displaystyle{ = \frac{-p(x)y(x)y'(x)|_a^b + \int_a^b\left[p(x)y'(x)^2 + q(x)y(x)^2\right] \, dx}{\int_a^b{w(x)y(x)^2} \, dx}. }[/math]

Обобщение

Для любой пары [math]\displaystyle{ (A, B) }[/math] вещественных симметричных положительно определённых матриц и ненулевого вектора [math]\displaystyle{ x }[/math], обобщенное отношение Рэлея определяется как

[math]\displaystyle{ R(A,B; x) := \frac{x^T A x}{x^T B x}. }[/math]

Обобщённое отношение Рэлея можно свести к отношению Рэлея [math]\displaystyle{ R(D, Cx) }[/math] путём преобразования [math]\displaystyle{ D = {C^*}^{-1} A C^{-1} }[/math], где [math]\displaystyle{ C }[/math] — разложение Холецкого матрицы [math]\displaystyle{ B }[/math].

См. также

Числовой образ матрицы^[en]

Примечания

↑ также известно под именем отношение Рэлея-Рица, названного в честь Вальтера Рица и Лорда Рэлея.
↑ Horn, R. A. and C. A. Johnson. 1985. Matrix Analysis. Cambridge University Press. pp. 176–180.
↑ Parlet B. N. The symmetric eigenvalue problem, SIAM, Classics in Applied Mathematics,1998
↑ Беккенбах, 1965, §26 Минимакс-теорема Фишера.
↑ Парлетт, 1983, §4.6 Итерации с отношением Релея, p. 87).
↑ Вербицкий, 2000, §4.3 Обратные итерации, p. 115.
↑ Геворгян.
↑ Прасолов, 2008, 2.2 Ядро и образ оператора. Факторпространство., p. 114.
↑ Коршунов, 2008, Введение.
↑ ACTA, 2005.
↑ Haberman, 1987.

Литература

Б. Парлетт. Симметричная проблема собственных значений. Численные методы. — 1983.
Э. Беккенббах, Р. Беллман. Неравенства. — Москва «Мир», 1965.
Richard Haberman. Elementary applied partial differential equations. — Prentice Hall, Englewood, New Jersey, 1987.
В. М. Вержбицкий. Численные методы (Линейная алгебра и нелинейные уравнения). — Москва «Высшая школа», 2000.
В. В. Прасолов. Задачи и теоремы линейной алгебры. — Москва, 2008.
Геворгян Л. З. Некоторые геометрические характеристики числового образа оператора. — Государственный Инженерный Университет Армении. Архивировано 31 августа 2006 года.
Zdzisław Burda, Jerzy Jurkiewicz, Bartłomiej Wacław. Eigenvalue density of empirical covariance matrix for correlated samples // Acta physica polonica B. — 2005. — Т. 36, вып. 9. — С. 2642.
Коршунов Ю. М. Получение многомерной статистической выборки с заданными корреляционными свойствами // Вестник РГРТУ. — 2008. — Вып. 23.
Shi Yu, Léon-Charles Tranchevent, Bart Moor, Yves Moreau. Ch. 2 // Kernel-based Data Fusion for Machine Learning: Methods and Applications in Bioinformatics and Text Mining. — Springer, 2011.

[1] также известно под именем отношение Рэлея-Рица, названного в честь Вальтера Рица и Лорда Рэлея.

[2] Horn, R. A. and C. A. Johnson. 1985. Matrix Analysis. Cambridge University Press. pp. 176–180.

[3] Parlet B. N. The symmetric eigenvalue problem, SIAM, Classics in Applied Mathematics,1998

[_37ff35f7e54fda13-4] Беккенбах, 1965, §26 Минимакс-теорема Фишера.

[_96332f3ecbc7e5f0-5] Парлетт, 1983, §4.6 Итерации с отношением Релея, p. 87).

[_09caa62d9db422de-6] Вербицкий, 2000, §4.3 Обратные итерации, p. 115.

[_84b9e36277e6e040-7] Геворгян.

[_b14acf5e3b43da44-8] Прасолов, 2008, 2.2 Ядро и образ оператора. Факторпространство., p. 114.

[_348f1eb87335588c-9] Коршунов, 2008, Введение.

[_4f1c00d96db8eac1-10] ACTA, 2005.

[_c9c0325bf852f4b4-11] Haberman, 1987.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]