Экспонента матрицы
Экспонента матрицы — матричная функция от квадратной матрицы, аналогичная обычной экспоненциальной функции. Матричная экспонента устанавливает связь между алгеброй Ли матриц и соответствующий группой Ли.
Для вещественной или комплексной матрицы [math]\displaystyle{ X }[/math] размера [math]\displaystyle{ n \times n }[/math] экспонента от [math]\displaystyle{ X }[/math], обозначаемая как [math]\displaystyle{ e^X }[/math] или [math]\displaystyle{ \exp(X) }[/math], — это матрица [math]\displaystyle{ n \times n }[/math], определяемая степенным рядом:
- [math]\displaystyle{ e^X = \sum_{k=0}^\infty{1 \over k!}X^k }[/math],
где [math]\displaystyle{ X^k }[/math] — k-я степень матрицы [math]\displaystyle{ X }[/math]. Данный ряд всегда сходится, так что экспонента от [math]\displaystyle{ X }[/math] всегда корректно определена.
Если [math]\displaystyle{ X }[/math] — матрица размера [math]\displaystyle{ 1 \times 1 }[/math], то матричная экспонента от [math]\displaystyle{ X }[/math] есть матрица размерности [math]\displaystyle{ 1 \times 1 }[/math], единственный элемент которой равен обычной экспоненте от единственного элемента [math]\displaystyle{ X }[/math].
Свойства
Основные свойства
Для комплексных матриц [math]\displaystyle{ X }[/math] и [math]\displaystyle{ Y }[/math] размера [math]\displaystyle{ n \times n }[/math], произвольных комплексных чисел [math]\displaystyle{ a }[/math] и [math]\displaystyle{ b }[/math], единичной матрицы [math]\displaystyle{ E }[/math] и нулевой матрицы [math]\displaystyle{ 0 }[/math], экспонента обладает следующим свойствами:
- [math]\displaystyle{ \exp 0 = E }[/math];
- [math]\displaystyle{ \exp aX \exp bX = \exp \left((a + b)X \right) }[/math];
- [math]\displaystyle{ \exp X \exp \left( -X \right) = E }[/math];
- если [math]\displaystyle{ XY = YX }[/math], то [math]\displaystyle{ \exp X \exp Y = \exp Y \exp X = \exp (X + Y) }[/math];
- если [math]\displaystyle{ Y }[/math] — невырожденная матрица, то [math]\displaystyle{ \exp (YXY^{-1}) = Y \exp(X) Y^{-1} }[/math].
- [math]\displaystyle{ \exp X^\mathrm T = (\exp X)^\mathrm T }[/math], где [math]\displaystyle{ X^\mathrm T }[/math] обозначает транспонированную матрицу для [math]\displaystyle{ X }[/math], отсюда следует, что если [math]\displaystyle{ X }[/math] является симметричной, то [math]\displaystyle{ \exp X }[/math] тоже симметрична, а если [math]\displaystyle{ X }[/math] — кососимметричная матрица, то [math]\displaystyle{ \exp X }[/math] — ортогональная;
- [math]\displaystyle{ \exp(X^*) = (\exp X)^* }[/math], где [math]\displaystyle{ X^* }[/math] обозначает эрмитово-сопряжённую матрицу для [math]\displaystyle{ X }[/math], отсюда следует, что если [math]\displaystyle{ X }[/math] — эрмитова матрица, то [math]\displaystyle{ \exp X }[/math] тоже эрмитова, а если [math]\displaystyle{ X }[/math] — антиэрмитова матрица, то [math]\displaystyle{ \exp X }[/math] — унитарная.
Системы линейных дифференциальных уравнений
Одна из причин, обуславливающих важность матричной экспоненты, заключается в том, что она может быть использована для решения систем обыкновенных дифференциальных уравнений[1]. Решение системы:
- [math]\displaystyle{ \frac{d}{dt} y(t) = Ay(t), \quad y(0) = y_0 }[/math],
где [math]\displaystyle{ A }[/math] — постоянная матрица, даётся выражением:
- [math]\displaystyle{ y(t) = e^{At} y_0. }[/math]
Матричная экспонента может быть также использована для решения неоднородных уравнений вида
- [math]\displaystyle{ \frac{d}{dt} y(t) = Ay(t) + z(t), \quad y(0) = y_0 }[/math].
Не существует замкнутого аналитического выражения для решений неавтономных дифференциальных уравнений вида
- [math]\displaystyle{ \frac{d}{dt} y(t) = A(t) \, y(t), \quad y(0) = y_0 }[/math],
где [math]\displaystyle{ A }[/math] — не постоянная, но разложение Магнуса[англ.] позволяет получить представление решения в виде бесконечной суммы.
Экспонента суммы
Для любых двух вещественных чисел (скаляров) [math]\displaystyle{ x }[/math] и [math]\displaystyle{ y }[/math] экспоненциальная функция удовлетворяет уравнению [math]\displaystyle{ e^{x+y} = e^x \cdot e^y }[/math], это же свойство имеет место для симметричных матриц — если матрицы [math]\displaystyle{ X }[/math] и [math]\displaystyle{ Y }[/math] коммутируют (то есть [math]\displaystyle{ XY = YX }[/math]), то [math]\displaystyle{ \exp (X+Y) = \exp(X) \exp(Y) }[/math]. Однако для некоммутирующих матриц это равенство выполняется не всегда, в общем случае для вычисления [math]\displaystyle{ \exp (X+Y) }[/math] используется формула Бейкера — Кэмпбелла — Хаусдорфа.
В общем случае из равенства [math]\displaystyle{ \exp (X+Y) = \exp(X) \exp(Y) }[/math] не следует, что [math]\displaystyle{ X }[/math] и [math]\displaystyle{ Y }[/math] коммутируют.
Для эрмитовых матриц существует две примечательные теоремы, связанные со следом экспонент матриц.
Неравенство Голдена — Томпсона
Если [math]\displaystyle{ A }[/math] и [math]\displaystyle{ H }[/math] — эрмитовы матрицы, то[2]:
- [math]\displaystyle{ \operatorname{tr}\exp(A+H) \leqslant \operatorname{tr}(\exp(A)\exp(H)) }[/math],
где [math]\displaystyle{ \operatorname{tr} X }[/math] — след матрицы [math]\displaystyle{ X }[/math]. Коммутативность для выполнения данного утверждения не требуется. Существуют контрпримеры, которые показывают, что неравенство Голдена — Томпсона не может быть расширено на три матрицы, а [math]\displaystyle{ \operatorname{tr}(\exp(A) \exp(B) \exp(C)) }[/math] не всегда является вещественным числом для эрмитовых матриц [math]\displaystyle{ A }[/math], [math]\displaystyle{ B }[/math] и [math]\displaystyle{ C }[/math].
Теорема Либа
Теорема Либа, названная по имени Эллиотта Либа[англ.], гласит, что для фиксированной эрмитовой матрицы [math]\displaystyle{ H }[/math], функция:
- [math]\displaystyle{ f(A) = \operatorname{tr} \,\exp \left (H + \log A \right) }[/math]
является вогнутой на конусе положительно-определённых матриц[3].
Экспоненциальное отображение
Экспонента матрицы всегда является невырожденной матрицей. Обратная к [math]\displaystyle{ \exp X }[/math] матрица равна [math]\displaystyle{ \exp (-X) }[/math], это аналог того факта, что экспонента от комплексного числа никогда не равна нулю. Таким образом, матричная экспонента определяет отображение:
- [math]\displaystyle{ \exp \colon M_n(\mathbb C) \to \mathrm{GL}(n, \Complex) }[/math]
из пространства всех матриц размерности [math]\displaystyle{ n \times n }[/math] на полную линейную группу порядка [math]\displaystyle{ n }[/math], то есть группу всех невырожденных матриц размерности [math]\displaystyle{ n \times n }[/math]. Это отображение является сюръекцией, то есть каждая невырожденная матрица может быть записана как экспонента от некоторой другой матрицы (чтобы это имело место необходимо рассматривать поле комплексных чисел [math]\displaystyle{ \Complex }[/math], а не вещественных чисел [math]\displaystyle{ \R }[/math]).
Для любых двух матриц [math]\displaystyle{ X }[/math] и [math]\displaystyle{ Y }[/math] имеет место неравенство
- [math]\displaystyle{ \| e^{X+Y} - e^X \| \leqslant \|Y\| e^{\|X\|} e^{\|Y\|} }[/math],
где [math]\displaystyle{ \| \cdot \| }[/math] обозначает произвольную матричную норму. Отсюда следует, что экспоненциальное отображение является непрерывным и липшицевым на компактных подмножествах [math]\displaystyle{ M_n (\Complex) }[/math].
Отображение:
- [math]\displaystyle{ t \mapsto e^{tX}, \qquad t \in \mathbb R }[/math]
определяет гладкую кривую в полной линейной группе, которая проходит через единичный элемент при [math]\displaystyle{ t = 0 }[/math].
Приложения
Линейные дифференциальные уравнения
Пример однородной системы
Для системы:
- [math]\displaystyle{ \begin{matrix} x' &=& 2x&-y&+z \\ y' &=& &3y&-1z \\ z' &=& 2x&+y&+3z ~.\end{matrix} }[/math]
её матрица есть:
- [math]\displaystyle{ A=\begin{bmatrix} 2 & -1 & 1 \\ 0 & 3 & -1 \\ 2 & 1 & 3 \end{bmatrix} ~. }[/math]
Можно показать, что экспонента от матрицы [math]\displaystyle{ tA }[/math] есть
- [math]\displaystyle{ e^{tA}=\frac{1}{2}\begin{bmatrix} e^{2t}(1+e^{2t}-2t) & -2te^{2t} & e^{2t}(-1+e^{2t}) \\ -e^{2t}(-1+e^{2t}-2t) & 2(t+1)e^{2t} & -e^{2t}(-1+e^{2t}) \\ e^{2t}(-1+e^{2t}+2t) & 2te^{2t} & e^{2t}(1+e^{2t}) \end{bmatrix}~, }[/math]
таким образом, общее решение этой системы есть:
- [math]\displaystyle{ \begin{bmatrix}x \\y \\ z\end{bmatrix}= \frac{x(0)}{2}\begin{bmatrix}e^{2t}(1+e^{2t}-2t) \\-e^{2t}(-1+e^{2t}-2t)\\e^{2t}(-1+e^{2t}+2t)\end{bmatrix} +\frac{y(0)}{2}\begin{bmatrix}-2te^{2t}\\2(t+1)e^{2t}\\2te^{2t}\end{bmatrix} +\frac{z(0)}{2}\begin{bmatrix}e^{2t}(-1+e^{2t})\\-e^{2t}(-1+e^{2t})\\e^{2t}(1+e^{2t})\end{bmatrix} ~. }[/math]
Пример неоднородной системы
Для решения неоднородной системы:
- [math]\displaystyle{ \begin{matrix} x' &=& 2x & - & y & + & z & + & e^{2t} \\ y' &=& & & 3y& - & z & \\ z' &=& 2x & + & y & + & 3z & + & e^{2t} \end{matrix} }[/math]
вводятся обозначения:
- [math]\displaystyle{ A= \left[ \begin{array}{rrr} 2 & -1 & 1 \\ 0 & 3 & -1 \\ 2 & 1 & 3 \end{array} \right] ~, }[/math]
и
- [math]\displaystyle{ \mathbf{b}=e^{2t}\begin{bmatrix}1 \\0\\1\end{bmatrix} }[/math]
Так как сумма общего решения однородного уравнения и частного решения дают общее решение неоднородного уравнения, остаётся лишь найти частное решение. Так как:
- [math]\displaystyle{ \mathbf{y}_p = e^{tA}\int_0^t e^{(-u)A}\begin{bmatrix}e^{2u} \\0\\e^{2u}\end{bmatrix}\,du+e^{tA}\mathbf{c} }[/math]
- [math]\displaystyle{ \mathbf{y}_p = e^{tA}\int_0^t \begin{bmatrix} 2e^u - 2ue^{2u} & -2ue^{2u} & 0 \\ \\ -2e^u + 2(u+1)e^{2u} & 2(u+1)e^{2u} & 0 \\ \\ 2ue^{2u} & 2ue^{2u} & 2e^u\end{bmatrix}\begin{bmatrix}e^{2u} \\0\\e^{2u}\end{bmatrix}\,du+e^{tA}\mathbf{c} }[/math]
- [math]\displaystyle{ \mathbf{y}_p = e^{tA}\int_0^t \begin{bmatrix} e^{2u}( 2e^u - 2ue^{2u}) \\ \\ e^{2u}(-2e^u + 2(1 + u)e^{2u}) \\ \\ 2e^{3u} + 2ue^{4u}\end{bmatrix}\,du+e^{tA}\mathbf{c} }[/math]
- [math]\displaystyle{ \mathbf{y}_p = e^{tA}\begin{bmatrix} -{1 \over 24}e^{3t}(3e^t(4t-1)-16) \\ \\ {1 \over 24}e^{3t}(3e^t(4t+4)-16) \\ \\ {1 \over 24}e^{3t}(3e^t(4t-1)-16)\end{bmatrix}+ \begin{bmatrix} 2e^t - 2te^{2t} & -2te^{2t} & 0 \\ \\ -2e^t + 2(t+1)e^{2t} & 2(t+1)e^{2t} & 0 \\ \\ 2te^{2t} & 2te^{2t} & 2e^t\end{bmatrix}\begin{bmatrix}c_1 \\c_2 \\c_3\end{bmatrix} ~, }[/math]
где [math]\displaystyle{ \mathbf c = \mathbf y_p(0) }[/math] — начальное условие.
Обобщение: вариация произвольной постоянной
В случае неоднородной системы можно использовать метод вариации произвольной постоянной. Ищется частное решение в виде: [math]\displaystyle{ \mathbf y_p(t) = \exp(tA) \mathbf z(t) }[/math]:
- [math]\displaystyle{ \begin{align} \mathbf{y}_p'(t) & = (e^{tA})'\mathbf{z}(t)+e^{tA}\mathbf{z}'(t) \\[6pt] & = Ae^{tA}\mathbf{z}(t)+e^{tA}\mathbf{z}'(t) \\[6pt] & = A\mathbf{y}_p(t)+e^{tA}\mathbf{z}'(t)~. \end{align} }[/math]
Чтобы [math]\displaystyle{ \mathbf y_p }[/math] было решением, должно иметь место следующее:
- [math]\displaystyle{ \begin{align} e^{tA}\mathbf{z}'(t) & = \mathbf{b}(t) \\[6pt] \mathbf{z}'(t) & = (e^{tA})^{-1}\mathbf{b}(t) \\[6pt] \mathbf{z}(t) & = \int_0^t e^{-uA}\mathbf{b}(u)\,du+\mathbf{c} ~. \end{align} }[/math]
Таким образом:
- [math]\displaystyle{ \begin{align} \mathbf{y}_p(t) & {} = e^{tA}\int_0^t e^{-uA}\mathbf{b}(u)\,du+e^{tA}\mathbf{c} \\ & {} = \int_0^t e^{(t-u)A}\mathbf{b}(u)\,du+e^{tA}\mathbf{c} \end{align} ~, }[/math]
где [math]\displaystyle{ \mathbf{c} }[/math] определяется из начальных условий задачи.
См. также
Примечания
- ↑ Пискунов H. С. Дифференциальное и интегральное исчисления для втузов, т. 2.: Учебное пособие для втузов. — 13-е изд.. — М.: Наука, Главная редакция физико-математической литературы, 1985. — С. 544—547. — 560 с.
- ↑ Bhatia, R. Matrix Analysis (неопр.). — Springer, 1997. — Т. 169. — (Graduate Texts in Mathematics). — ISBN 978-0-387-94846-1.
- ↑ E. H. Lieb. Convex trace functions and the Wigner–Yanase–Dyson conjecture (англ.) // Adv. Math. : journal. — 1973. — Vol. 11, no. 3. — P. 267—288. — doi:10.1016/0001-8708(73)90011-X.
Ссылки
- Weisstein, Eric W., «Matrix Exponential», MathWorld
- Module for the Matrix Exponential
Для улучшения этой статьи желательно: |