Матрица (математика)

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис

Ма́трица — математический объект, записываемый в виде прямоугольной таблицы элементов кольца или поля (например, целых, действительных или комплексных чисел), который представляет собой совокупность строк и столбцов, на пересечении которых находятся его элементы. Количество строк и столбцов задает размер матрицы. Хотя исторически рассматривались, например, треугольные матрицы[1], в настоящее время говорят исключительно о матрицах прямоугольной формы, так как они являются наиболее удобными и общими.

Матрицы широко применяются в математике для компактной записи систем линейных алгебраических или дифференциальных уравнений. В этом случае количество строк матрицы соответствует числу уравнений, а количество столбцов — количеству неизвестных. В результате решение систем линейных уравнений сводится к операциям над матрицами.

Для матрицы определены следующие алгебраические операции:

  • сложение матриц, имеющих один и тот же размер[⇨];
  • умножение матриц подходящего размера (матрицу, имеющую [math]\displaystyle{ n }[/math] столбцов, можно умножить справа на матрицу, имеющую [math]\displaystyle{ n }[/math] строк)[⇨];
  • в том числе умножение матрицы на вектор-столбец и умножение вектор-строки на матрицу (по обычному правилу матричного умножения; вектор является в этом смысле частным случаем матрицы)[⇨];
  • умножение матрицы на элемент основного кольца или поля (то есть скаляр)[⇨].

Относительно сложения матрицы образуют абелеву группу; если же рассматривать ещё и умножение на скаляр, то матрицы образуют модуль над соответствующим кольцом (векторное пространство над полем). Множество квадратных матриц замкнуто относительно матричного умножения, поэтому квадратные матрицы одного размера образуют ассоциативное кольцо с единицей относительно матричного сложения и матричного умножения.

Доказано, что каждому линейному оператору, действующему в [math]\displaystyle{ n }[/math]-мерном линейном пространстве, можно сопоставить единственную квадратную матрицу порядка [math]\displaystyle{ n }[/math]; и обратно — каждой квадратной матрице порядка [math]\displaystyle{ n }[/math] может быть сопоставлен единственный линейный оператор, действующий в этом пространстве.[2] Свойства матрицы соответствуют свойствам линейного оператора. В частности, собственные числа матрицы — это собственные числа оператора, отвечающие соответствующим собственным векторам.

То же можно сказать о представлении матрицами билинейных (квадратичных) форм.

В математике рассматривается множество различных типов и видов матриц. Таковы, например, единичная, симметричная, кососимметричная, верхнетреугольная (нижнетреугольная) и т. п. матрицы.

Особое значение в теории матриц занимают всевозможные нормальные формы, то есть канонический вид, к которому можно привести матрицу заменой координат. Наиболее важной (в теоретическом значении) и проработанной является теория жордановых нормальных форм. На практике, однако, используются такие нормальные формы, которые обладают дополнительными свойствами, например, устойчивостью.

История

Впервые матрицы упоминались ещё в древнем Китае, называясь тогда «волшебным квадратом». Основным применением матриц было решение линейных уравнений[3]. Также волшебные квадраты были известны чуть позднее у арабских математиков, примерно тогда появился принцип сложения матриц. После развития теории определителей в конце 17-го века Габриэль Крамер начал разрабатывать свою теорию в 18-м столетии и опубликовал «правило Крамера» в 1751 году. Примерно в этом же промежутке времени появился «метод Гаусса». Теория матриц начала своё существование в середине XIX века в работах Уильяма Гамильтона и Артура Кэли. Фундаментальные результаты в теории матриц принадлежат Вейерштрассу, Жордану, Фробениусу. Термин «матрица» ввел Джеймс Сильвестр в 1850 г.[4]

Введение

Матрицы естественным образом возникают при решении систем линейных уравнений, а также при рассмотрении линейных преобразований.

Системы линейных уравнений

Рассмотрим систему линейных уравнений вида:

[math]\displaystyle{ \begin{cases}a_{11}x_1 + a_{12}x_2 + \ldots + a_{1n}x_n = b_1 \\a_{21}x_1 + a_{22}x_2 + \ldots + a_{2n}x_n = b_2 \\ \cdots \cdots \cdots \cdots \cdots \cdots \cdots \cdots \cdots \cdots \\a_{m1}x_1 + a_{m2}x_2 + \ldots + a_{mn}x_n = b_m \end{cases} }[/math].

Эта система состоит из [math]\displaystyle{ m }[/math] линейных уравнений относительно [math]\displaystyle{ n }[/math] неизвестных. Она может быть записана в виде следующего матричного уравнения :

[math]\displaystyle{ Ax = b }[/math],

где

[math]\displaystyle{ A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix} ; \quad x = \begin{pmatrix} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \end{pmatrix} ; \quad b = \begin{pmatrix} b_{1} \\ b_{2} \\ \vdots \\ b_{m} \end{pmatrix} }[/math]

Матрица [math]\displaystyle{ A }[/math] — это матрица коэффициентов системы линейных уравнений, вектор-столбец [math]\displaystyle{ x }[/math] — вектор неизвестных, а вектор-столбец [math]\displaystyle{ b }[/math] — некоторый заданный вектор.

Для того, чтобы система имела решение (хотя бы одно), необходимо и достаточно, чтобы вектор [math]\displaystyle{ b }[/math] был линейной комбинацией столбцов [math]\displaystyle{ A }[/math], и тогда вектор [math]\displaystyle{ x }[/math] — это вектор, содержащий коэффициенты разложения вектора [math]\displaystyle{ b }[/math] по столбцам матрицы [math]\displaystyle{ A }[/math].

На языке матриц условие разрешимости системы линейных уравнений формулируется в виде теоремы Кронекера-Капелли:

ранг матрицы [math]\displaystyle{ A }[/math] равен рангу расширенной матрицы [math]\displaystyle{ [A|b] }[/math],

составленной из столбцов [math]\displaystyle{ A }[/math] и столбца [math]\displaystyle{ b }[/math].

Важный частный случай. Если количество уравнений совпадает с количеством неизвестных ([math]\displaystyle{ m = n }[/math], то есть матрица [math]\displaystyle{ A }[/math] — квадратная), то условие однозначной разрешимости является равносильным условию обратимости матрицы [math]\displaystyle{ A }[/math].

(Замечание. Разрешимость системы ещё не влечёт невырожденности матрицы. Пример: [math]\displaystyle{ 0x=0 }[/math].)

В частности, если матрица [math]\displaystyle{ A }[/math] является обратимой, то решение системы может быть записано (а если вычислена [math]\displaystyle{ A^{-1} }[/math], то и найдено) в виде

[math]\displaystyle{ x = A^{-1}b }[/math].

Это приводит к алгоритму вычисления значений неизвестных по правилу Крамера.

Линейные преобразования

Рассмотрим линейное преобразование [math]\displaystyle{ \mathcal{A}\colon\mathbb{R}^n\to\mathbb{R}^m }[/math], действующее из [math]\displaystyle{ n }[/math]-мерного векторного пространства [math]\displaystyle{ \mathbb{R}^n }[/math] в [math]\displaystyle{ m }[/math]-мерное векторное пространство [math]\displaystyle{ \mathbb{R}^m }[/math], имеющее следующий вид:

[math]\displaystyle{ \left\{\begin{array}{rcl}y_1&=&a_{11}x_1 + a_{12}x_2 + \ldots + a_{1n}x_n\\ y_2&=&a_{21}x_1 + a_{22}x_2 + \ldots + a_{2n}x_n\\ & \cdots & \\ y_m&=&a_{m1}x_1 + a_{m2}x_2 + \ldots + a_{mn}x_n\\ \end{array}\right. }[/math].

В матричной форме это преобразование уравнения вида:

[math]\displaystyle{ y=Ax }[/math].

Матрица [math]\displaystyle{ A }[/math] — это матрица коэффициентов линейного преобразования.

Если рассмотреть действие линейного преобразования [math]\displaystyle{ \mathcal{A} }[/math] на векторы вида

[math]\displaystyle{ e_j=(0,\dots,0,1_j,0,\dots,0)^T,\quad j=\overline{1,n} }[/math],

составляющие базис пространства [math]\displaystyle{ \mathbb{R}^n }[/math], то [math]\displaystyle{ \mathcal{A}\mathbf{e}_j }[/math] — это есть [math]\displaystyle{ j }[/math]-ый столбец матрицы [math]\displaystyle{ A }[/math].

Таким образом, матрица [math]\displaystyle{ A }[/math] полностью описывает линейное преобразование [math]\displaystyle{ \mathcal{A} }[/math], и поэтому называется матрицей линейного преобразования.

Определения

Прямоугольная матрица

Пусть есть два конечных множества:

  • номера строк: [math]\displaystyle{ M=\{1,2,\dots,m\} }[/math];
  • номера столбцов: [math]\displaystyle{ N=\{1,2,\dots,n\} }[/math], где [math]\displaystyle{ m }[/math] и [math]\displaystyle{ n }[/math] — натуральные числа.

Назовём матрицей [math]\displaystyle{ A }[/math] размера [math]\displaystyle{ m\times n }[/math] (читается [math]\displaystyle{ m }[/math] на [math]\displaystyle{ n }[/math]) ([math]\displaystyle{ m }[/math] - строк, [math]\displaystyle{ n }[/math] - столбцов) с элементами из некоторого кольца или поля [math]\displaystyle{ \mathcal{K} }[/math] отображение вида [math]\displaystyle{ A\colon M\times N\to\mathcal{K} }[/math]. Матрица записывается как

[math]\displaystyle{ A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & a_{ij} & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}, }[/math]

где элемент матрицы [math]\displaystyle{ a_{ij}=a(i,j) }[/math] находится на пересечении [math]\displaystyle{ i }[/math]строки и [math]\displaystyle{ j }[/math]-го столбца.

  • [math]\displaystyle{ i }[/math]-я строка матрицы [math]\displaystyle{ A(i,) = \begin{pmatrix} a_{i1} & a_{i2} & \cdots & a_{in} \end{pmatrix} ; }[/math]
  • [math]\displaystyle{ j }[/math]-й столбец матрицы [math]\displaystyle{ A(,j) = \begin{pmatrix} a_{1j} \\a_{2j} \\ \vdots \\ a_{mj} \end{pmatrix}. }[/math]

При этом количество элементов матрицы равно [math]\displaystyle{ m \cdot n }[/math].

В соответствии с этим

  • каждую строку матрицы можно интерпретировать как вектор в [math]\displaystyle{ n }[/math]-мерном координатном пространстве [math]\displaystyle{ \mathcal{K}^{n} }[/math];
  • каждый столбец матрицы — как вектор в [math]\displaystyle{ m }[/math]-мерном координатном пространстве [math]\displaystyle{ \mathcal{K}^{m} }[/math].

Сама матрица естественным образом интерпретируется как вектор в пространстве [math]\displaystyle{ \mathcal{K}^{mn} }[/math], имеющем размерность [math]\displaystyle{ mn }[/math]. Это позволяет ввести покомпонентное сложение матриц и умножение матрицы на число (см. ниже); что касается матричного умножения, то оно существенным образом опирается на прямоугольную структуру матрицы.

Квадратная матрица

Если у матрицы количество строк [math]\displaystyle{ m }[/math] совпадает с количеством столбцов [math]\displaystyle{ n }[/math], то такая матрица называется квадратной, а число [math]\displaystyle{ m=n }[/math] называется размером квадратной матрицы или её порядком.

Вектор-строка и вектор-столбец

Матрицы размера [math]\displaystyle{ m\times 1 }[/math] и [math]\displaystyle{ 1\times n }[/math] являются элементами пространств [math]\displaystyle{ \mathcal{K}^{m} }[/math] и [math]\displaystyle{ \mathcal{K}^{n} }[/math] соответственно:

  • матрица размера [math]\displaystyle{ m\times 1 }[/math] называется вектор-столбцом и имеет специальное обозначение:
[math]\displaystyle{ \mathrm{colon}\,(a_1,\dots,a_i,\dots,a_m) =\left( \begin{array}{c}a_1 \\ \vdots \\ a_i \\ \vdots \\ a_m \end{array} \right) =(a_1,\dots,a_i,\dots,a_m)^{T}; }[/math]
  • матрица размера [math]\displaystyle{ 1\times n }[/math] называется вектор-строкой и имеет специальное обозначение:
[math]\displaystyle{ \mathrm{row}\,(a_1,\dots,a_i,\dots,a_n)=(a_1,\dots,a_i,\dots,a_n); }[/math]

Элементарные преобразования матриц

Элементарными преобразованиями строк матрицы называются следующие преобразования:

  1. Умножение строки на отличное от нуля число,
  2. Прибавление одной строки к другой строке,
  3. Перестановка местами двух строк.

Элементарные преобразования столбцов матрицы определяются аналогично.

Ранг матрицы

Строки и столбцы матрицы являются элементами соответствующих векторных пространств:

  • столбцы матрицы [math]\displaystyle{ A }[/math] составляют элементы пространства размерности [math]\displaystyle{ m }[/math];
  • строки матрицы [math]\displaystyle{ A }[/math] составляют элементы пространства размерности [math]\displaystyle{ n }[/math].

Рангом матрицы называют количество линейно независимых столбцов матрицы (столбцовый ранг матрицы) или количество линейно независимых строк матрицы (строчный ранг матрицы). Этому определению эквивалентно определение ранга матрицы как порядка максимального отличного от нуля минора матрицы.

При элементарных преобразованиях ранг матрицы не меняется.

Обозначения

Обычно матрицу обозначают заглавной буквой латинского алфавита: пусть

[math]\displaystyle{ A\colon M\times N\to\mathcal{K}, }[/math]

тогда [math]\displaystyle{ A }[/math] — матрица, которая интерпретируется как прямоугольный массив элементов поля [math]\displaystyle{ \mathcal{K} }[/math] вида [math]\displaystyle{ a_{ij}=A(i,j) }[/math], где

  • первый индекс означает индекс строки: [math]\displaystyle{ i=\overline{1,m} }[/math];
  • второй индекс означает индекс столбца: [math]\displaystyle{ j=\overline{1,n} }[/math];

таким образом, [math]\displaystyle{ a_{ij} }[/math] — элемент матрицы [math]\displaystyle{ A }[/math], находящийся на пересечении [math]\displaystyle{ i }[/math]-й строки и [math]\displaystyle{ j }[/math]-го столбца. В соответствии с этим принято следующее компактное обозначение для матрицы размера [math]\displaystyle{ m\times n }[/math]:

[math]\displaystyle{ A=(a_{ij})_{i=1,j=1}^{m,n}, }[/math]

или просто

[math]\displaystyle{ A=(a_{ij}), }[/math]

если нужно просто указать обозначение для элементов матрицы.

Иногда, вместо [math]\displaystyle{ a_{ij} }[/math], пишут [math]\displaystyle{ a_{i,j} }[/math], чтобы отделить индексы друг от друга и избежать смешения с произведением двух чисел.

Если необходимо дать развёрнутое представление матрицы в виде таблицы, то используют запись вида

[math]\displaystyle{ \begin{pmatrix} a_{11} & \cdots & a_{1j} & \cdots & a_{1n} \\ \vdots & \ddots & \vdots & \ddots & \vdots \\ a_{i1} & \cdots & a_{ij} & \cdots & a_{in} \\ \vdots & \ddots & \vdots & \ddots & \vdots \\ a_{m1} & \cdots & a_{mj} & \cdots & a_{mn} \end{pmatrix},\quad\left[\begin{array}{ccccc} a_{11} & \cdots & a_{1j} & \cdots & a_{1n} \\ \vdots & \ddots & \vdots & \ddots & \vdots \\ a_{i1} & \cdots & a_{ij} & \cdots & a_{in} \\ \vdots & \ddots & \vdots & \ddots & \vdots \\ a_{m1} & \cdots & a_{mj} & \cdots & a_{mn} \end{array}\right],\quad\left\|\begin{array}{ccccc} a_{11} & \cdots & a_{1j} & \cdots & a_{1n} \\ \vdots & \ddots & \vdots & \ddots & \vdots \\ a_{i1} & \cdots & a_{ij} & \cdots & a_{in} \\ \vdots & \ddots & \vdots & \ddots & \vdots \\ a_{m1} & \cdots & a_{mj} & \cdots & a_{mn} \end{array}\right\| }[/math]

Можно встретить как обозначения с круглыми скобками «(…)», так и обозначения с квадратными скобками «[…]». Реже можно встретить обозначения с двойными прямыми линиями «||…||»).

Поскольку матрица состоит из строк и столбцов, для них используются следующие обозначения:

[math]\displaystyle{ a_{i\cdot}=A_i=[ \begin{array}{ccccc} a_{i1} & \cdots & a_{ij} & \cdots & a_{in} \\ \end{array}] }[/math] — это [math]\displaystyle{ i }[/math]-я строка матрицы [math]\displaystyle{ A }[/math],

а

[math]\displaystyle{ a_{\cdot j}=A^j=\left[ \begin{array}{c} a_{1j}\\\vdots \\a_{ij} \\\vdots \\a_{mj} \\ \end{array}\right] }[/math] — это [math]\displaystyle{ j }[/math]-й столбец матрицы [math]\displaystyle{ A }[/math].

Таким образом, матрица обладает двойственным представлением — по строкам:

[math]\displaystyle{ A=[ \begin{array}{ccccc} A^{1} & \cdots & A^{j} & \cdots & A^{n} \\ \end{array}] }[/math]

и по столбцам:

[math]\displaystyle{ A=\left[ \begin{array}{c} A_{1}\\\vdots \\A_{i} \\\vdots \\A_{m} \\ \end{array}\right] }[/math].

Такое представление позволяет формулировать свойства матриц в терминах строк или в терминах столбцов.

Транспонированная матрица

Для каждой матрицы [math]\displaystyle{ A=(a_{i,j})_{\begin{smallmatrix} i=\overline{1,m} \\ j=\overline{1,n} \end{smallmatrix}}= \begin{pmatrix} a_{1,1} & \cdots & a_{1,n} \\ \vdots & \ddots & \vdots \\ a_{m,1} & \cdots & a_{m,n} \end{pmatrix} }[/math] размера [math]\displaystyle{ m\times n }[/math]

можно построить матрицу [math]\displaystyle{ B=(b_{j,i})_{\begin{smallmatrix} j=\overline{1,n} \\ i=\overline{1,m} \end{smallmatrix}}= \begin{pmatrix} b_{1,1} & \cdots & b_{1,m} \\ \vdots & \ddots & \vdots \\ b_{n,1} & \cdots & b_{n,m} \end{pmatrix} }[/math] размера [math]\displaystyle{ n\times m }[/math],

у которой [math]\displaystyle{ b_{j,i}=a_{i,j} }[/math] для всех [math]\displaystyle{ i=\overline{1,m} }[/math] и [math]\displaystyle{ j=\overline{1,n} }[/math].

Такая матрица называется транспонированной матрицей для [math]\displaystyle{ A }[/math] и обозначается [math]\displaystyle{ A^{T} }[/math],

иногда (если нет возможности спутать с дифференцированием) обозначается [math]\displaystyle{ A' }[/math],

иногда (если нет возможности спутать с эрмитовым сопряжением) обозначается [math]\displaystyle{ A^{*} }[/math].

При транспонировании строки (столбцы) матрицы [math]\displaystyle{ A }[/math] становятся столбцами (соответственно - строками) матрицы [math]\displaystyle{ A^{T} }[/math].

Очевидно, [math]\displaystyle{ (A^{T})^{T}=A }[/math].

Для матриц над кольцом [math]\displaystyle{ \mathcal{K} }[/math] транспонирование является изоморфизмом [math]\displaystyle{ \mathcal{K} }[/math] - модулей матриц, поскольку

[math]\displaystyle{ (A+B)^T=A^T+B^T }[/math],
[math]\displaystyle{ (\lambda \cdot A)^T=\lambda \cdot (A^T) }[/math], для любых [math]\displaystyle{ \lambda \in \mathcal{K} }[/math].

Диагональная матрица

Диагональная матрица — квадратная матрица, все элементы которой кроме диагональных — нулевые [math]\displaystyle{ (i \neq j: a_{ij} = 0) }[/math], иногда записывается как:

[math]\displaystyle{ \mathrm{diag}(a_1, a_2, \dots, a_n). }[/math]

Другие диагонали матрицы

Кроме главной диагонали иногда рассматриваются элементы матрицы, стоящие непосредственно над диагональными элементами. Эти элементы образуют наддиагональ матрицы. Элементы, расположенные непосредственно под диагональю образуют поддиагональ матрицы (см. Бидиагональная матрица).

Элементы, расположенные на местах [math]\displaystyle{ a_{1,n},a_{2,n-1},\dots,a_{n,1} }[/math] образуют побочную диагональ (см., например, Побочная диагональ или Виды матриц).

Единичная матрица

Единичная матрица — матрица, при умножении на которую любая матрица (или вектор) остается неизменной, является диагональной матрицей с единичными (всеми) диагональными элементами:

[math]\displaystyle{ \mathrm{diag}(1, 1, \dots, 1). }[/math]

Для её обозначения чаще всего используется обозначение I или E, а также просто 1 (или 1 специальным шрифтом).

Для обозначения её элементов также используется символ Кронекера [math]\displaystyle{ \delta_{ij} }[/math], определяемый как:

[math]\displaystyle{ \delta_{ii} = 1 }[/math]
[math]\displaystyle{ \delta_{ij} = 0 }[/math] при [math]\displaystyle{ i \neq j. }[/math]

Нулевая матрица

Для обозначения нулевой матрицы — матрицы, все элементы которой нули (при сложении её с любой матрицей та остается неизменной, а при умножении на любую получается нулевая матрица) — используется обычно просто 0 или 0 специальным шрифтом, или буква, начертанием похожая на ноль, например [math]\displaystyle{ \Theta }[/math].

Операции над матрицами

Сложение матриц

Складывать можно только матрицы одинакового размера.

Сложение матриц [math]\displaystyle{ A + B }[/math] есть операция нахождения матрицы [math]\displaystyle{ C }[/math], все элементы которой равны попарной сумме всех соответствующих элементов матриц [math]\displaystyle{ A }[/math] и [math]\displaystyle{ B }[/math], то есть каждый элемент матрицы [math]\displaystyle{ C }[/math] равен

[math]\displaystyle{ \ c_{ij} = a_{ij} + b_{ij} }[/math]

Свойства сложения матриц:

  • коммутативность: [math]\displaystyle{ A+B=B+A }[/math];
  • ассоциативность: [math]\displaystyle{ (A+B)+C=A+(B+C) }[/math];
  • сложение с нулевой матрицей: [math]\displaystyle{ A+\theta=\theta+A=A }[/math];
  • существование противоположной матрицы: [math]\displaystyle{ A+(-A)=\theta }[/math];

Все свойства линейных операций повторяют аксиомы линейного пространства и поэтому справедлива теорема:

Множество всех матриц одинаковых размеров [math]\displaystyle{ m\times n }[/math] с элементами из поля [math]\displaystyle{ P }[/math] (поля всех действительных или комплексных чисел) образует линейное пространство над полем [math]\displaystyle{ P }[/math] (каждая такая матрица является вектором этого пространства). Впрочем, прежде всего во избежание терминологической путаницы, матрицы в обычных контекстах избегают без необходимости (которой нет в наиболее обычных стандартных применениях) и четкого уточнения употребления термина называть векторами.

Умножение матрицы на число

Умножение матрицы [math]\displaystyle{ A }[/math] на число [math]\displaystyle{ \lambda \in \mathcal{K} }[/math] заключается в построении матрицы [math]\displaystyle{ \lambda A = ( \lambda a_{ij} ) }[/math].

Свойства умножения матриц на число:

  • умножение на единицу: [math]\displaystyle{ 1\cdot A=A\cdot 1=A }[/math];
  • ассоциативность: [math]\displaystyle{ (\lambda\beta)A=\lambda(\beta A) }[/math];
  • дистрибутивность: [math]\displaystyle{ (\lambda+\beta)A=\lambda A+\beta A }[/math];
  • дистрибутивность: [math]\displaystyle{ \lambda(A+B)=\lambda A+\lambda B }[/math];

Умножение матриц

Умножение матриц (обозначение: [math]\displaystyle{ A B }[/math], реже со знаком умножения [math]\displaystyle{ A\times B }[/math]) — есть операция вычисления матрицы [math]\displaystyle{ C }[/math], каждый элемент которой равен сумме произведений элементов в соответствующей строке первого множителя и столбце второго.

[math]\displaystyle{ c_{ij} = \sum^n_{k=1} a_{ik} b_{kj} }[/math]

Количество столбцов в матрице [math]\displaystyle{ A }[/math] должно совпадать с количеством строк в матрице [math]\displaystyle{ B }[/math], иными словами, матрица [math]\displaystyle{ A }[/math] обязана быть согласованной с матрицей [math]\displaystyle{ B }[/math]. Если матрица [math]\displaystyle{ A }[/math] имеет размерность [math]\displaystyle{ m \times n }[/math], [math]\displaystyle{ B }[/math] — [math]\displaystyle{ n \times k }[/math], то размерность их произведения [math]\displaystyle{ A B = C }[/math] есть [math]\displaystyle{ m \times k }[/math].

Свойства умножения матриц:

[math]\displaystyle{ A(B+C)=AB+AC }[/math];

  • ассоциативность и коммутативность относительно умножения на число: [math]\displaystyle{ (\lambda A)B=A(\lambda B)=\lambda(AB) }[/math].

Умножение вектора на матрицу

По обычным правилам матричного умножения вектор-столбец умножается на матрицу, которая записывается слева от него, а вектор-строка умножается на матрицу, которая записывается справа от неё. Поскольку элементы вектора-столбца или вектора-строки можно записать (что обычно и делается), используя один, а не два индекса, это умножение можно записать так:

для вектора-столбца [math]\displaystyle{ v }[/math] (получая новый вектор-столбец [math]\displaystyle{ Av }[/math]):

[math]\displaystyle{ (Av)_{i} = \sum^n_{k=1} a_{ik} v_{k}, }[/math]

для вектора-строки [math]\displaystyle{ s }[/math] (получая новый вектор-строку [math]\displaystyle{ sA }[/math]):

[math]\displaystyle{ (sA)_{i} = \sum^n_{k=1} s_k a_{ki}. }[/math]

Вектор-строка, матрица и вектор-столбец могут быть умножены друг на друга, давая число (скаляр):

[math]\displaystyle{ sAv = \sum\limits_{k,i} s_k a_{ki} v_i. }[/math]

(Порядок важен: вектор-строка слева, вектор-столбец справа от матрицы).

Эти операции являются основой матричного представления линейных операторов и линейных преобразований координат (смены базисов), таких, как повороты, масштабирования, зеркальные отражения, а также (последнее) матричного представления билинейных (квадратичных) форм.

  • При представлении вектора вещественного векторного пространства в ортонормированном базисе (что эквивалентно использованию прямоугольных декартовых координат) соответствующие ему вектор-столбец и вектор-строка, представляющие собой набор компонент вектора, будут совпадать (поэлементно), отличаясь лишь формально своим изображением для корректности матричных операций (то есть один получается из другого просто операцией транспонирования). При использовании же неортонормированных базисов (например, косоугольных координат или хотя бы разных масштабов по осям) вектор-столбец соответствует компонентам вектора в основном базисе, а вектор-строка — в базисе, дуальном основному[5] (Иногда о пространстве векторов-строк говорят также как об особом, дуальном пространству векторов-столбцов, пространстве ковекторов).

Заметим, что обычной мотивировкой введения матриц и определения операции матричного умножения (см.тж.в статье об умножении матриц) является именно введение их, начиная с умножения вектора на матрицу (которое вводится исходя из преобразований базиса или вообще линейных операций над векторами), а уже затем композиции преобразований сопоставляется произведение матриц. Действительно, если новый вектор Av, полученный из исходного вектора v преобразованием, представимым умножением на матрицу A, преобразовать теперь ещё раз, преобразованием, представимым умножением на матрицу B, получив B(Av), то, исходя из правила умножения вектора на матрицу, приведенного в начале этого параграфа (используя ассоциативность умножения чисел и меняя порядок суммирования), нетрудно увидеть в результате формулу, дающую элементы матрицы (BA), представляющую композицию первого и второго преобразований и совпадающую с обычным определением матричного умножения.

Комплексное сопряжение

Если элементами матрицы [math]\displaystyle{ A = (a_{ij}) }[/math] являются комплексные числа, то комплексно сопряжённая (не путать с эрмитово сопряжённой! см. далее) матрица равна [math]\displaystyle{ \bar A = (\bar a_{i,j} ) }[/math]. Здесь [math]\displaystyle{ \bar a }[/math] — число, комплексно сопряжённое к [math]\displaystyle{ a }[/math].

Транспонирование и эрмитово сопряжение

Транспонирование уже обсуждалось выше: если [math]\displaystyle{ A = (a_{ij}) }[/math], то [math]\displaystyle{ A^T = (a_{ji}) }[/math]. Для комплексных матриц более употребительно эрмитово сопряжение: [math]\displaystyle{ A^* = \bar A^T }[/math]. С точки зрения операторного взгляда на матрицы, транспонированная и эрмитово сопряжённая матрица — это матрицы оператора, сопряжённого относительно скалярного или эрмитова произведения, соответственно.

Миноры

След

Для квадратной матрицы [math]\displaystyle{ A }[/math] сумма диагональных элементов (т.е. главных миноров первого порядка) называется следом:

[math]\displaystyle{ \mathrm{Tr} A = \sum\limits_{i}a_{ii} = a_{11}+ \ldots +a_{nn} }[/math]

(другие обозначения [math]\displaystyle{ \mathrm{Trace} }[/math], [math]\displaystyle{ \mathrm{Sp} }[/math], [math]\displaystyle{ \mathrm{Spur} }[/math]).

Свойства:

  1. Если определены [math]\displaystyle{ AB }[/math] и [math]\displaystyle{ BA }[/math], то [math]\displaystyle{ \mathrm{Tr} (AB) = \mathrm{Tr} (BA) }[/math].
  2. След является инвариантом преобразований подобия матрицы, т.е. если [math]\displaystyle{ S }[/math] невырождена, то [math]\displaystyle{ \mathrm{Tr} A = \mathrm{Tr} (S^{-1}AS) }[/math].
  3. След равен сумме (всех, с учётом кратности) собственных значений матрицы: [math]\displaystyle{ \mathrm{Tr} A = \sum\limits_{i}\lambda_{i} = \lambda_{1}+ \ldots +\lambda_{n} }[/math]. Более того, для любого целого (положительного) числа [math]\displaystyle{ k }[/math] выполняется [math]\displaystyle{ \mathrm{Tr} (A^{k}) = \sum\limits_{i}\lambda_{i}^{k} = \lambda_{1}^{k}+ \ldots +\lambda_{n}^{k} }[/math].

Определитель (детерминант)

Пусть матрица [math]\displaystyle{ A }[/math] — квадратная, тогда обозначение определителя: [math]\displaystyle{ \Delta = \det A }[/math]. Если матрица [math]\displaystyle{ 2\times2 }[/math], то [math]\displaystyle{ \Delta = \det A=a_{11} a_{22} - a_{12} a_{21} }[/math]

Перманент

Связанные понятия

Линейные комбинации

В векторном пространстве линейной комбинацией векторов [math]\displaystyle{ \mathbf{x}_1,\dots,\mathbf{x}_n }[/math] называется вектор

[math]\displaystyle{ \mathbf{x}=a_1\mathbf{x}_1+\dots+a_n\mathbf{x}_n, }[/math]

где [math]\displaystyle{ a_1,\dots,a_n }[/math] — коэффициенты разложения:

  • если все коэффициенты равны нулю, то такая комбинация называется тривиальной,
  • если же хотя бы один коэффициент отличен от нуля, то такая комбинация называется нетривиальной.

Это позволяет описать произведение [math]\displaystyle{ C=AB }[/math] матриц [math]\displaystyle{ A }[/math] и [math]\displaystyle{ B }[/math] терминами линейных комбинаций:

  • столбцы матрицы [math]\displaystyle{ C }[/math] — это линейные комбинации столбцов матрицы [math]\displaystyle{ A }[/math] с коэффициентами, взятыми из матрицы [math]\displaystyle{ B }[/math];
  • строки матрицы [math]\displaystyle{ C }[/math] — это линейные комбинации строк матрицы [math]\displaystyle{ B }[/math] с коэффициентами, взятыми из матрицы [math]\displaystyle{ A }[/math].

Линейная зависимость

Если какой-либо вектор можно представить в виде линейной комбинации, то говорят о линейной зависимости данного вектора от элементов комбинации.

Точнее, говорят так: некоторая совокупность элементов векторного пространства называется линейно зависимой, если существует равная нулю линейная комбинация элементов данной совокупности или

[math]\displaystyle{ \mathbf{0}=a_1\mathbf{x_1}+\dots+a_n\mathbf{x_n}, }[/math]

где не все числа [math]\displaystyle{ a_1,\dots,a_n }[/math] равны нулю; если такой нетривиальной комбинации не существует, то данная совокупность векторов называется линейно независимой.

Линейная зависимость векторов означает, что какой-то вектор заданной совокупности линейно выражается через остальные векторы.

Каждая матрица представляет собой совокупность векторов (одного и того же пространства). Две такие матрицы — две совокупности. Если каждый вектор одной совокупности линейно выражается через векторы другой совокупности, то на языке теории матриц этот факт описывается при помощи произведения матриц:

  • если строки матрицы [math]\displaystyle{ C }[/math] линейно зависят от строк матрицы [math]\displaystyle{ B }[/math], то [math]\displaystyle{ C=AB }[/math] для некоторой матрицы [math]\displaystyle{ A }[/math];
  • если столбцы матрицы [math]\displaystyle{ C }[/math] линейно зависят от столбцов другой матрицы [math]\displaystyle{ A }[/math], то [math]\displaystyle{ C=AB }[/math] для некоторой матрицы [math]\displaystyle{ B }[/math].

Свойства

Матричные операции

Сложение и вычитание допускается только для матриц одинакового размера.

Существует нулевая матрица [math]\displaystyle{ \Theta }[/math] такая, что её прибавление к другой матрице A не изменяет A, то есть

[math]\displaystyle{ A + \Theta = A }[/math]

Все элементы нулевой матрицы равны нулю.

Возводить в степень можно только квадратные матрицы.

  • Ассоциативность сложения: [math]\displaystyle{ A + (B + C) = (A + B) + C. }[/math]
  • Коммутативность сложения: [math]\displaystyle{ A + B = B + A. }[/math]
  • Ассоциативность умножения: [math]\displaystyle{ A(BC) = (AB)C. }[/math]
  • Вообще говоря, умножение матриц некоммутативно: [math]\displaystyle{ AB \ne BA }[/math]. Используя это свойство, вводят коммутатор матриц.
  • Дистрибутивность умножения относительно сложения:
    [math]\displaystyle{ A(B + C) = AB + AC; }[/math]
    [math]\displaystyle{ (B + C)A = BA + CA. }[/math]
  • С учётом упомянутых выше свойств, матрицы образуют кольцо относительно операций сложения и умножения.
  • Свойства операции транспонирования матриц:
    [math]\displaystyle{ (A^T)^T=A }[/math]
    [math]\displaystyle{ (AB)^T=B^T A^T }[/math]
    [math]\displaystyle{ (A^{-1})^T = (A^T)^{-1} }[/math], если обратная матрица [math]\displaystyle{ A^{-1} }[/math] существует.
    [math]\displaystyle{ (A+B)^T=A^T+B^T }[/math]
    [math]\displaystyle{ \text{det}\; A=\text{det}\; A^T }[/math]

Примеры

Квадратная матрица и смежные определения

Если количество строк матрицы равно количеству столбцов, то такая матрица называется квадратной.

Для квадратных матриц существует единичная матрица [math]\displaystyle{ E }[/math] (аналог единицы для операции умножения чисел) такая, что умножение любой матрицы на неё не влияет на результат, а именно

[math]\displaystyle{ EA = AE = A }[/math]

У единичной матрицы единицы стоят только по главной диагонали, остальные элементы равны нулю

[math]\displaystyle{ E = \begin{pmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 \end{pmatrix} }[/math]

Для некоторых квадратных матриц можно найти так называемую обратную матрицу. Обратная матрица [math]\displaystyle{ A^{-1} }[/math] такова, что если матрицу умножить на обратную ей матрицу, то получится единичная матрица:

[math]\displaystyle{ A A^{- 1} = E }[/math]

Обратная матрица существует не всегда. Матрицы, для которых обратная матрица существует, называются невырожденными (или регулярными), а для которых нет — вырожденными (или сингулярными). Матрица невырождена, если все её строки (столбцы) линейно независимы как векторы. Максимальное число линейно независимых строк (столбцов) называется рангом матрицы. Определителем (детерминантом) матрицы называется значение нормированной кососимметрической (антисимметрической) полилинейной формы валентности [math]\displaystyle{ (p;\;0) }[/math] на столбцах матрицы. Квадратная матрица над числовым полем вырождена тогда и только тогда, когда её определитель равен нулю.

Кольцо матриц

Из указанных выше свойств сложения и умножения матриц (ассоциативность и коммутативность сложения, дистрибутивность умножения, существование нулевой и противоположной по сложению матрицы) следует, что квадратные матрицы n на n с элементами из любого кольца R образуют кольцо, изоморфное кольцу эндоморфизмов свободного модуля Rn. Это кольцо обозначается [math]\displaystyle{ M(n,R) }[/math] или [math]\displaystyle{ M_n(R) }[/math]. Если же R — коммутативное кольцо, [math]\displaystyle{ M(n,R) }[/math] является также ассоциативной алгеброй над R. Определитель матрицы с элементами из коммутативного кольца можно вычислять по обычной формуле, при этом матрица будет обратима тогда и только тогда, когда её определитель обратим в R. Это обобщает ситуацию с матрицами с элементами из поля, так как в поле обратим любой элемент, кроме нуля.

Матрицы в теории групп

Матрицы играют важную роль в теории групп. Они используются при построении общих линейных групп, специальных линейных групп, диагональных групп, треугольных групп, унитреугольных групп.

Конечную группу (в частности, симметрическую) можно (изоморфно) промоделировать матрицами перестановок (содержащими только «0» и «1»),

например, для [math]\displaystyle{ S_3 }[/math] : [math]\displaystyle{ \begin{pmatrix} 1 & 0 & 0\\0 & 1 & 0\\0 & 0 & 1\end{pmatrix} }[/math] , [math]\displaystyle{ \begin{pmatrix} 0 & 1 & 0\\0 & 0 & 1\\1 & 0 & 0\end{pmatrix} }[/math] , [math]\displaystyle{ \begin{pmatrix} 0 & 0 & 1\\1 & 0 & 0\\0 & 1 & 0\end{pmatrix} }[/math] , [math]\displaystyle{ \begin{pmatrix} 0 & 1 & 0\\1 & 0 & 0\\0 & 0 & 1\end{pmatrix} }[/math] , [math]\displaystyle{ \begin{pmatrix} 0 & 0 & 1\\0 & 1 & 0\\1 & 0 & 0\end{pmatrix} }[/math] , [math]\displaystyle{ \begin{pmatrix} 1 & 0 & 0\\0 & 0 & 1\\0 & 1 & 0\end{pmatrix} }[/math] .

Поле [math]\displaystyle{ \mathbb{C} }[/math] комплексных чисел может быть (изоморфно) промоделировано над полем [math]\displaystyle{ \mathbb{R} }[/math] вещественных чисел:

для [math]\displaystyle{ z = x + i y , \quad c = a + i b \in \mathbb{C} }[/math] матричные аналоги [math]\displaystyle{ Z = \begin{pmatrix} x & y\\-y & x \end{pmatrix} }[/math] , [math]\displaystyle{ C = \begin{pmatrix} a & b\\-b & a \end{pmatrix} }[/math] , где [math]\displaystyle{ x , y , a , b \in \mathbb{R} }[/math] ;

[math]\displaystyle{ z + c = (x + a)+ i(y + b) }[/math] соответствует [math]\displaystyle{ Z + C = \begin{pmatrix} x + a & y + b\\- y - b & x + a\end{pmatrix} }[/math] ;

[math]\displaystyle{ z c = (x a - y b)+ i(x b + y a) }[/math] соответствует [math]\displaystyle{ Z C = \begin{pmatrix} x a - y b & x b + y a\\- y a - x b & - y b + x a\end{pmatrix} }[/math] ;

[math]\displaystyle{ \bar{z} = x - i y }[/math] соответствует [math]\displaystyle{ Z^T = \begin{pmatrix} x & -y\\y & x \end{pmatrix} }[/math] ;

[math]\displaystyle{ |z|^2 = z \bar{z}= x^2 + y^2=\det(Z) \in \mathbb{R} }[/math] ;

[math]\displaystyle{ \frac{1}{z} = \frac{\bar{z}}{z \bar{z}} = \frac{x - i y}{x^2 + y^2} }[/math] при [math]\displaystyle{ z \ne 0 }[/math] соответствует [math]\displaystyle{ Z^{-1} = \frac{Z^T}{\det(Z)} }[/math] при [math]\displaystyle{ \det(Z) \ne 0 }[/math] ;

[math]\displaystyle{ e^z = e^{x + i y} = e^x (\cos(y) + i\, \sin(y)) }[/math] соответствует [math]\displaystyle{ e^x \begin{pmatrix} \cos(y) & \sin(y)\\-\sin(y) & \cos(y) \end{pmatrix} }[/math] .

В частности, для [math]\displaystyle{ E = \begin{pmatrix} 1 & 0\\0 & 1 \end{pmatrix} }[/math] , [math]\displaystyle{ I = \begin{pmatrix} 0 & 1\\-1 & 0 \end{pmatrix} }[/math]

[math]\displaystyle{ z = x + i y \in \mathbb{C} }[/math] соответствует [math]\displaystyle{ Z = x E + y I }[/math] ,

где [math]\displaystyle{ I^2=-E }[/math] .

Замечание. Модель имеет автоморфизм [math]\displaystyle{ (I \to -I) }[/math], то есть [math]\displaystyle{ Z \to Z^T }[/math]

Тело кватернионов [math]\displaystyle{ \mathbb{H} }[/math] может быть (изоморфно) промоделировано над полем [math]\displaystyle{ \mathbb{R} }[/math] вещественных чисел:

для [math]\displaystyle{ q = t + i x + j y + k z \in \mathbb{H} }[/math] матричный аналог [math]\displaystyle{ Q = \begin{pmatrix} t & x & y & -z\\ -x & t & -z & -y\\ -y & z & t & x\\ z & y & -x & t \end{pmatrix} }[/math] , где [math]\displaystyle{ t , x , y , z \in \mathbb{R} }[/math] .

Для того, чтобы кватерниону [math]\displaystyle{ q = t + i x + j y + k z }[/math] соответствовала матрица [math]\displaystyle{ Q = t E + x I + y J + z K }[/math] ,

где [math]\displaystyle{ I^2=J^2=K^2=-E }[/math] , [math]\displaystyle{ IJ=-JI=K }[/math] , [math]\displaystyle{ JK=-KJ=I }[/math] , [math]\displaystyle{ KI=-IK=J }[/math] ,

можно ввести базисные элементы

[math]\displaystyle{ E = \begin{pmatrix} 1 & 0 & 0 & 0\\0 & 1 & 0 & 0\\0 & 0 & 1 & 0\\0 & 0 & 0 & 1\end{pmatrix} }[/math] , [math]\displaystyle{ I = \begin{pmatrix} 0 & a & 0 & 0\\-a & 0 & 0 & 0\\0 & 0 & 0 & b\\0 & 0 & -b & 0\end{pmatrix} }[/math] , [math]\displaystyle{ J = \begin{pmatrix} 0 & 0 & c & 0\\0 & 0 & 0 & d\\-c & 0 & 0 & 0\\0 & -d & 0 & 0\end{pmatrix} }[/math] , [math]\displaystyle{ K = \begin{pmatrix} 0 & 0 & 0 & ad\\0 & 0 & -ac & 0\\0 & -bd & 0 & 0\\bc & 0 & 0 & 0\end{pmatrix} }[/math] .

Параметры должны удовлетворять условиям: [math]\displaystyle{ a , b , c , d \in \left \{ -1, +1 \right \} }[/math] и [math]\displaystyle{ abcd = -1 }[/math] .

Существует 8 решений (8 представлений).

См. также

Примечания

  1. Под треугольными матрицами сейчас понимают матрицы, ненулевые элементы которых заполняют в таблице матрицы треугольную область, остальные же элементы — нули.
  2. Этот изоморфизм полностью задается выбором базиса в линейном пространстве: при фиксированном базисе изоморфизм фиксирован и таким образом реализована взаимная однозначность соответствия матриц операторам. Это не означает того, что такой изоморфизм в принципе единственный: в другом базисе тем же линейным операторам будут соответствовать другие матрицы (тоже взаимно однозначно при фиксации этого нового базиса).
  3. Березкина Э. И. [libgen.pw/view.php?id=1211718 Математика древнего Китая] / Отв. ред. Б.А.Розенфельд. — М.: Наука, 1980. — С. 173—206. — 312 с.
  4. Даан-Дальмедико А., Пейффер Ж. Пути и лабиринты. Очерки по истории математики: Пер. с франц. — М.: Мир, 1986. — С. 397.
  5. Формально в этом определении всё симметрично, и можно было бы поменять «основной» и дуальный базис местами (они оба просто взаимно дуальны), однако принято именно описанное соглашение.

Литература

  • Беллман Р. Введение в теорию матриц. — М.: Мир, 1969 (djvu).
  • Биркгоф Г. (Garrett Birkhoff), Барти Т. (Thomas C. Bartee) Современная прикладная алгебра. — М.: Мир, 1976. — 400 с.
  • Ван дер Варден Б. Л. (B. L. van der Waerden) Алгебра. (2-е изд.) — М.: Наука, 1979. — 624 с.
  • Гантмахер Ф. Р. Теория матриц. — 5-е изд. — М.: Физматлит, 2004. — 560 с. — ISBN 5-9221-0524-8.; (2-е изд.). — М.: Наука, 1966 (djvu).
  • Голуб Дж. (Gene H. Golub), Ван Лоун Ч. (Charles F. Van Loan) Матричные вычисления. — М.: Мир, 1999. — 548 с. — ISBN 5-03-002406-9
  • Курош А. Г. Курс высшей алгебры. — 9-е изд. — М.: Наука, 1968. — 432 с.
  • Курош А. Г. Лекции по общей алгебре. — 2-е изд. — М.: Наука, 1973. — 400 с.
  • Ланкастер П. (P. Lankaster) Теория матриц / Пер. с англ. — 2-е изд. — М.: Наука, 1982. — 272 с.; 1-е изд. — М.: Наука, 1973 (djvu).
  • Ленг С. (Serge Lang) Алгебра. — М.: Мир, 1968. — 564 с.
  • Наймарк М. А. Теория представлений групп. — М.: Наука, 1976. — 560 с.
  • Соколов Н. П. Пространственные матрицы и их приложения. — М.: ГИФМЛ, 1960 (djvu).
  • Хорн Р. (Roger A. Horn), Джонсон Ч. (Charles C. Johnson) Матричный анализ. — М.: Мир, 1989. — 655 с. — ISBN 5-03-001042-4
  • Халмош П. Конечномерные векторные пространства = Finite-dimensional vector spaces. — М.: Физматгиз, 1963. — 264 с.