Перейти к содержанию

Ковариантность и контравариантность (математика)

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис

Ковариа́нтность и контравариа́нтность — используемые в математике (линейной алгебре, дифференциальной геометрии, тензорном анализе) и в физике понятия, характеризующие то, как тензоры (скаляры, векторы, операторы, билинейные формы и т. д.) изменяются при преобразованиях базисов в соответствующих пространствах или многообразиях. Контравариантными называют «обычные» компоненты, которые при смене базиса пространства изменяются с помощью преобразования, обратного преобразованию базиса. Ковариантными — те, которые изменяются так же, как и базис.

Связь между ковариантными и контравариантными координатами тензора возможна только в пространствах, где задан метрический тензор (не следует путать с метрическим пространством).

Термины ковариантность и контравариантность были введены Сильвестром в 1853 году для исследований по алгебраической теории инвариантов.

Ковариантность и контравариантность в векторных пространствах

Контравариантные и ковариантные векторы

     вектор v, описанный в терминах
касательного базиса
     e1, e2, e3 в      координатных кривых (слева),
дуального базиса, ковекторного базиса или взаимного базиса
     e1, e2, e3 в      координатных поверхностях (справа),
в 3-d общих криволинейных координатах (q1, q2, q3), кортеж чисел для определения точки в координатном пространстве. Обратите внимание, что базис и кобазис совпадают только тогда, когда базис ортогональный.[1]

Пусть [math]\displaystyle{ V }[/math] — некоторое конечномерное векторное пространство, и в нём задан некоторый базис [math]\displaystyle{ e_i, i=1..n }[/math]. Произвольный вектор [math]\displaystyle{ x }[/math] можно представить как линейную комбинацию векторов базиса: [math]\displaystyle{ x=\sum^n_{i=1}x_ie_i }[/math]. В целях упрощения записи (и по причинам, которые станут ясны ниже) обозначим координаты с верхним индексом и примем правило Эйнштейна: если в выражении участвуют одинаковые разноуровневые индексы, то по ним предполагается суммирование. Таким образом, можно записать: [math]\displaystyle{ x=x^ie_i }[/math]. Зададим новый базис с помощью матрицы преобразования [math]\displaystyle{ S }[/math]. По тем же соображениям введём нижние и верхние индексы (чтобы не писать знаки суммирования) — [math]\displaystyle{ S^j_i }[/math]. Тогда [math]\displaystyle{ e'_i=S^j_ie_j }[/math] (предполагается суммирование по индексу j). Обозначив обратную матрицу [math]\displaystyle{ T=S^{-1} }[/math], можно записать: [math]\displaystyle{ e_j=T^i_je'_i }[/math]. Подставив эту формулу в координатное представление вектора x, получим: [math]\displaystyle{ x=x^jT^i_je'_i }[/math]. Таким образом, координаты вектора в новом базисе оказываются равными [math]\displaystyle{ x'^i=T^i_jx^j }[/math], то есть преобразуются «противоположно» (обратно) изменению базиса. По этой причине такие векторы называют контравариантными — изменяющимися противоположно базису. Контравариантные векторы — это обычные векторы. Контравариантные векторы в координатном представлении обычно записывают как «вектор-столбец». Для идентификации контравариантных векторов используется верхний, или контравариантный, индекс.

Пространство всех линейных функционалов, отображающих векторы в числа, называют сопряжённым пространством [math]\displaystyle{ V^* }[/math]. Оно также является векторным пространством той же размерности, что и основное пространство. В этом пространстве также можно определить базис. Обозначим элементы базиса сопряжённого пространства с верхним индексом [math]\displaystyle{ g^i }[/math]. Любой функционал можно представить в этом базисе через координаты, которые будем обозначать нижними индексами. Тогда, применяя правило Эйнштейна, можем записать: [math]\displaystyle{ f=f_ig^i }[/math], то есть любой линейный функционал можно записать просто набором чисел [math]\displaystyle{ f_i }[/math], как обычный вектор (за исключением нижнего расположения индекса).

Выберем базис в сопряженном пространстве так, что [math]\displaystyle{ g^i(x)=x^i }[/math], то есть эти функционалы находят [math]\displaystyle{ i }[/math]-ю координату вектора (проекцию на базисный вектор [math]\displaystyle{ e_i }[/math]). Такой базис называют дуальным (базису основного пространства). При смене базиса основного пространства необходимо сохранить это условие, то есть [math]\displaystyle{ g'^i(x)=x'^i=T^i_jx^j=T^i_jg^j(x) }[/math]. Таким образом, дуальный базис изменяется обратно изменению основного базиса. Координаты произвольного линейного функционала [math]\displaystyle{ f_i }[/math] будут меняться противоположно собственному базису (как и в любом пространстве), то есть с помощью матрицы [math]\displaystyle{ T^{-1}=S }[/math]. Следовательно, они будут меняться так, как основной базис. Это свойство называют ковариантностью. Сами линейные функционалы в координатном представлении в дуальном базисе называют ковариантными векторами, или кратко — ковекторами. Внешне ковектор «выглядит» как обычный вектор — в смысле обычного набора чисел, представляющих его координаты. Отличие ковектора от контрвариантного вектора заключается в правиле преобразования его координат при смене базиса: они преобразуются так, как базис, в отличие от контравариантных векторов, преобразующихся противоположно базису. Ковекторы в координатной форме записывают как «вектор-строку». Для идентификации ковекторов используется нижний, или ковариантный, индекс.

Контравариантность и ковариантность тензоров

Сказанное про контравариантность и ковариантность векторов можно обобщить на объекты с несколькими индексами — тензоры, частными случаями которых и являются векторы и ковекторы.

По аналогии с линейным функционалом рассмотрим функционал, ставящий в соответствие нескольким ([math]\displaystyle{ k }[/math]) векторам пространства [math]\displaystyle{ V }[/math] некоторое число, обладающий свойством линейности по каждому вектору. Это так называемые полилинейные функции. Можно показать, что все [math]\displaystyle{ k }[/math]-линейные функции образуют линейное пространство, в котором можно также ввести базис и представить произвольную [math]\displaystyle{ k }[/math]-линейную функцию в координатном виде. Можно также показать, что их координаты преобразуются как базис основного пространства (так же как и ковариантные векторы). Поэтому такие полилинейные функции называют [math]\displaystyle{ k }[/math] раз ковариантными тензорами. Их записывают с нижними индексами. Например, дважды ковариантный тензор обозначается так [math]\displaystyle{ A_{ij} }[/math].

Аналогично можно рассматривать полилинейные функции не в основном пространстве, а в сопряженном пространстве [math]\displaystyle{ V^* }[/math], совокупность которых также образует линейное пространство [math]\displaystyle{ V^{**} }[/math], которое является сопряженным к [math]\displaystyle{ V^* }[/math]. В координатном представлении в дуальном базисе они преобразуются так же, как базис пространства [math]\displaystyle{ V^* }[/math], а значит — противоположно базису основного пространства [math]\displaystyle{ V }[/math]. То есть они обладают свойством контравариантности и называются [math]\displaystyle{ k }[/math] раз контравариантным тензором. Их обозначают с верхними индексами. В частности, дважды контравариантный тензор запишется как [math]\displaystyle{ A^{ij} }[/math].

Для рассматриваемых обычно пространств выполняется так называемый канонический изоморфизм [math]\displaystyle{ V }[/math] и [math]\displaystyle{ V^{**} }[/math], то есть эти пространства можно считать неразличимыми. Поэтому 1-раз контравариантный тензор можно считать эквивалентным обычному контравариантному вектору.

Обобщая приведённые определения, можно рассматривать полилинейные функции от векторов и ковекторов одновременно. Соответственно, при смене базиса координатная запись такой функции будет преобразовываться с участием как матрицы преобразования основного базиса (в количестве ковекторов, участвующих в полилинейной функции), так и обратного ему (в количестве векторов полилинейной функции). Соответствующий тензор называют m раз контравариантным и k раз ковариантным — [math]\displaystyle{ T^m_k }[/math]. Для ковариантных компонент используют нижние индексы, для контравариантных — верхние. Например, 1-раз контравариантный и 1 раз ковариантный тензор обозначается [math]\displaystyle{ A^i_j }[/math]. Общее количество индексов [math]\displaystyle{ k+m }[/math] называется рангом, или валентностью, тензора. Компонентами тензора являются значения полилинейной функции на базисных векторах. Например, [math]\displaystyle{ A^i_j = A(e^i, e_j) }[/math].

Операция суммирования по одинаковым разноуровневым индексам тензоров называется свёрткой по этим индексам. Как уже было указано выше, по правилу Эйнштейна знак суммирования пропускают. В результате свёртки тензора по паре индексов его ранг уменьшается на 2. Например, отображение некоторого контравариантного вектора с помощью некоторого линейного оператора в тензорной записи будет иметь вид [math]\displaystyle{ y^i= A^i_j x^j }[/math]. Линейные операторы являются классическим примером тензора типа [math]\displaystyle{ T^1_1 }[/math].

При преобразовании тензора типа [math]\displaystyle{ T^m_k }[/math] при смене базиса m раз используется прямая матрица преобразования базиса и k раз обратная. Например, тензор [math]\displaystyle{ A^i_j }[/math] типа [math]\displaystyle{ T^1_1 }[/math] при смене базиса преобразуется следующим образом:

[math]\displaystyle{ A^{i'}_{j'} = T^q_{j'} S^{i'}_p A^p_q }[/math]

Вообще, необходимо понимать, что сам объект от представления его в базисе не зависит. Все преобразования — это представления одного и того же объекта (тензора).

Метрический тензор

Если в линейном пространстве введено скалярное произведение [math]\displaystyle{ g }[/math] — билинейная форма (или в тензорной терминологии — дважды ковариантный тензор), обладающая свойствами симметричности и невырожденности, то такие пространства (конечномерные) называют евклидовыми (при условии положительной определённости соответствующей квадратичной формы [math]\displaystyle{ g(x,x) }[/math]) или псевдоевклидовым (без ограничения знака квадратичной формы). Соответствующий этой билинейной форме тензор называют метрическим тензором. Компоненты этого тензора в данном базисе [math]\displaystyle{ g_{ij}=g(e_i,e_j) }[/math]. Если этот базис ортонормированный (такой базис всегда существует в (псевдо)евклидовом пространстве), то матрица компонент является диагональной. На диагонали в случае евклидового пространства — единицы (единичная матрица). В случае псевдоевклидового пространства на диагонали кроме единиц имеются также и «минус-единицы». В общем случае, однако, базисы могут быть не ортогональными, поэтому метрический тензор может быть представлен и недиагональной матрицей (тем не менее в «плоском» пространстве всегда существует преобразование базиса, которое приводит его к диагональному виду).

С помощью метрического тензора скалярное произведение запишется как [math]\displaystyle{ g(x,y)=g_{ij}x^iy^j }[/math]. В пространствах со скалярным произведением имеет место канонический изоморфизм пространства [math]\displaystyle{ V }[/math] и сопряжённого пространства [math]\displaystyle{ V^* }[/math], то есть каждому вектору ставится в соответствие ковектор и наоборот. Это соответствие осуществляется как раз с помощью скалярного произведения или в тензорной записи — с помощью метрического тензора. А именно, можно записать [math]\displaystyle{ x_i=g_{ij}x^j }[/math]. Эта операция называется опусканием или спуском индекса. Обратное соответствие осуществляется с помощью контравариантного метрического тензора [math]\displaystyle{ x^j=g^{ij}x_i }[/math]. Эта операция называется поднятием или подъёмом индекса. Несложно показать, что матрицы ковариантного и контравариантного метрических тензоров взаимно-обратны, то есть [math]\displaystyle{ g_{ik}g^{kj}=\delta^j_i }[/math]. Скалярное произведение можно выразить как в контравариантных, так и в ковариантных векторах: [math]\displaystyle{ g(x,y)=g_{ij}x^iy^j=x_iy^i=x^iy_i=g^{ij}x_iy_j }[/math].

В случае ортонормированного базиса в евклидовом пространстве метрический тензор — единичная матрица, поэтому ковариантный вектор в координатной записи совпадает с контравариантным. Поэтому в этом случае деление векторов на контравариантные и ковариантные не является необходимым. Однако уже при неортогональности базиса и (или) псевдоевклидовости пространства такое разграничение имеет значение. В псевдоевклидовом пространстве в ортогональном базисе ковекторы различаются знаками некоторых координат от обычного вектора. Система векторов и ковекторов в таком случае позволяет записывать формулу для квадрата длины вектора аналогично случаю евклидового пространства [math]\displaystyle{ x_ix^i }[/math]. В случае неортогональных (косоугольных) базисов в евклидовых (псевдоевклидовых) пространствах метрический тензор, преобразующий контравариантные векторы в ковариантные, не является диагональным. При этом длина вектора записывается также как в евклидовом пространстве с помощью контравариантных и ковариантных векторов. Все эти случаи объединяет одно — метрический тензор (в данном базисе) имеет одинаковую матрицу для всех точек (векторов) пространства.

В пространствах с метрическим тензором «ковариантный вектор» и «контравариантный вектор» являются фактически разными представлениями (записями в виде набора чисел) одного и того же геометрического объекта — обычного вектора или ковектора. То есть один и тот же вектор может быть записан как ковариантный (то есть набор ковариантных координат) и контравариантный (то есть набор контравариантных координат). То же можно сказать о ковекторе. Преобразование одного представления в другое осуществляется просто свёрткой с метрическим тензором. Содержательно же векторы и ковекторы различают лишь по тому, какое из представлений для них естественно. Естественным для обычного вектора является контравариантное представление. Для ковариантного вектора естественным является свертка с обычными векторами без участия метрики. Примером ковариантного вектора является градиент скалярной функции [math]\displaystyle{ \mathbf{grad} f(\mathbf{x})=\frac {\partial f} {\partial x^i}=\partial_if }[/math]. Его свёртка с контравариантным (обычным) вектором [math]\displaystyle{ dx^i }[/math] даёт инвариант — дифференциал функции [math]\displaystyle{ df(x) }[/math]. Таким образом, если мы принимаем [math]\displaystyle{ dx^i }[/math] в качестве обычных векторов пространства, то градиент должен быть ковектором, чтобы при свёртывании не нужно было использовать метрический тензор. При этом сами векторы [math]\displaystyle{ dx^i }[/math] требуют при свёртывании с такими же векторами использования метрического тензора [math]\displaystyle{ \ (dx)^2 = g_{ij} dx^i dx^j }[/math].

Если речь идет об обычном физическом пространстве, простым признаком ковариантности-контравариантрности вектора является то, как свёртывается его естественное представление с набором координат пространственного перемещения [math]\displaystyle{ \ dx^i }[/math], являющегося образцом контравариантного вектора. Те, что свёртываются с [math]\displaystyle{ \ dx^i }[/math] посредством простого суммирования, без участия метрики, — это ковариантные векторы, а те, что с участием метрики — это контравариантные векторы. Если же пространство и координаты настолько абстрактны, что нет способа различить главный и дуальный базис, кроме как произвольным условным выбором, то содержательное различие между ковариантными и контравариантными векторами пропадает, или становится также чисто условным.

Нередко ковариантным вектором, особенно в физической литературе, называют разложение любого вектора (то есть вектора или ковектора, вектора касательного или кокасательного пространства) по дуальному базису. Тогда речь идет о наборе ковариантных координат любого объекта, обычно, однако, каждый тип объектов стараются записывать в естественном для него базисе, что соответствует основному определению.

Обобщение на криволинейные базисы и искривлённые пространства

Координаты евклидового (псеводоевклидового) пространства могут быть и криволинейными. Классический пример криволинейных координат — полярные координаты на евклидовой плоскости. В таком случае координатные базисы [math]\displaystyle{ dx^i }[/math] можно считать линейными лишь в бесконечно малых окрестностях данной точки. Поэтому справедливым остаётся выражение для квадрата расстояния для достаточно близких точек: [math]\displaystyle{ (dx)^2= g_{ij}dx^idx^j }[/math]. В случае криволинейных координат метрический тензор меняется от точки к точке. Таким образом, он представляет собой тензорное поле — каждой точке пространства оказывается сопоставлен некоторый метрический тензор.

Более общая ситуация имеет место в случае искривлённых пространств — римановых (псевдоримановых) многообразий. Искривлённое пространство можно наглядно представить для случая двумерной поверхности — некоторая гладкая кривая поверхность в трёхмерном пространстве (например, сферическая поверхность). Внутренняя геометрия такой поверхности (искривлённой) — это геометрия искривлённого пространства. В общем случае искривлённого пространства размерности [math]\displaystyle{ n }[/math] его можно представить себе как произвольную (искривлённую) гиперповерхность в пространстве большей размерности. Для гладких многообразий со счетной базой доказана теорема Уитни о вложении, согласно которой любое такое многообразие размерности [math]\displaystyle{ n }[/math] является вложенным в «плоское» (то есть неискривлённое евклидово или псевдоевклидово) пространство размерности [math]\displaystyle{ 2n }[/math].

В искривлённом пространстве могут и не существовать ортогональные и вообще линейные координатные базисы. В общем случае приходится иметь дело именно с криволинейными базисами. В этом случае применение всего вышеуказанного формализма ковариантных и контравариантных векторов приобретает не просто особую важность, а становится неизбежным.

Общие определения

В случае криволинейных координат или искривлённых пространств новые координаты являются, вообще говоря, нелинейными функциями старых координат: [math]\displaystyle{ x'^i=x'^i(x^1,x^2,...,x^n) }[/math]. Для бесконечно малых изменений старых координат [math]\displaystyle{ dx^j }[/math] можно определить изменения новых координат через якобиан указанных функций:

[math]\displaystyle{ dx'^i=\frac {\partial x'^i}{\partial x^j}dx^j }[/math]

Любой вектор [math]\displaystyle{ v }[/math], преобразующийся так же, как и [math]\displaystyle{ dx^i }[/math], то есть

[math]\displaystyle{ v'^i=\frac {\partial x'^i}{\partial x^j}v^j }[/math]

называется контравариантным вектором.

Для некоторой скалярной функции координат [math]\displaystyle{ f(x) }[/math] рассмотрим её градиент [math]\displaystyle{ \frac {\partial f(x)}{\partial x^i} }[/math]. При переходе к другим координатам имеем:

[math]\displaystyle{ \frac {\partial f(x)} {\partial x'^i}=\frac {\partial f(x)}{\partial x^j} \frac {\partial x^j}{\partial x'^i} }[/math]

Любой вектор [math]\displaystyle{ u }[/math], преобразующийся так же, как градиент, то есть

[math]\displaystyle{ u'_i= \frac {\partial x^j}{\partial x'^i}u_j }[/math]

называется ковариантным вектором.

Соответственно, [math]\displaystyle{ m }[/math] раз контравариантным и [math]\displaystyle{ k }[/math] раз ковариантным тензором (тензором типа [math]\displaystyle{ T^m_k }[/math]) называется объект, преобразующийся при смене базиса применением [math]\displaystyle{ m }[/math] раз «обратного» преобразования [math]\displaystyle{ \frac {\partial x'^i}{\partial x^j} }[/math] и [math]\displaystyle{ k }[/math] раз «прямого» преобразования [math]\displaystyle{ \frac {\partial x^j}{\partial x'^i} }[/math].

Например, дважды контравариантный тензор [math]\displaystyle{ A^{ij} }[/math] и дважды ковариантный тензор [math]\displaystyle{ A_{ij} }[/math] преобразуются по следующим законам:

[math]\displaystyle{ {A'}^{ij}=\frac {\partial x'^i}{\partial x^q}\frac {\partial x'^j}{\partial x^p}A^{pq} }[/math]
[math]\displaystyle{ {A'}_{ij}=\frac {\partial x^q}{\partial x'^i}\frac {\partial x^p}{\partial x'^j}A_{pq} }[/math]

А для 1 раз контравариантного и 1 раз ковариантного тензора преобразования имеют вид:

[math]\displaystyle{ {A'}^j_i=\frac {\partial x^p}{\partial x'^i}\frac {\partial x'^j}{\partial x^q}A^q_p }[/math]

Обычно для указания, что компоненты тензора преобразованы к новому базису со штрихом, штрих указывают у соответствующих индексов тензора, а не у его буквенного обозначения, в таком случае вышеуказанные формулы записывают так

[math]\displaystyle{ A^{i'j'}=\frac {\partial x^{i'}}{\partial x^q}\frac {\partial x^{j'}}{\partial x^p}A^{pq},\qquad A_{i'j'}=\frac {\partial x^q}{\partial x^{i'}}\frac {\partial x^p}{\partial x^{j'}}A_{pq},\qquad A^{j'}_{i'}=\frac {\partial x^p}{\partial x^{i'}}\frac {\partial x^{j'}}{\partial x^q}A^q_p }[/math]

Алгебра и геометрия

В теории категорий, функторы могут быть ковариантными и контравариантными. Сопряжённое пространство векторного пространства — стандартный пример контравариантного функтора. Некоторые конструкции мультилинейной алгебры являются смешанными, и не являются функторами.

В геометрии то же самое отображение различается в или из пространства, что позволяет определить вариантность конструкции. Касательный вектор к гладкому многообразию M в точке P — это класс эквивалентности кривых в M, проходящих через данную точку P. Поэтому он контравариантен относительно гладкого отображения M. Ковариантный вектор, или ковектор, таким же способом конструируется из гладкого отображения из M на вещественную ось около P в кокасательном расслоении, построенном на сопряжённом пространстве касательного расслоения.

Ковариантные и контравариантные компоненты преобразуются разными способами при преобразованиях базисов и, соответственно, координат, если брать, как это делают обычно, координатные базисы. .

См. также

Примечания

  1. J.A. Wheeler; C. Misner; K.S. Thorne. Gravitation (неопр.). — W.H. Freeman & Co, 1973. — ISBN 0-7167-0344-0.

Литература

  • Sternberg, Shlomo (1983), Lectures on differential geometry, New York: Chelsea, ISBN 978-0-8284-0316-0 .
  • Кильчевский Н. А. Элементы тензорного исчисления и его приложения к механике, Гостехиздат 1954 г.