УказательРазделыОбозначенияАвторО проекте


§

Вспомогательный раздел к разделу МАТРИЦА.

Страница — в разработке; начало работ — 09.10.2016, окончание — ??.??.????


Ортогональная матрица

матрица — это квадратная матрица P_{} с вещественными элементами, удовлетворяющая соотношению:

P \cdot P^{\top} = E \ ,

здесь E_{} — единичная матрица того же порядка, а {}^{\top} означает транспонирование. Иными словами, строки матрицы P_{} удовлетворяют условию

P^{[j]}\cdot \left( P^{[k]} \right)^{\top} = p_{j1}p_{k1}+p_{j2}p_{k2} + \dots + p_{jn}p_{kn}= \delta_{jk} \ ,

где \delta_{jk}^{}символ Кронекера. Если скалярное произведение строк X=(x_1,x_2,\dots,x_{n}) и Y=(y_1,y_2,\dots,y_{n}) задается стандартным способом:

\langle X,Y \rangle=x_1y_1+x_2y_2+\dots+x_ny_n \ ,

то определение ортогональной матрицы оправдано тем, что ее строки оказываются взаимно ортогональными. К тому же, они все имеют «единичную длину»: сумма квадратов элементов любой строки равна 1.

§

В литературе под ортогональной матрицей иногда понимают и матрицу с комплексными элементами, удовлетворяющую соотношению P \cdot P^{\top} = E. Тогда для матрицы из приведенного выше случая используют название вещественная ортогональная матрица.

П

Пример. Матрица

\left( \begin{array}{rr} \cos \theta & - \sin \theta \\ \sin \theta & \cos \theta \end{array} \right)

— ортогональная.

П

Пример. Единичная матрица — ортогональная. Вообще, любая диагональная матрица, элементы диагонали которой равны либо +1 либо -1 являются ортогональными. Ортгональными будут и матрицы, полученные из них произвольной перестановкой столбцов (или строк).

Одно из подмножеств таких матриц имеют специальное название.

П

Пример. Матрица P_{} называется матрицей перестановки если в любой ее строке и любом ее столбце в точности один элемент равен 1_{} при всех остальных равных 0_{}. Она тесно связана с понятием перестановки элементов. Пусть имеются различные числа1) \{\alpha_1,\dots, \alpha_n\}. Любое их упорядочивание называется перестановкой. Если имеются две перестановки одного и того же набора чисел, записываемые в виде векторов-строк: (x_1,\dots,x_{n}) и (y_1,\dots,y_n), то они связаны между собой посредством умножения на матрицу перестановки P_{} порядка n_{}:

(y_1,\dots,y_n) =(x_1,\dots,x_n)P \ .

Так, к примеру, если (y_1,y_2,y_3,y_4)=(x_2,x_4,x_3,x_1), то

(y_1,y_2,y_3,y_4)=(x_1,x_2,x_3,x_4) \left(\begin{array}{cccc} 0 & 0 & 0 & 1 \\ 1 & 0 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 1 & 0 & 0 \end{array} \right) \ .

Т

Теорема. Если матрица P_{}ортогональная, то и матрица P_{}^{\top}ортогональная, т.е. у ортогональной матрицы взаимно ортогональны не только строки, но и столбцы:

P^{\top} P = E

Т

Теорема. Если линейный оператор в \mathbb R^n задан ортогональной матрицей, то он сохраняет скалярное произведение. Иными словами, инвариантными остаются длины векторов и углы между ними.

Доказательство. Пусть столбцы X=(x_1,x_2,\dots,x_{n})^{\top}, Y=(y_1,y_2,\dots,y_{n})^{\top} связаны соотношением X=PY при ортогональной матрице P_{n\times n}. Если

Y_1 = PX_1, \ Y_2=PX_2

то

\langle Y_1,Y_2 \rangle=Y_1^{\top}Y_2 = X_1^{\top} P^{\top}P X_2 = X_1^{\top} X_2= \langle X_1,X_2 \rangle \, .

Произведение

Т

Теорема. Произведение ортогональных матриц является ортогональной матрицей.

Определитель

Т

Теорема. Определитель ортогональной матрицы равен либо +1 либо (-1).

Доказательство. В равенстве P \cdot P^{\top} = E переходим к определителям \left(\det P \right) \left(\det P^{\top} \right) = \left( \det P \right)^2=1.

=>

Для ортогональной матрицы P обратная матрица всегда существует и совпадает с ей транспонированной:

P^{-1}=P^{\top} \, .

=>

Множество ортогональных матриц одинакового порядка образует группу относительно операции умножения.

?

Будет ли эта группа коммутативной, т.е. абелевой?

Т

Теорема. Алгебраическое дополнение любого элемента ортогональной матрицы с точностью до знака совпадает с этим элементом:

P_{jk} = p_{jk} \det P \, .

=>

Для ортогональности квадратной матрицы A_{} необходимо и достаточно, чтобы ее определитель был равен либо 1 либо (-1), и для каждого ее элемента было выполнено равенство из предыдущей теоремы.

Норма

Т

Теорема. Евклидова норма ортогональной матрицы порядка n равна \sqrt{n}.

Теорема Кэли

Произвольная матрица порядка n_{} задается n^2 параметрами — своими элементами, симметричная матрица того же порядка — n(n+1)/2 элементами, кососимметричная — n(n-1)/2 элементами. Сколько параметров надо задать, чтобы определить ортогональную матрицу? Какова размерность подмножества ортогональных матриц во множестве всех матриц?

Для ответа на эти вопросы проанализируем условия ортогональности P^{\top}P=E. Для случая ортогональной матрицы порядка n=3 эти условия перепишем в виде системы

\begin{array}{cc} p_{11}^2+p_{21}^2+p_{31}^2=1, & p_{11}p_{12}+p_{21}p_{22}+p_{31}p_{32}=0, \\ p_{12}^2+p_{22}^2+p_{32}^2=1, & p_{13}p_{12}+p_{23}p_{22}+p_{33}p_{32}=0, \\ p_{13}^2+p_{23}^2+p_{33}^2=1, & p_{11}p_{13}+p_{21}p_{23}+p_{31}p_{33}=0 \end{array}

квадратных уравнений относительно 9 ее элементов. Можно ожидать, что какие-то 3 элемента могут быть выбраны произвольными, а остальные определятся из полученной системы уравнений. А в общем случае ортогональная матрица может быть задана n(n-1)/2 параметрами. Обратим внимание, что такое же количество параметров задает и произвольную кососимметричную матрицу. Возникает подозрение, что эти два типа матриц завязаны друг на друга.

Т

Теорема [Кэли]. Любая матрица P с определителем равным +1 будет ортогональной тогда и только тогда, когда ее можно представить в виде произведения

P=(E+S)(E-S)^{-1} \ ,

где Eединичная, а Sнекоторая кососимметричная матрица.

Доказательство. Если S — кососимметричная, т.е. S^{\top}=-S, то

P^{\top} = \left((E+S)(E-S)^{-1}\right)^{\top} = \left((E-S)^{\top}\right)^{-1}(E+S)^{\top}=(E+S)^{-1}(E-S) \, .
P^{\top} P= (E+S)^{-1}(E-S)(E+S)(E-S)^{-1}=(E+S)^{-1}(E+S)(E-S)(E-S)^{-1}= E ,

поскольку матрицы E-S и E+S коммутируют. Обратные к матрицам E-S и E+S всегда существует поскольку характеристический полином \det (S- \lambda E) кососимметричной матрицы не имеет вещественных корней ( кроме, возможно, \lambda=0).

Обратно, если P — ортогональная, т.е. P^{-1}=P^{\top}, то в качестве матрицы S можно взять матрицу

S=(P+E)^{-1} (P-E) \, .

Докажем, что матрица S кососимметричная. Имеем:

S=E-2(P+E)^{-1} \quad \Rightarrow
\Rightarrow S^{\top} = E-2\left((P+E)^{-1}\right)^{\top}=E-2\left((P+E)^{\top}\right)^{-1}=E-2\left(P^{\top}+E\right)^{-1}=
=E-2\left(P^{-1}+E\right)^{-1}=E-2\,P \left(E+P\right)^{-1} \quad \Rightarrow
\Rightarrow \quad S+S^{\top}=2\, E -2(P+E)^{-1}-2\,P \left(E+P\right)^{-1}= \mathbb O \, .
§

Здесь, похоже, какое-то дополнительное условие на ортогональную матрицу P требуется, блокирующее вырождение матрицы P+E

=>

Произвольная ортогональная матрица P_{} может быть представлена в виде произведения

P=J(E+S)(E-S)^{-1} \ ,

где E — единичная, S — кососимметричная, а

J = \left(\begin{array}{cccc} \varkappa_1 & 0 & \dots & 0 \\ 0 & \varkappa_2 & \dots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & 0 & \dots & \varkappa_n \end{array} \right)

— диагональная матрица, на диагонали которой стоят числа +1 или -1.

Т

Теорема [Родриг]. Любая ортогональная матрица P_{3\times 3} с определителем равным + 1 может быть представлена в виде

P=\frac{1}{1+a^2+b^2+c^2} \left[ \begin{array}{ccc} 1-a^2-b^2+c^2 & 2(a-bc) & 2(ac+b) \\ -2(a+bc) & 1-a^2+b^2-c^2 & 2(c-ab) \\ 2(ac-b) & -2(ab+c) & 1+a^2-b^2-c^2 \end{array} \right]

при некоторых вещественных значениях параметров a,b,c.

Доказательство следует из теоремы Кэли при

S=\left( \begin{array}{ccc} 0 & a & b \\ -a & 0 & c \\ -b & -c & 0 \end{array} \right) \, .

Ортогональная матрица третьего порядка

В пространстве \mathbb R^3 со стандартным скалярным произведением линейное преобразование

X=PY

с ортогональной матрицей P_{3\times 3} с определителем равным +1 определяет операцию поворота твердого тела вокруг неподвижной точки, закрепленной в начале координат X=\mathbb O.

Т

Теорема [Эйлер]. Произвольное вращение твердого тела вокруг неподвижной точки, закрепленной в начале координат, задается ортогональной матрицей

P= \left(\begin{array}{ccc} \cos \varphi \cos \psi - \cos \theta \sin \varphi \sin \psi & -\cos \varphi \sin \psi - \cos \theta \sin \varphi \cos \psi & \sin \varphi \sin \theta \\ \sin \varphi \cos \psi + \cos \theta \cos \varphi \sin \psi & -\sin \varphi \sin \psi + \cos \theta \cos \varphi \cos \psi & -\cos \varphi \sin \theta \\ \sin \psi \sin \theta & \cos \psi \sin \theta & \cos \theta \end{array} \right) \, .

Доказательство. Матрицу P можно представить в виде произведения

P= \left(\begin{array}{rrr} \cos \varphi & - \sin \varphi & 0 \\ \sin \varphi & \cos \varphi & 0 \\ 0 & 0 & 1 \end{array} \right) \cdot \left(\begin{array}{rrr} 1 & 0 & 0 \\ 0 & \cos \theta & - \sin \theta \\ 0 & \sin \theta & \cos \theta \end{array} \right) \cdot \left(\begin{array}{rrr} \cos \psi & - \sin \psi & 0 \\ \sin \psi & \cos \psi & 0 \\ 0 & 0 & 1 \end{array} \right)

трех ортогональных матриц. Первая матрица определяет вращение вокруг оси Oz на угол \varphi.

Ортогональная матрица четвертого порядка: кватернионы

Матрица

\left(\begin{array}{rrrr} x_0 & -x_1 & -x_2 & -x_3 \\ x_1 & x_0 & -x_3 & x_2 \\ x_2 & x_3 & x_0 & -x_1 \\ x_3 & -x_2 & x_1 & x_0 \end{array} \right)

является ортогональной если \sqrt{x_0^2+x_1^2+x_2^2+x_3^2}=1. Если не накладывать последнего условия, то множество подобных матриц

\{ x_0 E +x_1 \mathbf I +x_2 \mathbf J + x_3 \mathbf K \ \mid \ (x_0,x_1,x_2,x_3) \in \mathbb R^4 \}

при

E=\left(\begin{array}{cccc} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{array} \right), \ \mathbf I = \left(\begin{array}{rrrr} 0 & -1 & 0 & 0 \\ 1 & 0 & 0 & 0 \\ 0 & 0 & 0 & -1 \\ 0 & 0 & 1 & 0 \end{array} \right), \ \mathbf J = \left(\begin{array}{rrrr} 0 & 0 & -1 & 0 \\ 0 & 0 & 0 & 1 \\ 1 & 0 & 0 & 0 \\ 0 & -1 & 0 & 0 \end{array} \right), \ \mathbf K= \left(\begin{array}{rrrr} 0 & 0 & 0 & -1 \\ 0 & 0 & -1 & 0 \\ 0 & 1 & 0 & 0 \\ 1 & 0 & 0 & 0 \end{array} \right)

оказывается замкнутым относительно операций сложения и умножения. Это множество тесно связано со множеством гиперкомплексных чисел, известных как кватернионы.

Характеристический полином, собственные числа

Т

Теорема. Собственные числа ортогональной матрицы P_{} все равны 1_{} по абсолютной величине (модулю). Характеристический полином

\det (P-\lambda E)

ортогональной матрицы нечетного порядка всегда имеет корнем \lambda=+1 или \lambda=-1. Если характеристический полином не имеет корнем \lambda= +1 или же кратность этого корня — четная, то этот полином является возвратным. Если же кратность корня \lambda=+1 — нечетная, то частное

\frac{\det (P-\lambda E)}{\lambda-1}

является возвратным полиномом.

Доказательство. Если

P\mathfrak X=\lambda_{\ast} \mathfrak X \quad npu \quad \lambda_{\ast} \in \mathbb C, \mathfrak X\in \mathbb C^n, \mathfrak X \ne \mathbb O \ ,

то

\mathfrak X^{\top}P^{\top}=\lambda_{\ast} \mathfrak X^{\top} \quad \Rightarrow \quad \overline{\mathfrak X}^{\top}P^{\top}=\overline{\lambda_{\ast} } \overline{\mathfrak X}^{\top}

при \overline{ \ .} означающем комплексное сопряжение. Тогда

\left(\overline{\mathfrak X}^{\top}P^{\top} \right) P\mathfrak X = \overline{\lambda_{\ast} } \lambda_{\ast} \overline{\mathfrak X}^{\top} \mathfrak X

или

\overline{\mathfrak X}^{\top} {\mathfrak X} = \overline{\lambda_{\ast}} \lambda_{\ast} \overline{\mathfrak X}^{\top} {\mathfrak X} \quad \iff \quad (|\lambda_{\ast} |^2-1) \left( |x_1|^2+|x_2|^2+\dots + |x_n|^2\right) =0 \, .

Следовательно, |\lambda_{\ast} |=1. Если порядок матрицы нечетен, то хотя бы одно из ее собственных чисел вещественно, но тогда оно равно +1 или (-1).

Если \lambda_{\ast} является мнимым собственным числом ортогональной матрицы P, то и \overline{\lambda_{\ast}} также является ее собственным числом. Таким образом, все мнимые собственные числа ортогональной матрицы можно разбить на пары \{\lambda_{\ast}, \overline{\lambda_{\ast}} \}, и соответствующие линейные множители характеристического полинома перемножатся в виде

(\lambda-\lambda_{\ast})(\lambda-\overline{\lambda_{\ast}})\equiv \lambda^2- 2\,\mathfrak{Re}(\lambda_{\ast}) \lambda +|\lambda_{\ast}|^2 \equiv \lambda^2- 2\,\mathfrak{Re}(\lambda_{\ast}) \lambda + 1

т.е. в виде возвратного полинома. Линейный полином \lambda+1 и квадратный полином (\lambda-1)^2 являются возвратными.

Произведение возратных полиномов будет возвратным полиномом.

П

Пример. Найти характеристический полином и спектр матрицы

P= \left(\begin{array}{rrrrrrrr} -\sqrt{2}/4 & \sqrt{2}/4 & 1/2 & \sqrt{3}/6 & -\sqrt{6}/12 & -1/2 & \sqrt{3}/6 & \sqrt{6}/12 \\ -\sqrt{2}/4 & -\sqrt{2}/4 & 1/2 & -\sqrt{3}/6 & \sqrt{6}/12 & 1/2 & \sqrt{3}/6 & \sqrt{6}/12 \\ -\sqrt{2}/4 & \sqrt{2}/4 & 0 & 0 & \sqrt{6}/4 & 0 & -\sqrt{3}/3 & \sqrt{6}/12 \\ -\sqrt{2}/4 & -\sqrt{2}/4 & 0 & \sqrt{3}/3 & \sqrt{6}/12 & 0 & 0 & -\sqrt{6}/4 \\ \sqrt{2}/4 & -\sqrt{2}/4 & 1/2 & -\sqrt{3}/6 & \sqrt{6}/12 & -1/2 & -\sqrt{3}/6 & -\sqrt{6}/12 \\ \sqrt{2}/4 & \sqrt{2}/4 & 1/2 & \sqrt{3}/6 & -\sqrt{6}/12 & 1/2 & -\sqrt{3}/6 & -\sqrt{6}/12 \\ \sqrt{2}/4 & -\sqrt{2}/4 & 0 & \sqrt{3}/3 & \sqrt{6}/12 & 0 & 0 & \sqrt{6}/4 \\ \sqrt{2}/4 & \sqrt{2}/4 & 0 & 0 & \sqrt{6}/4 & 0 & \sqrt{3}/3 & -\sqrt{6}/12 \end{array} \right) \, .

Решение. Имеем:

\det(P- \lambda E)=
=\lambda^8+\left(-\frac{1}{2}-\frac{\sqrt{3}}{3}+\frac{\sqrt{2}}{2}\right)\lambda^7+\left(\frac{1}{3}+\frac{\sqrt{3}}{6} -\frac{5 \sqrt{2}}{12}-\frac{\sqrt{6}}{3}\right)\lambda^6 +
+\left(-\frac{5 \sqrt{3}}{12}+\frac{\sqrt{6}}{3}-\frac{3}{4}+\frac{\sqrt{2}}{3}\right)\lambda^5+\left(\frac{1}{3}-\frac{\sqrt{6}}{6}+\frac{11\sqrt{3}}{12}-\frac{\sqrt{2}}{2}\right)\lambda^4+\left(-\frac{5 \sqrt{3}}{12}+\frac{\sqrt{6}}{3}-\frac{3}{4}+\frac{\sqrt{2}}{3}\right)\lambda^3+
+\left(\frac{1}{3}+\frac{\sqrt{3}}{6} -\frac{5 \sqrt{2}}{12}-\frac{\sqrt{6}}{3}\right)\lambda^2+\left(-\frac{1}{2}-\frac{\sqrt{3}}{3}+\frac{\sqrt{2}}{2}\right)\lambda+1 \ ,

т.е. действительно полином является возвратным.

Теоретически, его корни можно найти в радикалах, поскольку согласно алгоритму, изложенному ЗДЕСЬ, эта задача сводится к решению уравнения 4-й степени:

-12\,w^4+(6+4\sqrt{3}-6\sqrt{2})w^3+(44-2\sqrt{3}+5\sqrt{2}+4\sqrt{2}\sqrt{3})w^2+
+(-9-7\sqrt{3}+14\sqrt{2}-4\sqrt{6})w-20-7\sqrt{3}-4\sqrt{2}-6\sqrt{6}=0 \, .

Но я ограничусь здесь приближенными значениями

\lambda_{1,2}\approx -0.907626 \pm 0.419779 \mathbf i, \ \lambda_{3,4}\approx -0.503048\pm 0.864258 \mathbf i ,
\lambda_{5,6}\approx 0.602940 \pm 0.797785 \mathbf i, \ \lambda_{7,8}\approx 0.992855 \pm 0.119324 \mathbf i \, .

Применения

QR-разложение матрицы

Т

Теорема [о QR-разложении]. Для любой вещественной неособенной матрицы A_{n\times n}^{} существует вещественные ортогональная матрица Q_{n\times n} и верхнетреугольная матрица R_{n\times n}, такие, что

A=Q \cdot R \, .

§

Этот результат является следствием алгоритма ортогонализации Грама-Шмидта столбцов матрицы A_{}.

§

Результат может быть обобщен и на случай неквадратной вещественной матрицы A_{m\times n}^{}, n<m ранга n ; матрица Q_{m\times n}^{} в QR-разложении будет иметь столбцы ортонормированными.

Сингулярное разложение матрицы

Т

Теорема (о сингулярном разложении). Для матрицы A \in \mathbb R^{m\times n}, \operatorname{rank} (A)=\mathfrak r существует представление ее в виде произведения

A=V \Sigma W^{\top} \, .

Здесь

\Sigma=\left( \begin{array}{cccc|c} \sigma_1 & & & & \\ & \sigma_2 & & &\mathbb O_{{\mathfrak r}\times (n-{\mathfrak r})}\\ & &\ddots& & \\ & & & \sigma_{\mathfrak r} & \\ & & & & \\ \hline &\mathbb O_{(m-{\mathfrak r})\times {\mathfrak r}} & & & \mathbb O_{(m-{\mathfrak r})\times (n-{\mathfrak r})} \end{array} \right)

Числа \sigma_1, \sigma_2,\dots,\sigma_{\mathfrak r} расположены в порядке неубывания:

\sigma_1\ge \sigma_2 \ge \dots \ge \sigma_{\mathfrak r} > 0

и равны арифметическим квадратным корням из ненулевых собственных чисел матрицы A \cdot A^{\top}

\{\sigma_j= |\lambda_j| \}_{j=1}^{\mathfrak r}

где \lambda_1^2, \lambda_2^2,\dots, \lambda_{\mathfrak r}^2 корни уравнения

\det ( A \cdot A^{\top}-\lambda E) =0 \, .
V= \left[ V_{[1]}| V_{[2]}|\dots | V_{[m]} \right],\ npu \ ( A \cdot A^{\top}-\lambda_j^2 E) V_{[j]} = \mathbb O_{m\times 1} \, .
W= \left[ W_{[1]}|W_{[2]}|\dots | W_{[n]} \right],\ npu \ ( A^{\top} A -\lambda_j^2 E) W_{[j]} = \mathbb O_{n\times 1} \, .

§

Подробнее ЗДЕСЬ.

Источники

[1]. Rodrigues O. Des lois géométriques qui régissent les déplacements d'un système solide dans l'espace, et de la variation des coordonnées provenant de ces déplacements considérés indépendamment des causes qui peuvent les produire. Journal de Mathématiques Pures et Appliquées. 1840. V. 5, 380–440

[2]. Проскуряков И.В. Сборник задач по линейной алгебре. М.Наука. 1974; задача N 896.

1) Все последующие рассуждения будут справедливы и для элементов любой природы, для которых умножение на 0_{} и 1_{} определяется как для чисел.

2018/12/14 14:11 редактировал au