УказательРазделыОбозначенияАвторО проекте


!

Материал настоящего раздела традиционно считается сложным для понимания. Предполагается знакомство с разделом ЛИНЕЙНЫЙ ОПЕРАТОР.


Жорданова нормальная форма

Задача. Найти базис пространства \mathbb V_{}, в котором матрица линейного оператора \mathcal A_{} имеет наиболее простой вид.

§

Всюду в настоящем разделе под словом оператор понимается линейный оператор.

Жорданова нормальная форма над полем комплексных чисел

В настоящем пункте пространство \mathbb V_{} размерности \dim \mathbb V_{} = n предполагается комплексным.

Общая схема

В пункте ДИАГОНАЛИЗУЕМОСТЬ МАТРИЦЫ ОПЕРАТОРА было установлено, что если возможно найти базис пространства \mathbb V_{}, состоящий из собственных векторов оператора, то в этом базисе матрица оператора будет диагональной. В частности, существование такого базиса всегда гарантировано в случае, когда характеристический полином оператора \mathcal A_{} имеет только простые корни: в этом случае система из собственных векторов оператора, принадлежащие различным собственным числам, гарантировано линейно независима. Случай наличия кратных корней

f(\lambda)= \det (\mathcal A - \lambda \mathcal E) \equiv (-1)^n(\lambda - \lambda_1)^{{\mathfrak m}_1} \times \dots \times (\lambda - \lambda_{{\mathfrak r}})^{ {\mathfrak m}_{{\mathfrak r}}} \quad ;
{\mathfrak m}_1+\dots+{\mathfrak m}_{{\mathfrak r}}=n, \ \lambda_k \ne \lambda_{\ell} \ npu \ k \ne \ell,

при хотя бы одном {\mathfrak m}_j>1 оказывается «пограничным»: оператор может оказаться как диагонализуемым, так и недиагонализуемым.

Стратегия действий: пространство \mathbb V_{} удается разбить в прямую сумму подпространств

\mathbb V_{} =\mathbb V_1 \oplus \dots \oplus \mathbb V_{\mathfrak r}\ , \quad \dim \mathbb V_j={\mathfrak m}_j

инвариантных относительно \mathcal A_{}: \mathcal A(\mathbb V_j) \subset \mathbb V_j. При этом \mathbb V_j обязательно будет включать собственные векторы, принадлежащие \lambda_{j}, но, помимо них — в случае когда алгебраическая кратность собственного числа превосходит его геометрическую кратность:

{\mathfrak m}_j > \ell_j = \operatorname{dfc} (\mathcal A - \lambda_j {\mathcal E})

— и другие: так называемые, корневые. На основании теоремы из ПУНКТА в базисе \mathbb V_{}, составленном объединением базисов \mathbb V_j, матрица оператора будет иметь блочно-диагональный вид

\left( \begin{array}{cccc} \mathbf A_1 & \mathbb O & \dots & \mathbb O \\ \mathbb O & \mathbf A_2 & \dots & \mathbb O \\ & & \ddots & \\ \mathbb O & \mathbb O & \dots & \mathbf A_{{\mathfrak r}} \end{array} \right) \quad , \quad здесь \ \mathbf A_j - матрица порядка \ {\mathfrak m}_j\times {\mathfrak m}_j \ .

Каждый из базисов составляющих \mathbb V_{} подпространств \mathbb V_j удается подобрать так, чтобы матрица \mathbf A_j имела снова блочно-диагональный вид

\mathbf A_j= \left( \begin{array}{cccc} {\mathbf A}_{j1} & \mathbb O & \dots & \mathbb O \\ \mathbb O & {\mathbf A}_{j2} & \dots & \mathbb O \\ & & \ddots & \\ \mathbb O & \mathbb O & \dots & {\mathbf A}_{j \ell_j} \end{array} \right)

где на диагонали стоят матрицы вида

{\mathfrak J}_k (\lambda_j) = \left( \begin{array}{cccccc} \lambda_j & 0 & 0 & \dots & 0 & 0 \\ 1 & \lambda_j & 0 & \dots & 0 & 0 \\ 0 & 1 & \lambda_j & \dots & 0 & 0 \\ \vdots & & \ddots & \ddots& & \vdots \\ 0 & 0 & 0 & \dots & 1 & \lambda_j \end{array} \right)_{k \times k}

называемые (нижними) клетками Жордана.

Указанный вид матрицы оператора \mathcal A называется канонической формой Жордана1) или жордановой нормальной формой (ЖНФ), а соответствующий базис пространства — каноническим базисом. Жорданову нормальную форму оператора \mathcal A будем обозначать \mathbf A_{_{\mathfrak J}}.

§

Частным видом ЖНФ является диагональный:

\mathbf A_{_{\mathfrak J}} = A_{diag}= \left( \begin{array}{cccc} \lambda_1 & 0 & \dots & 0 \\ 0 & \lambda_2 & \dots & 0 \\ & & \ddots & \\ 0 & 0 & \dots & \lambda_n \end{array} \right) \ ;

в этом случае все клетки Жордана — первого порядка.

На языке матричного формализма задача построения ЖНФ и канонического базиса может быть переформулирована следующим образом. Пусть имеется некоторый имеется некоторый исходный базис \{X_1,\dots,X_n\} пространства \mathbb V_{}, в котором матрица оператора равна \mathbf A_{}. Требуется найти матрицу перехода C_{} от этого базиса к некоторому новому, обеспечивающую выполнение равенства

C^{-1} \mathbf A C = \mathbf A_{_{\mathfrak J}} \ ;

про матрицу \mathbf A_{_{\mathfrak J}} заранее известна лишь та информация, что все ее элементы — нулевые, за исключением разве лишь элементов двух ее диагоналей — главной и следующей за ней вниз.

§

Очень часто в приложениях ставится задача нахождения формы Жордана \mathbf A_{_{\mathfrak J}} и матрицы C_{}, связанных с заданной матрицей \mathbf A_{} последним равенством; при этом напрямую не ассоциируют исходную матрицу \mathbf A_{} с каким-либо оператором — и вообще с каким-то пространством. С формальной точки зрения, нужно было бы формулировать задачу о каноническом базисе оператора X \mapsto \mathbf A \cdot X при X\in \mathbb C^n и исходном базисе пространства, состоящем из векторов

\{{\mathfrak e}_j = \big[\underbrace{0,\dots,0,1}_{j},0,\dots,0\big]^{\top} \}_{j=1}^n \ .

Однако, в примерах, рассмотренных ниже, я буду просто говорить на языке подобных матриц, ставя задачу о приведении матрицы \mathbf A_{} к ЖНФ.

§

Даже при формальном совпадении характеристических полиномов двух операторов \mathcal A_1 и \mathcal A_2 их жордановы нормальные формы могут быть различными. Однако для каждого оператора ЖНФ определяется единственным образом — с точностью до перестановки клеток Жордана на диагонали.

Аннулирующий полином

Пусть g(\lambda),g_1(\lambda),g_2(\lambda) — произвольные полиномы над \mathbb C_{}.

Говорят, что операторный полином g(\mathcal A)аннулирующий для вектора X\in \mathbb V_{} если g(\mathcal A)(X)=\mathbb O.

Т

Теорема 1. Множество векторов X_{}\in \mathbb V аннулируемых g(\mathcal A) образует линейное подпространство пространства \mathbb V_{}.

Доказательство. Действительно, это множество является ядром оператора g(\mathcal A) и по теореме 1 из ПУНКТА, оно является линейным подпространством.

Т

Теорема 2. Если полиномы g_1(\lambda) и g_2(\lambda) взаимно просты: \operatorname{HOD} (g_1,g_2)=1, то подпространства векторов, аннулируемых g_1(\mathcal A) и g_2(\mathcal A) имеют тривиальное пересечение.

Доказательство. Если \operatorname{HOD} (g_1,g_2)=1, то существуют полиномы \{ p_1(\lambda),p_2(\lambda)\} \subset \mathbb C[\lambda] обеспечивающие выполнение тождества Безу:

p_1(\lambda)g_1(\lambda)+p_2(\lambda)g_2(\lambda) \equiv 1 \ .

Тогда при подстановке в это тождество оператора получим:

p_1(\mathcal A)g_1(\mathcal A)+p_2(\mathcal A)g_2(\mathcal A) = \mathcal E \ ,

где \mathcal E — тождественный оператор.

Если существует X \in \mathbb V_{} такой, что g_1(\mathcal A)(X)=\mathbb O и g_2(\mathcal A)(X)=\mathbb O, то из последнего тождества следует, что

p_1(\mathcal A)g_1(\mathcal A)(X)+p_2(\mathcal A)g_2(\mathcal A)(X) = \mathcal E(X) \quad \Longrightarrow \mathbb O=X \ .

Т

Теорема 3. Если полиномы g_1(\lambda) и g_2(\lambda) взаимно просты и вектор X\ne \mathbb O аннулируется произведением g_1(\mathcal A)g_2(\mathcal A), то этот вектор можно представить в виде суммы X=X_1+X_2, где X_{j} аннулируется g_j(\mathcal A).

Доказательство. Воспользуемся равенством из последней теоремы:

\underbrace{p_1(\mathcal A)g_1(\mathcal A)(X)}_{= X_2}+ \underbrace{p_2(\mathcal A)g_2(\mathcal A)(X)}_{= X_1} = \mathcal E (X)=X \ .

Тогда g_2(\mathcal A)(X_2)=p_1(\mathcal A)g_1(\mathcal A)g_2(\mathcal A)(X)=p_1(\mathcal A)(\mathbb O)=\mathbb O, т.е. X_2 аннулируется g_2(\mathcal A). Аналогично доказывается, что g_1(\mathcal A)(X_1)=\mathbb O.

=>

Если вектор X_{} аннулируется произведением g(\mathcal A)=g_1(\mathcal A)\times \dots \times g_{{\mathfrak r}}(\mathcal A) где полиномы g_1(\lambda),\dots, g_{{\mathfrak r}}(\lambda) попарно взаимно просты, то его можно представить в виде суммы X=X_1+\dots+X_{{\mathfrak r}}, где X_j аннулируется g_j(\mathcal A).


Полином g(\lambda) \not\equiv 0 называется аннулирующим полиномом оператора \mathcal A_{} если g(\mathcal A)= \mathcal O.


П

Пример. В пространстве \mathbb P_3 полиномов с вещественными коэффициентами степеней \le 3 оператор \mathcal A_{} действует по правилу

\mathcal A (F(x)) = F(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ ,

т.е. полином F_{}(x) отображается в остаток от деления произведения F(x) (x^2-2) на x^4-x^3-x^2+x. Найти аннулирующий полином оператора.

Решение. Поскольку про аннулирующий полином g(\lambda) нам заранее не известна даже его степень, будем искать подбором как его степени (идя по возрастанию), так и его коэффициентов. Пусть

g(\lambda) = A_0 + A_1 \lambda+ A_2 \lambda^2+ \dots .

Условие g(\mathcal A)= \mathcal O перепишем в виде

A_0 \mathcal E + A_1 \mathcal A+ A_2 \mathcal A^2+ \dots = \mathcal O \ .

В примере ПУНКТА степень оператора \mathcal A^K вычислялась формулой

\mathcal A^k(F(x))=(x^2-2)^K F(x) \pmod{x^4-x^3-x^2+x} \ .

Исходя из этого, аннулирующий полином должен обеспечивать выполнение условия

( A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2+ \dots) F(x) \equiv 0 \ \pmod{x^4-x^3-x^2+x} ;

причем это тождество должно быть выполнено для любого полинома F_{}(x). Отсюда следует, что полином ( A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2+ \dots) должен делиться нацело на x^4-x^3-x^2+x. Для удовлетворения этого требования, делаем теперь гипотезу о степени этого полинома и пробуем подобрать коэффициенты. Предположим, что \deg g \le 1, но такой полином может делиться на полином степени 4_{} только при условии выполнения равенств A_0=0,A_1=0; что нас совершенно не интересует. Пусть \deg g=2, тогда если полином A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2 делится на полином степени 4_{}, то должен отличаться от делителя только постоянным множителем:

A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2 \equiv C (x^4-x^3-x^2+x) \quad npu \quad C \in \mathbb C \ .

Легко проверить, что это возможно только в тривиальном случае: A_0=0,A_1=0,A_2=0. Случай \deg g=3 требует уже более сложных расчетов: произведем деление с остатком

A_0 + A_1 (x^2-2)+ A_2 (x^2-2)^2+ A_3 (x^2-2)^3 \equiv
\equiv (A_2-4\,A_3)\,x^3+(A_1-3\,A_2+7\,A_3)\,x^2+(-A_2+4\,A_3)\,x+A_0-2\,A_1+4\,A_2-8\,A_3 \pmod{x^4-x^3-x^2+x} \ .

Остаток будет тождественно равен нулю тогда и только тогда, когда

A_2=4\,A_3,\ A_1=5\, A_3,\ A_0=2\, A_3 \ .

Эти условия — с точностью, до постоянного сомножителя — определяют аннулирующий полином .

Ответ. Аннулирующим полиномом минимально возможной степени является \lambda^3+4\, \lambda^2+ 5\, \lambda+2.


Аннулирующий полином оператора \mathcal A_{} минимально возможной степени называется минимальным аннулирующим полиномом.


Существование хотя бы одного аннулирующего полинома оператора гарантируется теоремой Гамильтона-Кэли: если f(\lambda) — характеристический полином оператора \mathcal A_{}, то f(\mathcal A)={\mathcal O}. Таким образом, можно утверждать, что для минимального аннулирующего полинома выполняется условие \deg g \le \dim \mathbb V. Предыдущий пример показывает, что это неравенство может оказаться и строгим. Обратим внимание, что для оператора из этого примера характеристический полином равен (\lambda+2)(\lambda+1)^3 и полученный аннулирующий полином является его делителем: он равен (\lambda+2)(\lambda+1)^2.

Т

Теорема 4. Аннулирующий полином g(\lambda_{}) оператора \mathcal A_{} имеет те же корни, что и характеристический полином этого оператора.

Доказательство от противного. Пусть \lambda_{\ast} \in \mathbb C — корень характеристического полинома оператора \mathcal A_{}, но g(\lambda_{}) не имеет \lambda_{\ast} корнем. Числу \lambda_{\ast} принадлежит корневой вектор \mathfrak X_{\ast} высоты 1_{} (собственный вектор) оператора \mathcal A_{}: (\mathcal A- \lambda_{\ast} \mathcal E)(\mathfrak X_{\ast})=\mathbb O. С другой стороны, поскольку \operatorname{HOD}( g(\lambda_{}), \lambda- \lambda_{\ast})=1, то, по теореме 2, вектор \mathfrak X_{\ast} не должен аннулироваться оператором g(\mathcal A). Однако это противоречит предположению о том, что g(\mathcal A) — аннулирующий полином оператора.

Т

Теорема 5. Минимальный аннулирующий полином оператора является делителем его характеристического полинома. Два минимальных аннулирующих полинома оператора различаются, разве лишь, постоянным множителем.

Доказательство. Предположим противное: пусть минимальный аннулирующий полином g(\lambda) не является делителем f(\lambda). Тогда при делении f(\lambda) на g(\lambda) возникает нетривиальный остаток:

f(\lambda)\equiv g(\lambda) q(\lambda) + r(\lambda) \quad npu \quad \deg r < \deg g \ .

Поскольку f(\lambda) и g(\lambda) — аннулирующие для \mathcal A, то и r(\lambda)= f(\lambda) - g(\lambda) q(\lambda) является аннулирующим. Но это противоречит тому, что, по предположению, g(\lambda)минимальный аннулирующий полином.

Если \tilde g(\lambda) — еще один минимальный аннулирующий полином оператора, то обязательно \deg \tilde g = \deg g. Если предположить, что у полиномов g(\lambda) и \tilde g(\lambda) имеются различные сомножители, то полином \operatorname{HOD}(g(\lambda), \tilde g(\lambda)) будет иметь степень меньшую \deg \tilde g = \deg g. Для \operatorname{HOD}(g(\lambda), \tilde g(\lambda)) имеет место линейное представление:

\operatorname{HOD}(g(\lambda), \tilde g(\lambda)) \equiv p_1(\lambda) g(\lambda) + p_2(\lambda) \tilde g(\lambda) \ \ npu \quad \{p_1(\lambda),p_2(\lambda) \} \subset \mathbb C[\lambda] .

Тогда \operatorname{HOD}(g(\lambda), \tilde g(\lambda)) является аннулирующим полиномом оператора. Но тогда g(\lambda) и \tilde g(\lambda) не могут быть минимальными аннулирующими.

Следствиями теорем 4 и 5 является следующий результат.

=>

Минимальный аннулирующий полином оператора \mathcal A_{} совпадает (с точностью до постоянного сомножителя) с характеристическим полиномом этого оператора при условии отсутствия у этого полинома кратных корней. В общем случае, пусть разложение характеристического полинома оператора имеет вид

f(\lambda)= \det (\mathcal A - \lambda \mathcal E) \equiv (-1)^n(\lambda - \lambda_1)^{{\mathfrak m}_1} \times \dots \times (\lambda - \lambda_{{\mathfrak r}})^{ {\mathfrak m}_{{\mathfrak r}}} \quad ; \quad {\mathfrak m}_1+\dots+{\mathfrak m}_{{\mathfrak r}}=n, \ \lambda_k \ne \lambda_{\ell} \ npu \ k \ne \ell.

Минимальный аннулирующий полином имеет вид

g(\lambda)=(\lambda-\lambda_1)^{\mathfrak n_1}\times \dots \times (\lambda-\lambda_{\mathfrak r})^{\mathfrak n_{\mathfrak r}} ,

где показатели \{\mathfrak n_j \}_{j=1}^{\mathfrak r} могут принимать значения из множеств \{\{1,\dots,\mathfrak m_j \}\}_{j=1}^{\mathfrak r}.

!

Конструктивное построение минимального аннулирующего полинома произвольного оператора довольно громоздко; структура его линейных множителей напрямую связана со структурой Жордановой нормальной формы. В литературе излагается [2] метод построения ЖНФ на основе информации о минимальном аннулирующем полиноме, но я в дальнейшем не использую эту конструкцию.

Теорема Гамильтона-Кэли эквивалентна равенству

(\mathcal A- \lambda_1 \mathcal E)^{{\mathfrak m}_1} \times \dots \times (\mathcal A - \lambda_{{\mathfrak r}}\mathcal E)^{ {\mathfrak m}_{{\mathfrak r}}} = \mathcal O \ .

Из следствия к теореме 3 тогда вытекает, произвольный вектор X_{} \in \mathbb V может быть представлен в виде суммы

X=X_1+\dots+X_{{\mathfrak r}} \ , \qquad где \ X_j \quad аннулируется \ \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j} \ .

и такое представление единственно, т.е. \mathbb V_{} раскладывается в прямую сумму

\mathbb V= \mathbb V_1\oplus \dots \oplus \mathbb V_{{\mathfrak r}} \ , \qquad где \ \mathbb V_{j} аннулируется \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j } \ .
Т

Теорема 6. Линейное подпространство векторов аннулируемых \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j} инвариантно относительно \mathcal A_{}.

Доказательство. Действительно, если \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j}(X)=\mathbb O, то и \left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j}(\mathcal A(X))=\mathcal A(\left(\mathcal A - \lambda_j \mathcal E \right)^{{\mathfrak m}_j}(X))= \mathbb O.

=>

На основании теоремы из ПУНКТА в базисе \mathbb V_{}, составленном объединением базисов \mathbb V_j, матрица оператора будет иметь блочно-диагональный вид

\left( \begin{array}{cccc} \mathbf A_1 & \mathbb O & \dots & \mathbb O \\ \mathbb O & \mathbf A_2 & \dots & \mathbb O \\ & & \ddots & \\ \mathbb O & \mathbb O & \dots & \mathbf A_{{\mathfrak r}} \end{array} \right) \ .

Итак, мы следуем изложенной в начале раздела схеме; остается только подобрать хорошие базисы для самих подпространств \mathbb V_j.

Корневое подпространство

Задача. Построить такой базис подпространства \mathbb V_j, в котором соответствующий блок {\mathbf A}_j матрицы оператора \mathcal A_{} будет состоять из клеток Жордана.

Ненулевой вектор X_{}\in \mathbb V называется корневым вектором оператора \mathcal A_{}, принадлежащим собственному числу \lambda_{j}^{} если он аннулируется оператором (\mathcal A - \lambda_{j} \mathcal E)^k при некотором k_{}\in \mathbb N: (\mathcal A - \lambda_{j} \mathcal E)^k(X)=\mathbb O. Наименьший из показателей k_{} с таким свойством называется высотой корневого вектора X_{}:

. Высота \ (X) = h \iff (\mathcal A - \lambda_{j} \mathcal E)^h(X)=\mathbb O,\ (\mathcal A - \lambda_{j} \mathcal E)^{h-1}(X)\ne \mathbb O \ .
П

Пример 1. Любой собственный вектор оператора \mathcal A_{} будет его корневым высоты 1_{}.

Рассмотрим теперь пример, разобранный в ПУНКТЕ.

П

Пример 2. В пространстве \mathbb P_3 полиномов с вещественными коэффициентами степеней \le 3 оператор \mathcal A_{} действует по правилу

\mathcal A (f(x)) = F(x) (x^2-2) \pmod{x^4-x^3-x^2+x} \ ,

т.е. полином F_{}(x) отображается в остаток от деления произведения F(x) (x^2-2) на x^4-x^3-x^2+x. Найти корневые векторы этого оператора.

Решение. Оператор имеет два собственных числа \lambda_1=-2 и \lambda_2=-1, причем последнее — кратности 3_{}. Корневыми векторами высоты 1_{} являются собственные векторы, принадлежащие этим собственным числам, т.е.

\{ t(x+1)(x-1)^2 \ \mid \ t\ne 0 \} \quad и \quad \{ (t_1x+t_2)x(x-1) \ \mid \ (t_1,t_2) \ne (0,0) \}

соответственно.

Далее, ищем корневые векторы высоты 2_{}, принадлежащие собственному числу \lambda_1=-2.

(\mathcal A +2 \, \mathcal E)^2 (F(x))=x^4 F(x) \pmod{x^4-x^3-x^2+x}

и наша задача состоит в нахождении полинома F_{}(x), для которого последнее выражение равно тождественно нулевому полиному. Очевидно, что множество всех таких полиномов

\{ t(x^3-x^2-x+1) \ \mid \ t\ne 0 \}

совпадает с уже полученным выше множеством собственных векторов (полиномов). Понятно также, что дальнейшее увеличение степени оператора (\mathcal A +2 \, \mathcal E) иных полиномов не даст. Следовательно, рассматриваемому собственному числу принадлежат только корневые векторы (полиномы) высоты 1_{}.

Для собственного числа \lambda_1=-1 сценарий оказывается несколько менее тривиальным:

(\mathcal A +\mathcal E)^2 (F(x))=(x^2-1)^2 F(x) \pmod{x^4-x^3-x^2+x} \ .

Полином (x^2-1)^2 F(x) делится нацело на x(x+1)(x-1)^2 при полиноме

F_{}(x) \in \{ (u_1x^2+u_2x+u_3)x \mid \ (u_1,u_2,u_3) \in \mathbb R^3 \} \ .

Некоторое подмножество этого множества составляют собственные векторы (полиномы):

\{ (t_1x+t_2)(x-1)x \ \mid \ (t_1,t_2) \in \mathbb R^2 \} \ \subset \{ (u_1x^2+u_2x+u_3)x \mid \ (u_1,u_2,u_3) \in \mathbb R^3 \} ,

но появляются и корневые векторы (полиномы) высоты 2_{}. Чтобы понять какие это векторы обратим внимание, что полиномы из левого множества все делятся на (x-1), т.е. имеют корнем 1_{}. Следовательно высоту 2_{} будут иметь полиномы (u_1x^2+u_2x+u_3)x, для которых 1_{} не является корнем, т.е. удовлетворяющие условию u_1+u_2+u_3 \ne 0.

Если мы попытаемся найти полиномы высоты 3_{}, то нас ожидает неудача — множество решений (\mathcal A +\mathcal E)^3 (F(x)) совпадает с предыдущим.

П

Пример 3. Найти корневые векторы матрицы

\mathbf A=\left( \begin{array}{rrrrrrrr} 3 & 0 & 1 & 1 & 0 & 1 & -1 & 0 \\ 0 & 3 & -2 & -1 & -1 & -2 & 1 & -1 \\ 2& 3 & 0 & 0 & -2 & -2 & 0 & -2 \\ -3 & -3 & 1 & 1 & 2 & 1 & 1 & 2 \\ -1 & -1 & 0 & 0 & 2 & -1 & 1 & 0 \\ -1 & -1 & 0 & -1 & 1 & 3 & 0 & 1 \\ -1 & -1 & 0 & -1 & 1 & 1 & 2 & 1 \\ 0& 0& 0 & 0 & 0 & 0 & 0 & 2 \end{array} \right) \ .

Решение. \det (\mathbf A- \lambda E) \equiv ( \lambda -2)^8. У матрицы имеется единственное собственное число \lambda_1=2 алгебраической кратности 8_{}. Составим матрицу

\mathbf B=\mathbf A- 2\, E= \left( \begin{array}{rrrrrrrr} 1 & 0 & 1 & 1 & 0 & 1 & -1 & 0\\ 0 & 1 & -2 & -1 & -1 & -2 & 1 & -1\\ 2 & 3 & -2 & 0 & -2 & -2 & 0 & -2\\ -3 & -3 & 1 & -1 & 2 & 1 & 1 & 2\\ -1 & -1 & 0 & 0 & 0 & -1 & 1 & 0\\ -1 & -1 & 0 & -1 & 1 & 1 & 0 & 1\\ -1 & -1 & 0 & -1 & 1 & 1 & 0 & 1\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \end{array} \right)

и найдем корневые векторы высоты 1_{} как решения системы однородных уравнений \mathbf B X = \mathbb O. Методом Гаусса сводим эту систему к

\left( \begin{array}{rrrrrrrr} 1 & 0 & 1 & 1 & 0 & 1 & -1 & 0\\ 0& 1 & -2 & -1 & -1 & -2 & 1 & -1 \\ 0 & 0 & 2 & 1 & 1 & 2 & -1 & 1\\ 0& 0 & 0 & 1 & -1 & -2 & 1 & -1 \end{array} \right) X = \mathbb O \iff
\iff \quad \left\{ \begin{array}{rrrrrrrrr} x_1 & & -x_3 & +x_4 & +x_5 & & & & =0,\\ & x_2 & & & & & & & =0, \\ & & x_3 & +x_4 & & & & & =0,\\ & & & x_4 & -x_5 & -2\,x_6 & +x_7 & -x_8 & = 0. \end{array} \right.

Геометрическая кратность собственного числа равна 4_{}. Строим фундаментальную систему решений (ФСР) для этой системы; переменные x_5,x_6,x_7,x_8 можно взять в качестве основных:

\begin{array}{rrrr|rrrr} x_1 & x_2 & x_3 & x_4 & x_5 & x_6 & x_7 & x_8 \\ \hline 0 & 0 & -1 & 1 & 1 & 0 & 0 & 0 \\ -1 & 0 & -2 & 2 & 0 & 1 & 0 & 0 \\ 1 & 0 & 1 & -1 & 0 & 0 & 1 & 0 \\ 0 & 0 & -1 & 1 & 0 & 0 & 0 & 1 \end{array}

Таким образом, ФСР состоит из векторов

X_1=[0,0,-1,1,1,0,0,0]^{\top},\ X_2=[-1,0,-2,2,0,1,0,0]^{\top},
X_3=[1,0,1,-1,0,0,1,0]^{\top},\ X_4=[0,0,-1,1,0,0,0,1]^{\top} \ .

Любая нетривиальная линейная комбинация \alpha_1X_1+\alpha_2X_2+\alpha_3X_3+\alpha_4X_4 будет корневым вектором высоты 1_{}.

Теперь отыщем корневые векторы высоты 2_{}. Для этого вычислим матрицу \mathbf B^2 и решим систему уравнений \mathbf B^2 X=\mathbb O:

\left( \begin{array}{rrrrrrrr} 0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\ 1 & 0 & 1 & 1 & 0 & 1 & -1 & 0\\ 2 & 1 & 0 & 1 & -1 & 0 & -1 & -1\\ -2 & -1 & 0 & -1 & 1 & 0 & 1 & 1\\ -1 & -1 & 1 & 0 & 1 & 1 & 0 & 1\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \end{array} \right) X = \mathbb O \quad \iff
\iff \quad \left\{ \begin{array}{rrrrrrrrr} x_1 & & +x_3 & +x_4 & & +x_6 & -x_7 & & =0,\\ & x_2 & -2\,x_3 & -x_4 & -x_5 & -2\,x_6 & +x_7 & -x_8 & =0. \end{array} \right.

Для этой системы ФСР состоит из 6_{} векторов и ее можно строить разными способами. Например, ее можно строить дополнением системы корневых векторов высоты 1_{} — это позволит выделить корневые векторы высоты большей 1_{}. Для того, чтобы организовать такую процедуру пополнения достаточно перебросить часть переменных, которые были зависимыми при нахождении ФСР в предыдущей системе \mathbf B X= \mathbb O, к основным переменным. Такими переменными можно взять x_{3} и x_{4}:

\begin{array}{rr|rrrrrr} x_1 & x_2 & x_3 & x_4 & x_5 & x_6 & x_7 & x_8 \\ \hline -1 & 2 & 1 & 0 & 0 & 0 & 0 & 0 \\ -1 & 1 & 0 & 1 & 0 & 0 & 0 & 0 \\ \hline 0 & 0 & -1 & 1 & 1 & 0 & 0 & 0 \\ -1 & 0 & -2 & 2 & 0 & 1 & 0 & 0 \\ 1 & 0 & 1 & -1 & 0 & 0 & 1 & 0 \\ 0 & 0 & -1 & 1 & 0 & 0 & 0 & 1 \end{array}

Векторы

X_5 = [-1, 2, 1, 0, 0, 0, 0, 0]^{\top} \quad u \quad X_6 = [-1, 1, 0, 1, 0, 0, 0, 0]^{\top}

являются корневыми векторами высоты 2_{}, и такая же высота будет у любого вектора

\alpha_1X_1+\alpha_2X_2+\alpha_3X_3+\alpha_4X_4 + \beta_1 X_5 + \beta_2 X_6 \quad npu \quad \{\alpha_1,\dots,\alpha_4, \beta_1, \beta_2\} \subset \mathbb C, |\beta_1|+ |\beta_2| \ne 0 \ .

Далее, для нахождения корневых векторов высоты 3_{} решим систему \mathbf B^3 X=\mathbb O:

\left( \begin{array}{rrrrrrrr} 0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\ 1 & 0 & 1 & 1 & 0 & 1 & -1 & 0\\ -1 & 0 & -1 & -1 & 0 & -1 & 1 &0\\ -1 & 0 & -1 & -1 & 0 & -1 & 1 &0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 &0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 &0 \end{array} \right) X = \mathbb O \quad \iff
\iff \quad x_1+x_3 +x_4+x_6 -x_7 =0 \ .

Снова строим ФСР дополнением ранее полученных векторов X_1,\dots,X_6. В разряд основных переменных переходит x_{2} и вектором высоты 3_{} будет

X_7=[0,1,0,0,0,0,0,0]^{\top} \ .

Очередное возведение в степень матрицы \mathbf B приводит к нулевой матрице: \mathbf B^4=\mathbb O. Любой вектор \mathbb C^8 является решением системы \mathbf B^4X=\mathbb O. Вектором высоты 4_{} возьмем вектор

X_8=[1,0,0,0,0,0,0,0]^{\top} \ .

Векторов высоты большей 4_{} у матрицы нет.

Т

Теорема 7. Высота корневого вектора, принадлежащего \lambda_{j}^{}, не превосходит кратности этого числа в характеристическом полиноме (т.е. его алгебраической кратности).

§

В дальнейшем максимально возможную высоту корневого вектора для числа \lambda_{j}^{} будем обозначать \mathfrak h_j.

Доказательство. Пусть существует вектор X_{}\in \mathbb V такой, что

(\mathcal A - \lambda_j {\mathcal E})^{\mathfrak h_j}(X)=\mathbb O,\quad (\mathcal A - \lambda_j {\mathcal E})^{\mathfrak h_j-1}(X) \ne \mathbb O

при \mathfrak h_j>{\mathfrak m}_j. Обозначим

\widetilde X = (\mathcal A - \lambda_j {\mathcal E})^{{\mathfrak m}_j}(X),\quad g(\lambda) = f(\lambda)/(\lambda-\lambda_j)^{{\mathfrak m}_j} \ .

По определению, вектор \widetilde X — корневой, принадлежащий \lambda_{j}^{}, высоты \mathfrak h_j-{\mathfrak m}_j. Поскольку g(\lambda) не имеет корнем \lambda_{j}^{}, то \operatorname{HOD} (g(\lambda),(\lambda-\lambda_j)^{\mathfrak h_j-{\mathfrak m}_j})=1. По теореме 2: g(\mathcal A)(\widetilde X)\ne \mathbb O. Но тогда

g(\mathcal A)(\mathcal A - \lambda_j {\mathcal E})^{{\mathfrak m}_j}(X)\ne \mathbb O \Longrightarrow f(\mathcal A)(X)\ne \mathbb O \ ,

что противоречит тому, что f(\mathcal A)={\mathcal O}.

Т

Теорема 8. Множество корневых векторов, принадлежащих \lambda_{j}^{}, дополненное нулевым вектором, образует линейное подпространство.

Это подпространство, которое мы выше обозначали \mathbb V_{j}, называется корневым подпространством оператора \mathcal A_{}, принадлежащим данному собственному числу \lambda_{j}^{}.

Т

Теорема 9. Корневые подпространства, принадлежащие различным собственным числам оператора \mathcal A_{}, имеют тривиальное пересечение:

\mathbb V_j \bigcap \mathbb V_k = \{ \mathbb O \} \qquad npu \quad \lambda_j \ne \lambda_k \ .

Доказательство. Следствие теоремы 2.

Т

Теорема 10. Пространство \mathbb V_{} раскладывается в прямую сумму корневых подпространств оператора \mathcal A:

\mathbb V=\mathbb V_1 \oplus \dots \oplus \mathbb V_{{\mathfrak r}}\ .

Для построения базиса корневого подпространства \mathbb V_{j} выделим в нем подпространства корневых векторов высот \le s:

\mathbb Q_s = \mathcal{K}er (\mathcal A-\lambda_{j} \, {\mathcal E})^s \ , \ \mathbb Q_0 = \{\mathbb O\} \ .

Понятно, что имеет место вложенность

\mathbb Q_0 \subset \mathbb Q_1 \subset \dots \subset \mathbb Q_{\mathfrak h_j} = \mathbb V_j \ .
Т

Теорема 11. Если векторы X_1,\dots,X_k принадлежат \mathbb Q_s и линейно независимы относительно \mathbb Q_{s-1}, то векторы (\mathcal A - \lambda_j {\mathcal E})(X_1),\dots, (\mathcal A - \lambda_j {\mathcal E})(X_k) принадлежат \mathbb Q_{s-1} и линейно независимы относительно \mathbb Q_{s-2}.

Доказательство. Если X\in \mathbb Q_s то (\mathcal A - \lambda_j {\mathcal E})^s(X)=\mathbb O, т.е.

(\mathcal A - \lambda_j {\mathcal E})^{s-1}\left( (\mathcal A - \lambda_j {\mathcal E})(X) \right)=\mathbb O \ ,

но это и означает, что (\mathcal A - \lambda_j {\mathcal E})(X) \in \mathbb Q_{s-1}.

Предположим теперь, что существуют скаляры c_1,\dots,c_k такие, что

\begin{array}{ccc} &c_1 (\mathcal A - \lambda_j {\mathcal E})(X_1)+\dots+c_k (\mathcal A - \lambda_j {\mathcal E})(X_k) \in \mathbb Q_{s-2}& \iff \\ \iff (\mathcal A - \lambda_j {\mathcal E})^{s-2} &\left(c_1 (\mathcal A - \lambda_j {\mathcal E})(X_1)+\dots +c_k (\mathcal A - \lambda_j {\mathcal E})(X_k) \right)=\mathbb O \quad \ & \iff \\ \iff (\mathcal A - \lambda_j {\mathcal E})^{s-1}& \left(c_1X_1+\dots +c_k X_k \right) = \mathbb O \ \qquad \Rightarrow \quad c_1X_1+\dots +c_k X_k \in \mathbb Q_{s-1} \ . & \end{array}

По условию теоремы последнее соотношение возможно только при c_1=0,\dots, c_k=0.

Алгоритм построения базиса корневого подпространства

§

Чтобы не усложнять индексы, всюду в алгоритме полагаем \mathfrak h = \mathfrak h_j.

0. Считаем, что на этом этапе построены базисы всех подпространств \mathbb Q_1, \mathbb Q_2,\dots, \mathbb Q_{\mathfrak h}. При этом базис каждого подпространства \mathbb Q_s при s\in \{2,\dots,\mathfrak h\} получен дополнением базиса подпространства \mathbb Q_{s-1}. Обозначим

\mathcal B = \mathcal A - \lambda_j {\mathcal E}, \quad, k_1 = \dim \mathbb Q_1,\ k_{s} = \dim \mathbb Q_s- \dim \mathbb Q_{s-1} \quad npu \quad s\in \{2,\dots,\mathfrak h\} ;

таким образом k_{s} — число векторов относительного базиса \mathbb Q_s над \mathbb Q_{s-1}. Число k_1+k_2+\dots+k_{_{\mathfrak h_j}} равно алгебраической кратности, а число k_{1} равно геометрической кратности собственного числа \lambda_{j}:

k_1+k_2+\dots+k_{_{\mathfrak h_j}}= \mathfrak m_j= \dim \mathbb V_j,\ k_1= \ell_j= \operatorname{dfc} \left( \mathcal A - \lambda_j {\mathcal E} \right) \ .

Для визуализации последующего алгоритма построения канонического базиса удобно представить результаты этого этапа в виде схемы:

Мы наблюдаем разноэтажное здание, число квартир на каждом этаже которого не превосходит числа квартир на предыдущем. В ходе дальнейшего алгоритма, часть «жильцов» останется на месте, а часть может быть замещена другими.

1. Выберем Y_{1},\dots,Y_{k_{_{\mathfrak h}}} — относительный базис2) \mathbb Q_{\mathfrak h}=\mathbb V_j над \mathbb Q_{\mathfrak h-1}.

2. По теореме 11 векторы \mathcal B(Y_{1}),\dots,\mathcal B(Y_{k_{_{\mathfrak h}}}) принадлежат \mathbb Q_{\mathfrak h-1} и л.н.з. относительно \mathbb Q_{\mathfrak h-2}. Если k_{\mathfrak h}=k_{\mathfrak h-1} то переходим к шагу 3 , в противном случае дополним полученные векторы до относительного базиса \mathbb Q_{\mathfrak h-1} над \mathbb Q_{\mathfrak h-2}: пусть система

\mathcal B(Y_{1}), \dots,\mathcal B(Y_{k_{\mathfrak h}}),Y_{k_{\mathfrak h}+1},\dots, Y_{k_{(\mathfrak h-1)}}

является этим базисом.

3. По теореме 11 векторы

\mathcal B^2(Y_{1}), \dots,\mathcal B^2(Y_{k_{\mathfrak h}}),\mathcal B(Y_{k_{\mathfrak h}+1}),\dots, \mathcal B(Y_{k_{_{(\mathfrak h-1)}}})

принадлежат \mathbb Q_{\mathfrak h-2} и л.н.з. относительно \mathbb Q_{\mathfrak h-3}. Если k_{\mathfrak h-1}=k_{\mathfrak h-2} то переходим к шагу 4 , в противном случае дополним эти векторы до относительного базиса \mathbb Q_{\mathfrak h-2} над \mathbb Q_{\mathfrak h-3}.

4. Продолжаем процесс…

...

h - 1. \dots

h. Действуем оператором \mathcal B на векторы, полученные на предыдущем шаге:

\mathcal B^{\,\mathfrak h-1}(Y_{1}), \dots,\mathcal B^{\,\mathfrak h-1}(Y_{k_{\mathfrak h}}),\mathcal B^{\,\mathfrak h-2}(Y_{k_{\mathfrak h}+1}),\dots,\mathcal B^{\,\mathfrak h-2}(Y_{k_{_{(\mathfrak h-1)}}}),\dots, \mathcal B(Y_{k_{_3}+1}),\dots,\mathcal B(Y_{k_{_2}}) .

Получившиеся векторы принадлежат \mathbb Q_1 и л.н.з. относительно \mathbb Q_{0}, т.е. линейно независимы в обычном понимании. Если k_{2}=k_{1}, то процесс заканчивается. В противном случае дополним эти векторы до базиса \mathbb Q_1: пусть

\begin{array}{ccc} & \mathcal B^{\,\mathfrak h-1}(Y_{1}), \dots,\mathcal B^{\,\mathfrak h-1}(Y_{k_{\mathfrak h}}),\mathcal B^{\,\mathfrak h-2}(Y_{k_{\mathfrak h}+1}),\dots,\mathcal B^{\,\mathfrak h-2}(Y_{k_{_{(\mathfrak h-1)}}}),\dots, & \\ & \qquad \dots, \quad \mathcal B(Y_{k_{_3}+1}),\dots,\mathcal B(Y_{k_{_2}}), Y_{k_{_2}+1},\dots, Y_{k_{1}} & \end{array}

этот базис.

Базис \mathbb V_{j} получается объединением всех векторов, полученных в алгоритме. Действительно,

. базис \ \mathbb Q_2 = \big\{ базис \ \mathbb Q_1 \big\} \bigcup \big\{ относит. базис \ \mathbb Q_2 над \ \mathbb Q_1 \big\} \ ,
. базис \mathbb Q_3 = \big\{ базис \ \mathbb Q_2 \big\} \bigcup \big\{ относит. базис \ \mathbb Q_3 над \ \mathbb Q_2 \big\} \ ,
\dots \qquad \dots
. базис \underbrace{\mathbb Q_{_{\mathfrak h}}}_{=\mathbb V_j} = \big\{ базис \ \mathbb Q_{\mathfrak h-1} \big\} \bigcup \big\{ относит. базис \ \mathbb Q_{\mathfrak h} над \ \mathbb Q_{\mathfrak h-1} \big\} \ .

Структура жордановой нормальной формы оператора \mathcal A_{}

В ЖНФ оператора \mathcal A_{} собственному числу \lambda_{j} соответствует k_{1} клеток Жордана. Они имеют следующую структуру:

  • k_{\mathfrak h} клеток порядка \mathfrak h;
  • k_{\mathfrak h-1}-k_{\mathfrak h} клеток порядка \mathfrak h-1;
  • k_{\mathfrak h-2}-k_{\mathfrak h-1} клеток порядка \mathfrak h-2;
  • \dots;
  • k_1- k_2 клеток порядка 1_{}.

Пусть эти клетки расположены на диагонали ЖНФ по убыванию их порядков:

\underbrace{{\mathfrak J}_{\mathfrak h} (\lambda_j), \dots, {\mathfrak J}_{\mathfrak h} (\lambda_j)}_{k_{\mathfrak h}}, \underbrace{{\mathfrak J}_{\mathfrak h-1} (\lambda_j),\dots, {\mathfrak J}_{\mathfrak h-1} (\lambda_j)}_{k_{\mathfrak h-1}-k_{\mathfrak h}},\dots, \underbrace{{\mathfrak J}_{2} (\lambda_j),\dots, {\mathfrak J}_{2} (\lambda_j)}_{k_2- k_3}, \underbrace{{\mathfrak J}_{1} (\lambda_j),\dots, {\mathfrak J}_{1} (\lambda_j)}_{k_1- k_2} \ .

Структура соответствующего канонического базиса

В каноническом базисе корневые векторы, соответствующие указанной последовательности клеток, следует упорядочить по следующему правилу:

1. Векторы канонического базиса, соответствующие подпоследовательности клеток Жордана максимального порядка \mathfrak h в ЖНФ, берутся в следующей последовательности:

Y_1, \mathcal B(Y_1), \dots, \mathcal B^{\mathfrak h -1}(Y_1), \dots, Y_{k_{\mathfrak h}}, \mathcal B (Y_{k_{\mathfrak h}}), \dots, \mathcal B^{\mathfrak h -1}(Y_{k_{\mathfrak h}}) .

Если обратиться к схеме построения относительных базисов подпространств, то предложенный алгоритм упорядочивания векторов канонического базиса иллюстрируется следующим образом. Сначала мы «выселяем из квартир» всех жильцов, которые жили в них в пункте алгоритма за номером 0 (см. схему выше), кроме тех, кто живет на самом верхнем — \mathfrak h-м — этаже. Начинаем заселение квартир, идя по стоякам сверху вниз. Квартиранты верхней квартиры «размножаются» с заселением нижних квартир, но строго в том же стояке. Как только заселяем весь стояк вплоть до первого этажа, переходим к соседнему стояку и снова начинаем «заселение» с самой верхней квартиры.

2. Когда все k_{\mathfrak h} стояков (их еще называют «башнями») максимальной высоты \mathfrak h заселены, ищем стояки высоты \mathfrak h-1. Их может вовсе не оказаться (если k_{\mathfrak h-1}= k_{\mathfrak h}). Но если хотя бы один имеется, то мы позволяем заселиться во все оставшиеся квартиры (\mathfrak h-1)-го этажа тем жильцам, которые жили на этом этаже до выселения — корневым векторам высоты \mathfrak h-1, т.е. жильцов выбираем среди X_{\mathfrak h-1,1},\dots, X_{\mathfrak h-1,k_{_{(\mathfrak h-1)}}}. При одном дополнительном ограничении: «заселяются» только такие «старые» корневые векторы, которые вместе с «новосёлами» на этом этаже — векторами \mathcal B(Y_1), \dots, B (Y_{k_{\mathfrak h}}) — образуют относительный базис \mathbb Q_{\mathfrak h-1} над \mathbb Q_{\mathfrak h-2}. Количество таких векторов равно k_{\mathfrak h-1} - k_{\mathfrak h}, и мы их обозначаем Y_{k_{\mathfrak h}+1},\dots, Y_{k_{(\mathfrak h-1)}}. Каждый из них порождает заселение целого стояка — по образу и подобию сценария предыдущего пункта. Векторы, взятые в порядке

Y_{k_{\mathfrak h}+1}, \mathcal B(Y_{k_{\mathfrak h}+1}),\dots, \mathcal B^{\mathfrak h-2}(Y_{k_{\mathfrak h}+1}), \dots, Y_{k_{(\mathfrak h-1)}}, \mathcal B(Y_{k_{(\mathfrak h-1)}}),\dots, \mathcal B^{\mathfrak h-2}(Y_{k_{(\mathfrak h-1)}})

— это следующие векторы канонического базиса, соответствующие подпоследовательности клеток порядка \mathfrak h-1 в ЖНФ.

3. \dots

...

h. Если в ходе предшествующих стадий заселения, еще имеются свободные квартиры на 1_{}-м этаже (k_1>k_2), то в них заселяются корневые векторы высоты 1_{}, т.е. собственные векторы оператора \mathcal A_{}. Лишь бы только эти векторы, обозначенные нами Y_{_{k_2+1}},\dots, Y_{_{k_1}}, оказались линейно независимыми с уже заселившимися, т.е. чтобы все жильцы первого этажа образовывали бы базис \mathbb Q_1. Эти векторы соответствуют клеткам Жордана порядка 1_{}, т.е., фактически, просто последовательности из k_2-k_1 чисел \lambda_j,\dots,\lambda_j, стоящих на главной диагонали ЖНФ.


§

Объяснение необходимости перестановки векторов канонического базиса — почему они нумеруются по правилу «сверху вниз», а не поэтажно — дается в следующем ПУНКТЕ.

П

Пример 3 (окончание). Построить ЖНФ и канонический базис пространства для оператора из примера 3.

Решение. В этом примере корневое пространство единственно, поскольку единственно собственное число \lambda_1=2. Далее, максимальная высота корневого вектора \mathfrak h_1 = 4, а соответствующие подпространства \{\mathbb Q_j\}_{j=1}^4 имеют вид:

\begin{array}{lcl} \mathbb Q_1 &=& \mathcal L (X_1,X_2,X_3,X_4), \\ \mathbb Q_2 &=& \mathcal L (X_1,X_2,X_3,X_4,X_5,X_6),\\ \mathbb Q_3 &=& \mathcal L (X_1,X_2,X_3,X_4,X_5,X_6,X_7), \\ \mathbb Q_4 &=& \mathcal L (X_1,X_2,X_3,X_4,X_5,X_6,X_7,X_8) \ ; \end{array}

в обозначениях алгоритма имеем:

k_1=4, k_2=2, k_3=1, k_4=1 \ .

Начинаем строить канонический базис согласно алгоритму. Первым делом, выбираем векторы относительного базиса \mathbb Q_4 над \mathbb Q_3. Такой вектор единствен — это

X_8 = [1,0,0,0,0,0,0,0]^{\top} \ .

Далее, согласно пункту 2 , вектор

\mathbf B X_8 =[1,0,2,-3,-1,-1,-1,0]^{\top}

принадлежит \mathbb Q_3 и линейно независим относительно \mathbb Q_2. Поскольку k_3=1, то больше векторов в относительный базис \mathbb Q_3 над \mathbb Q_2 добавлять не нужно. Переходим к пункту 3 алгоритма: вычисляем

\mathbf B^2 X_8 =[0,1,2,-2,-1,0,0,0]^{\top} \ .

Этот вектор принадлежит \mathbb Q_2 и линейно независим относительно \mathbb Q_1. Поскольку k_2=2, то можно подобрать еще один вектор из относительного базиса \mathbb Q_2 над \mathbb Q_1. Какой из векторов

X_5 = [-1, 2, 1, 0, 0, 0, 0, 0]^{\top} \quad или \quad X_6 = [-1, 1, 0, 1, 0, 0, 0, 0]^{\top} \ ,

полученных в ходе построения базиса \mathbb Q_2, следует взять? — В данном конкретном примере это не имеет значения поскольку проверка условия базисности

\operatorname{rank} \{ \mathbf B^2 X_8, X_5, X_1,X_2,X_3,X_4 \} = \operatorname{rank} \{ \mathbf B^2 X_8, X_6, X_1,X_2,X_3,X_4 \}= 6

выполняется для обоих векторов.

Если ввести в базис вектор X_5, то в следующем, 4 -м, шаге алгоритма получим систему векторов

\mathbf B^3 X_8 = [0,0,1,-1,-1,0,0,0]^{\top}, \ \mathbf B X_5 =[0,0,2,-2,-1,-1,-1,-1,0]^{\top} \ .

Если все вычисления проделаны правильно, то полученные векторы должны быть собственными для матрицы \mathbf A_{}, т.е. линейно выражаться через векторы

X_1=[0,0,-1,1,1,0,0,0]^{\top},\ X_2=[-1,0,-2,2,0,1,0,0]^{\top},
\ X_3=[1,0,1,-1,0,0,1,0]^{\top},\ X_4=[0,0,-1,1,0,0,0,1]^{\top} \ .

В самом деле, \mathbf B^3 X_8=-X_1, \mathbf B X_5=-X_1-X_2-X_3. Следовательно, в дополнение к векторам \mathbf B^3 X_8 и \mathbf B X_5 в базис пространства \mathbb Q_1 можно выбрать, например, векторы X_2, X_4.

Канонический базис пространства состоит, например, из векторов

X_8, \mathbf B X_8, \mathbf B^2 X_8, X_5, \mathbf B^3 X_8, \mathbf B X_5,X_2, X_4 \ ;

однако эти векторы требуется определенным образом переставить местами. Сначала определяем структуру ЖНФ оператора. В соответствии с алгоритмом, имеем ее в виде

\mathbf A_{_{\mathfrak J}} = \left(\begin{array}{cccc|cc|c|c} 2 & & & & & & & \\ 1 & 2 & & & & & & \\ & 1 & 2 & & & & & \\ & & 1 & 2 & & & & \\ \hline & & & & 2 & & &\\ & & & & 1 & 2 & & \\ \hline & & & & & & 2 & \\ \hline & & & & & & & 2 \end{array} \right)

(все неуказанные элементы равны 0_{}).

В соответствии с этой формой, найденные выше корневые векторы следует переставить следующим образом:

X_8, \mathbf B X_8, \mathbf B^2 X_8, \mathbf B^3 X_8, X_5, \mathbf B X_5,X_2, X_4 \ .

Матрица

C=\left(\begin{array}{rrrrrrrr} 1 & 1 & 0 & 0 & -1 & 0 & -1 & 0\\ 0 & 0 & 1 & 0 & 2 & 0 & 0 & 0\\ 0 & 2 & 2 & 1 & 1 & 2 & -2 & -1\\ 0 & -3 & -2 & -1 & 0 & -2 & 2 & 1\\ 0 & -1 & -1 & -1 & 0 & -1 & 0 & 0\\ 0 & -1 & 0 & 0 & 0 & -1 & 1 & 0\\ 0 &-1 & 0 & 0 & 0 & -1 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 \end{array} \right)

приводит матрицу \mathbf A_{} к указанной форме Жордана: C^{-1} \mathbf A C = \mathbf A_{_{\mathfrak J}}.

Циклическое подпространство

Для завершения исследования нам осталось только выяснить причину, по которой в алгоритме построения канонического базиса из предыдущего пункта, начиная с определенного места, был изменен принцип нумерации получившейся системы корневых векторов. А для этого следует выяснить каким образом преобразуются векторы построенного базиса под действием оператора \mathcal A_{}.

Пусть в пространстве \mathbb V_{} действует оператор \mathcal B. Для любого X\in\mathbb V построим минимально возможное инвариантное подпространство оператора \mathcal B, содержащее X_{}. Рассмотрим последовательность

X, \mathcal B (X),\mathcal B(\mathcal B(X))=\mathcal B^2(X), \dots,

и продолжим ее до тех пор, пока не возникнет линейная зависимость.

Т

Теорема 11. Пусть система \{ X, \mathcal B(X), \ldots, \mathcal B^{k-1}(X) \} еще линейно независима, в то время как система \{X, \mathcal B(X), \ldots, \mathcal B^{k-1}(X),\mathcal B^k(X) \} уже линейно зависима. Тогда линейная оболочка системы векторов \{X, \mathcal B(X),\ldots,\mathcal B^{k-1}(X) \}

\widetilde{\mathbb V}= {\mathcal L}(X,\mathcal B(X),\ldots,\mathcal B^{k-1}(X))

является инвариантным подпространством оператора \mathcal B. При этом \widetilde{\mathbb V} будет минимальным инвариантным подпространством, содержащим X_{}, т.е. если \widetilde{\widetilde{\mathbb V}}произвольное инвариантное подпространство, содержащее X_{}, то \widetilde{\widetilde{\mathbb V}}\supset \widetilde{\mathbb V}.

Доказательство. Рассмотрим произвольный вектор из \widetilde{\mathbb V}:

Y=c_1X+c_2\mathcal B(X)+\ldots+c_k\mathcal B^{k-1}(X)

применим к нему оператор \mathcal B:

\mathcal B(Y)=c_1\mathcal B(X)+c_2\mathcal B^2(X)+\ldots+c_k\mathcal B^k(X) \ .

По условию теоремы, вектор \mathcal B^k(X) линейно выражается через векторы системы \{ X, \mathcal B(X), \ldots, \mathcal B^{k-1}(X) \}:

\mathcal B^k(X)=-\alpha_1X-\alpha_{2}\mathcal B(X)-\ldots-\alpha_{k}\mathcal B^{k-1}(X) \ .

Тогда

\mathcal B(Y)-\alpha_1 c_k X+(c_1-\alpha_2 c_k)\mathcal B(X)+ \dots+(c_{k-1}-\alpha_k c_k)\mathcal B^{k-1}(X) \ \in \widetilde{\mathbb V}

т.к. все слагаемые принадлежат \widetilde{\mathbb V}. По определению, подпространство \widetilde{\mathbb V} является инвариантным для оператора \mathcal B.

Если \widetilde{\widetilde{\mathbb V}} — еще какое-то инвариантное подпространство, содержащее X_{}, то оно должно содержать и \mathcal B(X), но тогда — и \mathcal B(\mathcal B(X))=\mathcal B^2(X) и т.д., а, значит, и \widetilde{\mathbb V}.


При числе k_{} из условия теоремы, подпространство \widetilde{\mathbb V}= {\mathcal L}(X,\mathcal B(X),\ldots,\mathcal B^{k-1}(X)) называется циклическим подпространством, порожденным вектором X_{}.


Вернемся теперь к задаче построения канонического базиса оператора \mathcal A_{}.

Т

Теорема 12. Пусть X_{}произвольный корневой вектор оператора \mathcal A_{}, принадлежащий собственному числу \lambda^{}_{j}; пусть высота этого вектора равна h_{}. Рассмотрим оператор \mathcal B=\mathcal A-\lambda_{j} {\mathcal E} и его циклическое подпространство, порожденное вектором X_{}. Векторы

Y_1=X,\, Y_2=\mathcal B(Y_1)=\mathcal B(X),\, Y_3=\mathcal B(Y_2)=\mathcal B^2(X), \ldots , Y_h=\mathcal B(Y_{h-1})= \mathcal B^{\,h-1}(X)

образуют базис этого подпространства. В базисе пространства \mathbb V_{}, составленном дополнением этих векторов матрица оператора \mathcal A_{} имеет вид:

\left(\begin{array}{cccccccc} \lambda_{j}&0&0 &\ldots&0&\star & \star & \star\\ 1&\lambda_{j}&0 & \ldots&0&\star & \star & \star\\ 0&1&\lambda_{j} & &0&\star & \star & \star\\ \vdots && \ddots &\ddots & &&& \vdots \\ 0&0 &\dots& 1 &\lambda_{j}&\star & \star & \star \\ &&&& & \star & \star & \star\\ &&\mathbb O&& & &\dots & \\ &&&& & \star & \star & \star \end{array}\right) \ .

Доказательство. Действительно, \mathcal A_{} = \mathcal B_{} +\lambda_{j} \mathcal E_{} и тогда

\begin{array}{rcl} \mathcal A(Y_1)&=&\mathcal B(Y_1)+\lambda_{j} {\mathcal E}(Y_1)=\lambda_{j} Y_1 + Y_2, \\ \mathcal A(Y_2)&=&\mathcal B(Y_2)+\lambda_{j} {\mathcal E}(Y_2)=\lambda_{j} Y_2 + Y_3, \\ \dots & & \dots \\ \mathcal A(Y_h)&=&\mathcal B(Y_h)+\lambda_{j} {\mathcal E}(Y_h)=\lambda_{j} Y_h, \end{array}

(\mathcal B(Y_h)=\mathcal B^h(X)=\mathbb O поскольку, по условию, X_{} — корневой высоты h_{}).

=>

Циклическое подпространство, порожденное корневым вектором оператора \mathcal A_{}, является инвариантным подпространством этого оператора.


§

Канонический базис и, следовательно, матрица перехода C_{} определяются не единственным способом. Поэтому актуальна проверка правильности вычислений. Такая проверка может быть проведена — для матричного случая — посредством проверки более простого условия:

{\mathbf A}C=C{\mathbf A}_{_{\mathfrak J}} \ .

Следует, однако, иметь в виду, что последнее условие является необходимым, но не достаточным. Так, справедливо равенство

\underbrace{\left( \begin{array}{rrr} 0 & -1 & 1 \\ 2 & -5 & 3 \\ 6 & -13 & 7 \end{array} \right)}_{{\mathbf A}} \underbrace{\left( \begin{array}{rrr} 1 & 1 & 1 \\ 1 & 1 & 2 \\ 1 & 1 & 4 \end{array} \right)}_{C_1}=\underbrace{\left( \begin{array}{rrr} 1 & 1 & 1 \\ 1 & 1 & 2 \\ 1 & 1 & 4 \end{array} \right)}_{C_1} \left( \begin{array}{rrr} 0 & & \\ & 0 & \\ & & 2 \end{array} \right)

тем не менее истинная ЖНФ матрицы {\mathbf A} недиагональна:

{\mathbf A}_{_{\mathfrak J}}= \left( \begin{array}{rrr} 0 & & \\ 1 & 0 & \\ & & 2 \end{array} \right) \quad npu \quad C_2=\left( \begin{array}{rrr} 0 & 1 & 1 \\ 1 & 1 & 2 \\ 2 & 1 & 4 \end{array} \right) \ .

Объяснение этой кажущейся неоднозначности заключается в том, что матрица C_1 является вырожденной: \det C_1=0, и C_1^{-1} не существует.

?

Построить ЖНФ и канонический базис для оператора из примера 2.

Жорданова нормальная форма над полем вещественных чисел

В настоящем пункте пространство \mathbb V_{} размерности \dim \mathbb V_{} = n предполагается вещественным.

Примеры

Источники

[1]. Фаддеев Д.К., Фаддеева В.Н. Вычислительные методы линейной алгебры. М.ГИФМЛ. 1960.

[2]. Проскуряков И.В. Сборник задач по линейной алгебре. М.Наука. 1974

1) Жордан Камилл (Jordan Marie Ennemond Camille, 1838–1922) — французский математик. Биография ЗДЕСЬ. Не следует путать его с немецким геодезистом Вильгельмом Йорданом (Jordan Wilhelm,1842-1899), известному по методу Гаусса-Йордана решения систем линейных уравнений и обращения матрицы.
2) В предыдущей схеме векторы были обозначены X_{\mathfrak h,1},\dots, X_{\mathfrak h, k_{_{\mathfrak h}}}, но мне не хочется в дальнейшем возиться с двойными индексами.

2017/04/25 09:08 редактировал au