Chapter 4
Form Reduction
對於一個 linear operator, 我們希望能找到適當的 ordered basis, 使其 representative matrix 為特殊的形式 (form). 在 matrices 來說指的就是要找到有特別 form 的 similar matrices. 我們希望得到 form 有的是所謂的 canonical form (將矩陣化為 canonical form 能 幫我們判斷哪些矩陣是 similar), 還有一些 form 在數學許多領域都有重要的應用. 不過在此 我們不去談論這些應用 (大家在研讀相關領域時自然會學到), 而專注於如何將一個矩陣化 為這些 forms.
前一章我們提到利用 Primary Decomposition Theorem, 我們可以將 linear operator 簡 化成只要考慮 characteristic polynomial 為 p(x)c 這種形式的 linear operator, 其中 p(x) 是 F[x] 上的 irreducible polynomial. 我們將逐步由 p(x) 的可能情形來得到各種 forms.
4.1. Diagonal From
這一節中, 我們將從最簡單的 T -invariant subspace 出發, 引進所謂的 eigenvalue 以及 eigenvector, 再說明哪些情形可以得到 diagonal form.
對於一個 linear operator T : V→ V, 除了 {O} 以外, 最簡單的 T-invariant subspace 自然 是 dimension 為 1 的 T -invariant subspace. 現若 U 為 T -invariant subspace 且 dim(U) = 1, 即 存在 v̸= OV 使得 U = Span({v}). 由 U 為 T-invariant 的假設, 我們得 T(v) ∈ U = Span({v}). 也就是說, 存在λ ∈ F 使得 T(v) = λv. 我們有以下的定義.
Definition 4.1.1. 假設 T : V→ V 為 linear operator, 若存在 λ ∈ F 以及 v ∈ V 且 v ̸= OV
使得 T (v) =λv, 則稱 λ 為 T 的一個 eigenvalue, 而 v 為 T 的一個 eigenvector.
注意, 對於 eigenvector v 我們要求 v̸= OV, 而對於 eigenvalue λ 我們並無要求 λ ̸= 0.
也就是說 OV 雖符合 T (OV) =λOV, 但我們不考慮這種 trivial 的情形, 故不稱 OV 為 eigenvector. 另一方面若 v̸= OV 滿足 T (v) = 0v = OV, 表示 v 為 Ker(T ) 的元素. 所以若 0 為 T 的 eigenvalue, 表示 Ker(T )̸= {OV}, 亦即 T : V → V 不是 one-to-one.
65
Question 4.1. 假設 V 為 finite dimensional vector space 且 T : V → V 為 linear operator.
下列哪些是等價的?
(1) T is an isomorphism (2) T is one-to-one (3) T is onto (4) 0 is not an eigenvalue of T . 要找到一個 linear operator 有哪些 eigenvalue 和 eigenvector, 程序上是先找 T 有哪 些 eigenvalue, 再利用這些 eigenvalue 將其對應的 eigenvector 找出. 首先觀察若 λ 為 T : V → V 的 eigenvalue, 則必存在 v ̸= OV 使得 T (v) =λv, 得 λid(v) − T(v) = OV. 也就是 說 v∈ Ker(λid − T), 亦即 λid − T 這一個 linear operator 不是 isomorphism, 利用 Lemma 3.1.4 知 det(λid − T) = 0. 如何求 det(λid − T)? 回顧一下, 我們需先找 V 的一個 ordered basisβ, 再求 λid−T 對於 β 的 representative matrix [λid − T]β. 依定義 det(λid−T) 就是 det([λid − T]β). 然而若 dim(V ) = n, 則我們有
[λid − T]β = [λid]β− [T]β =λ[id]β− [T]β =λIn− [T]β.
因此若 λ ∈ F 是 T 的一個 eigenvalue, 則 det(λIn− [T]β) = 0. 又 T 的 characteristic poly- nomial 為 χT(x) =χ[T ]β(x) = det(xIn− [T]β). 得知, 若 λ ∈ F 是 T 的一個 eigenvalue, 則 χT(λ) = 0. 反之, 若 λ ∈ F 為 χT(x) = 0 之一根, 則 det(λid − T) = 0. 表示 λid − T 這一個 linear operator 不是 one-to-one, 亦即存在 v∈ V 且 v ̸= OV 使得 T (v) =λv. 因此我們有以 下之結果.
Proposition 4.1.2. 假設 V 為 finite dimensional vector space 且 T : V → V 為 linear operator. 則λ ∈ F 為 T 的 eigenvalue 若且唯若 χT(λ) = 0.
當 dim(V ) = n 時, 由於χT(x)∈ F[x] 是一個次數為 n 的多項式, 它在 F 中根的個數最多 只有 n 個 (當然也可能沒有根), 所以 T 僅能有有限多個 eigenvalue. 若 λ ∈ F 為 χT(x) 的 一根, 則 (x−λ) | χT(x). 又 x−λ 為 F[x] 的 monic irreducible polynomial, 所以若將 χT(x) 分解成 monic irreducible polynomials 的乘積 χT(x) = p1(x)c1··· pk(x)ck. 這些 pi(x) 中次數 為一次的多項式就給我們一個 T 的 eigenvalue. 我們對 x−λ 可整除 χT(x) 的最高次方有興 趣, 因此有以下的定義.
Definition 4.1.3. 假設 V 為 finite dimensional F-space, T : V→ V 為 linear operator 且λ 為 T 的一個 eigenvalue. 我們稱 x−λ 可整除 χT(x) 的最高次方為λ 的 algebraic multiplicity.
依此定義, 若χT(x) = p1(x)c1··· pk(x)ck, 其中 p1(x), . . . , pk(x) 為相異的 monic irreducible polynomials 且 p1(x) = x−λ, 則 c1 是λ 的 algebraic multiplicity.
Question 4.2. 若 T : V → V 為 linear operator 且 dim(V) = n, 則 T 最多有多少個相異的 eigenvalue? 此時每個 eigenvalue 的 algebraic multiplicity 為多少?
找到 T 所有可能的 eigenvalue 後, 我們就可以決定這些 eigenvalue 所對應的 eigenvector 了. 若 λ 為 eigenvalue, 前面提過所有滿足 v ̸= OV 以及 T (v)−λv = OV 的元素 v 就是 eigenvalue 為λ 的 eigenvector. 也就是說 eigenvalue 為 λ 的 eigenvector 就是 Ker(T −λid) 中的非 OV 元素. 我們很自然會考慮以下的 vector space.
4.1. Diagonal From 67
Definition 4.1.4. 假設 T : V→ V 為 linear operator 且 λ 為 T 的一個 eigenvalue. 令 Eλ(T ) = Ker(T−λid) = {v ∈ V | T(v) = λv}.
稱之為 T 對應於 λ 的 eigenspace 且 dim(Eλ(T )) 稱為λ 的 geometric multiplicity.
假設 v∈ Eλ(T ), 由於 T (T (v)) = T (λv) = λT(v), 我們得 T(v) ∈ Eλ(T ). 得知 Eλ(T ) 是一 個 T -invariant subspace.
Question 4.3. 你能用 Lemma 3.5.3 說明 Eλ(T ) 為 T -invariant subspace 嗎?
如何得到 Eλ(T ) 呢? 我們仍是利用 ordered basis β 得到 [T − λid]β= [T ]β−λIn 這一個 matrix, 再求 [T ]β−λIn的 null space N([T ]β−λIn) ={x ∈ Fn| ([T]β−λIn)·x = O}. 再利用β 將 N([T ]β−λIn)中的元素還原回 V 中的元素, 就是 Eλ(T ) 的元素, 而且 dim(N([T ]β−λIn)) = dim(Eλ(T )) 就是 λ 的 geometric multiplicity.
Example 4.1.5. 考慮 T : M2(F)→ M2(F) 定義為 T
( a b c d
)
=
( a c b d
)
.考慮 M2(F) 上 的 ordered basis β = (
( 1 0 0 0
) ,
( 0 1 0 0
) ,
( 0 0 1 0
) ,
( 0 0 0 1
)
), 則 T 對於 β 的 repre- sentative matrix 為
[T ]β=
1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 1
.
求得 χT(x) =χ[T ]β(x) = (x− 1)3(x + 1). 所以 1 和 −1 為 T 的 eigenvalue, 它們的 algebraic multiplicity 分別為 3 和 1.
要求 T 對於 1 的 eigenspace E1(T ), 我們先考慮 N([T ]β− I4), 即解聯立方程組
0 0 0 0
0 −1 1 0 0 1 −1 0
0 0 0 0
·
x1 x2 x3 x4
=
0 0 0 0
, 也就是解
0 = 0
−x2+ x3 = 0 x2− x3 = 0
0 = 0
解得 N([T ]β− I4) ={(x1, x2, x2, x4)t| x1, x2, x4∈ F}. 知 1 的 geometric multiplicity 為 3 且 E1(T ) ={
( x1 x2
x2 x4 )
| x1, x2, x4∈ F}.
同理, 對於 −1 的 eigenspace E−1(T ), 我們先考慮 N([T ]β− (−1)I4),即解聯立方程組
2 0 0 0 0 1 1 0 0 1 1 0 0 0 0 2
·
x1 x2 x3 x4
=
0 0 0 0
, 也就是解
2x1 = 0 x2+ x3 = 0 x2+ x3 = 0 2x4 = 0
解得 N([T ]β− (−1)I4) ={(0,x2,−x2, 0)t| x2∈ F}. 知 −1 的 geometric multiplicity 為 1 且 E−1(T ) ={
( 0 x2
−x2 0 )
| x2∈ F}.
Algebraic multiplicity 並不一定會等於 geometric multiplicity, 我們看一個簡單的例子.
Example 4.1.6. 考慮 T : P1(F)→ P1(F) 定義為 T (ax + b) = bx, 並考慮 P1(F) 的 ordered basis β = (x,1). 我們有 [T]β =
( 0 1 0 0
)
, 得 χT(x) = x2. 所以 0 是 T 唯一的 eigenvalue 且其 algebraic multiplicity 為 2. 要求 N([T ]β− 0I2) = N([T ]β) 即解
( 0 1 0 0
)
· ( a
b ) ( =
0 0
)
得 b = 0, 即 N([T ]β− 0I2) ={(a,0)t| a ∈ F}. 故 0 的 geometric multplicity 為 1 且 E0(T ) ={ax | a ∈ F}.
雖然 T 的一個 eigenvalueλ 的 algebraic multiplicity 和 geometric multiplicity 有可能 不同, 不過它們之間仍有著某種關係存在. 我們利用 Primary Decomposition Theorem 來說 明. 利用 Theorem 3.5.8 的符號, 假設
µT(x) = p1(x)m1··· pk(x)mk and χT(x) = p1(x)c1··· pk(x)ck
其中 p1(x), . . . , pk(x) 為相異的 monic irreducible polynomials 且因為 λ 為 T 的 eigenvalue, 我們令 p1(x) = x−λ. 若令 Vi= Ker(pi(T )◦mi), for i = 1, . . . , k, 則 Primary Decomposition Theorem (Theorem 3.5.8) 告訴我們
V = V1⊕ ··· ⊕Vk
且
µT|Vi(x) = pi(x)mi and χT|Vi(x) = pi(x)ci,∀i = 1,...,k.
因假設 p1(x) = x−λ, 我們有
V1= Ker((T−λid)◦m1)⊇ Ker(T −λid) = Eλ(T ).
由 此 知 λ 的 geometric multiplicity dim(Eλ(T ))≤ dim(V1). 另 一 方 面, 依 定 義 c1 為 λ 的 algebraic multiplicity, 而又 χT|V1(x) = (x−λ)c1, 知 deg(χT|V1(x)) = c1. 因為一個 linear operator 的 characteristic polynomial 的 degree 為此 operator 所在的 space 之 dimension, 故得 dim(V1) = c1. 因此我們知 dim(Eλ(T ))≤ c1, 得到以下的結果.
Lemma 4.1.7. 若 V 為 finite dimensional F-space, T : V → V 為 linear operator 且 λ 為 T 的一個 eigenvalue, 則 λ 的 algebraic multiplicity 大於等於其 geometric multiplicity.
當 λ 是 T 的 eigenvalue 時, 由於 Eλ(T ) 存在著非 OV 的元素, 故知 dim(Eλ(T ))≥ 1, 也 就是說 λ 的 geometric multiplicity 必大於等於 1. 此時若 λ 的 algebraic multiplicity 是 1, 則由 Lemma 4.1.7 知λ 的 algebraic multiplicity 等於其 geometric multiplicity (即 λ 的 geometric multiplicity 等於 1). 在一般的情形, 什麼時候λ 的 algebraic multiplicity 會等於 其 geometric multiplicity 呢? 我們有以下的結果.
Proposition 4.1.8. 假設 V 為 finite dimensional F-space, T : V→ V 為 linear operator 且 λ 為 T 的一個 eigenvalue. 則 λ 的 algebraic multiplicity 等於其 geometric multiplicity 若 且唯若 x−λ | µT(x) 但 (x−λ)2-µT(x).
4.1. Diagonal From 69
Proof. 我們用前面一樣的符號, 設µT(x) = p1(x)m1··· pk(x)mk以及χT(x) = p1(x)c1··· pk(x)ck, 其中 p1(x) = x−λ. 又令 V1= Ker((T−λid)◦m1). 若 x−λ | µT(x) 但 (x−λ)2-µT(x), 此即表 示 m1= 1, 故得 V1= Ker(T−λid) = Eλ(T ). 前面已知 dim(V1)為λ 的 algebraic multiplicity, 而依定義 dim(Eλ(T )) 為 λ 的 geometric multiplicity, 故得證它們相等.
反過來, 若λ 的 algebraic multiplicity 等於其 geometric multiplicity, 即表示 dim(V1) = dim(Eλ(T )), 故得 V1= Ker(T−λid). 換句話說, 對於任意 v ∈ V1, T (v)−λid(v) = OV. 這 告訴我們 T−λid 限制在 V1 上是一個 zero mapping, 即 (T−λid)|V1 = T|V1−λid|V1 = O.
也就是說, 若令 h(x) = x−λ, 得 h(T|V1) = O. 因此由 Lemma 3.3.5 知 T|V1 的 minimal polynomial µT|V1(x) 整除 h(x) = x−λ. 然而 Theorem 3.5.8 告訴我們 µT|V1(x) = (x−λ)m1,
故得證 m1= 1.
特 別 的, 假 設 χT(x) 可 以 完 全 分 解 成 F[x] 中 的 一 次 多 項 式 的 乘 積, 亦 即 χT(x) = p1(x)c1··· pk(x)ck, 其 中 每 一 個 pi(x) 皆 為 一 次 多 項 式 x−λi. 此 時 若 每 一 個 λi 的 alge- braic multiplicity 和 geometric multiplicity 皆 相 等, 則 由 Proposition 4.1.8 知 µT(x) = p1(x)··· pk(x), 因此得 Vi= Ker(T−λiid) = Eλi(T ), ∀i = 1,...,k. 因此由 Primary Decomposi- tion Theorem 知
V = Eλ1(T )⊕ ··· ⊕ Eλk(T ).
也就是說此時 V 就會是 eigenspaces 的 (internal) direct sum. 因為每個 eigenspace 中的非 OV 元素皆為 T 的 eigenvector, 所以 Eλi(T ) 中的任一組 basis Si 皆由 T 的 eigenvector 所 組成. 又因 V = Eλ1(T )⊕ ··· ⊕ Eλk(T ), Proposition 3.4.6 告訴我們 S1∪ ··· ∪ Sk 為 V 的一組 basis, 也就是說 V 有一組 basis 是由 T 的 eigenvector 所組成. 現假設 {v1, . . . , vn} 為 V 的 一組 basis, 其中 vi 為 T 的 eigenvector 且其對應的 eigenvalue 為 γi (這裡 γi 不一定相異), 此時考慮 V 的 ordered basisβ = (v1, . . . , vn). 由於對所有 i = 1, . . . , n, 皆有 T (vi) =γivi, 我 們得到
[T ]β=
γ1 O
. ..
O γn
為一個 diagonal matrix (對角矩陣). 因此有以下之定義.
Definition 4.1.9. 假設 V 為 finite dimensional F-space 且 T : V → V 為 linear operator.
若 V 存在一組 basis 是由 T 的 eigenvectors 所組成, 則稱 T 為一個 diagonalizable linear operator.
我們有以下等價的關係來判斷一個 linear operator 是否為 diagonalizable.
Theorem 4.1.10. 假設 V 為 finite dimensional F-space 且 T : V → V 為 linear operator.
則以下是等價的.
(1) T 是一個 diagonalizable linear operator.
(2) 存在 V 的 ordered basis β 使得 [T]β 為一個 diagonal matrix.
(3) T 的 characteristic polynomial χT(x) 可以完全分解成 F[x] 中的一次多項式之乘積, 且 T 的每一個 eigenvalue 的 algebraic multiplicity 和 geometric multiplicity 相等.
(4) T 的 minimal polynomial µT(x) 可以完全分解成 F[x] 中相異的 monic 一次多項式 之乘積.
Proof. 前面我們已知 (3)⇒ (1) 且 (1) ⇒ (2), 現要證明 (2) ⇒ (4). 假設 dim(V) = n 且β 為 V 的 ordered basis 使得
[T ]β=
γ1 O
. ..
O γn
為一個 diagonal matrix. 現假設λ1, . . . ,λk 皆相異且{γ1, . . . ,γn} = {λ1, . . . ,λk}. 亦即對任意γi
皆存在λj 使得γi=λj. 依定義 χT(x) =χ[T ]β(x) = (x−γ1)···(x −γk) = (x−λ1)c1···(x −λk)ck, 其中 ci∈ N. 而且由 Theorem 3.3.7 (或 Theorem 3.3.9) 知 µT(x) = (x−λ1)m1···(x −λk)mk, 其中 mi∈ N. 現考慮 h(x) = (x −λ1)···(x −λk), 由 Lemma 3.2.1 得
h([T ]β) = ([T ]β−λ1In)···([T]β−λkIn)
=
γ1−λ1 O . ..
O γn−λ1
···
γ1−λk O . ..
O γn−λk
=
(γ1−λ1)···(γ1−λk) O . ..
O (γn−λ1)···(γn−λk)
然而每個 γi 皆存在 λj, j = 1, . . . , k 使得 γi=λj, 故得 h([T ]β) = O, 亦即 h(T ) = O. 所以 由 Lemma 3.3.5 得 µT(x)| h(x), 得證 µT(x) = h(x) = (x−λ1)···(x −λk), 亦即 T 的 minimal polynomial µT(x) 可以完全分解成 F[x] 中相異的 monic 一次多項式之乘積.
最後我們要證明 (4)⇒ (3). 假設 µT(x) = (x−λ1)···(x −λk), 其中 λi∈ F 且皆相異. 由 Theorem 3.3.7, 知χT(x) = (x−λ1)c1···(x −λk)ck 其中 ci∈ N, 即χT(x) 可以完全分解成 F[x]
中的一次多項式之乘積. 然而λ1, . . . ,λk 為 T 的所有 eigenvalues, 且對於每一個 i = 1, . . . , k 皆有 (x−λi)|µT(x) 但 (x−λi)2-µT(x). 故 Proposition 4.1.8 告訴我們每個λi 的 algebraic multiplicity 和 geometric multiplicity 皆相等. 得證本定理. Question 4.4. 假 設 dim(V ) = n, T : V → V 為 linear operator. 若 T 有 n 個相異的 eigenvalue, 則 T 是否為 diagonalizable?
Question 4.5. Example 4.1.5 和 Example 4.1.6 中哪一個 T 是 diagonalizable?
雖然前面都是談 linear operator, 我們要強調這些性質對於 n× n 的方陣也有相對應的 地方. 首先若 A∈ Mn(F), 我們也有所謂的 eigenvalue 以及 eigenvector.
Definition 4.1.11. 假設 A∈ Mn(F). 若存在 λ ∈ F 以及 x ∈ Fn 且 x̸= O 使得 A · x =λx, 則稱λ 為 A 的一個 eigenvalue, 而 x 為 T 的一個 eigenvector.
4.1. Diagonal From 71
接下來利用 A 的 characteristic polynomial χA(x) 來得到 A 的 eigenvalues λ 以及求 N(A−λIn) 來得到 A 相對於λ 的 eigenvector, 還有關於 eigenvalue 的 algebraic multiplicity 和 geometric multiplicity, ... 等性質, 我們就不再贅敘.
Question 4.6. 若 A∈ Mn(F), λ 為 A 的 eigenvalue, 你能定義 λ 的 algebraic multiplicity 和 geometric multiplicity 嗎? 你能寫出 A 相對於 Lemma 4.1.7 以及 Proposition 4.1.6 的 定理嗎?
我們也可定義何謂 diagonalizable matrix 如下.
Definition 4.1.12. 假設 A∈ Mn(F). 若存在一組 Fn basis 是由 A 的 eigenvectors 所組成, 則稱 A 為一個 diagonalizable matrix.
我們也有如同 Theorem 4.1.10 判斷 A 是否為 diagonalizable 的等價方法. 因為證明就 如同 linear operator 的情形, 我們就不再重複.
Theorem 4.1.13. 假設 A∈ Mn(F). 則以下是等價的.
(1) A 是一個 diagonalizable matrix.
(2) 存在 P∈ Mn(F) 為 invertible 使得 P−1· A · P 為一個 diagonal matrix.
(3) χA(x) 可以完全分解成 F[x] 中的一次多項式之乘積, 且 A 的每一個 eigenvalue 的 algebraic multiplicity 和 geometric multiplicity 相等.
(4) µA(x) 可以完全分解成 F[x] 中相異的 monic 一次多項式之乘積.
當 A 為 diagonalizable, Theorem 4.1.13 (2) 中 P−1·A·P 這一個 diagonal matrix 就稱為 A 的 diagonal form. 我們特別說明一下如何找到 P 將 A 化為 diagonal form. 假設
P−1· A · P = D =
γ1 O
. ..
O γn
,
且令 Pi∈ Fn 為 P 的 i-th column. 前面提過求兩個矩陣相乘其 i-th column 的方法, 我們 有 A· P 的 i-th column 為 A · Pi, 而 P· D 的 i-th column 為 γiPi, 所以利用 A· P = P · D 得 A· Pi=λPi, 也就是說 P 的 i-th column Pi 就是一個 eigenvalue 為γi 的 eigenvector. 因此我 們只要將一個 diagonalizable matrix A 的 eigenvectors 所組成 Fn 的一組 basis, 按照順序一 個 column 一個 column 填入, 所得的 invertible matrix P, 就是可以將 A 對角化. 也就是說 P−1· A · P 為一個對角矩陣.
最後我們說明為何兩個 diagonalizable matrices, 將其化成 diagonal form 後就可以判斷 其是否為 similar. 首先強調若 A 為 diagonalizable, 且 B∼ A, 則 B 必為 diagonalizable. 這 是因為假設 P 為 invertible 且 P−1· A · P = D 為 diagonal matrix. 由存在 Q 為 invertible 使 得 B = O−1· A · Q, 得
(Q−1· P)−1· B · (Q−1· P) = (P−1· Q) · (Q−1· A · Q) · (Q−1· P) = P−1· A · P = D.
又因 Q−1· P 為 invertible 得證 B 為 diagonalizable.
另一方面若 A, B 皆為 diagonalizable, 若 A∼ B, 表示它們有相同的 characteristic poly- nomial, 因此有相同的 eigenvalues 且 A 和 B 同一個 eigenvalue 的 algebraic multiplicity 皆 相等. 而每一個 eigenvalue 的 algebraic multiplicity 又等於其 geometric multiplicity, 所以 將 A, B 化為 diagonal form 後同一個 eigenvalue 發生在的對角線上的次數會相同. 反之, 若將 A, B 化為 diagonal form 後同一個 eigenvalue 發生在的對角線上的次數相同, 表示將 diagonal form 對角線位置適當互換後, 兩個 diagonal form 會相等. 然而對角線位置互換只 是將 eigenvector 所形成的 ordered basis 做適當重新排序 (例如將 (i, i)-th entry 和 ( j, j)-th entry 互換只是將原來 P 的 i-th column 和 j-th column 互換), 所以得知 A∼ B.
4.2. Triangular Form
當 linear operator T 的 characteristic polynomial 可完全分解成一次的 monic polyno- mials 的乘積時, T 不一定是 diagonalizable. 這一節中我們將探討在這種情形時 T 可以化 成怎樣的形式.
注 意 本 節 中 我 們 仍 假 設 χT(x) 可 以 完 全 分 解 成 一 次 的 多 項 式 的 乘 積 (即 χT(x) = (x−λ1)c1···(x −λk)ck). 這個假設當 V over 的 field F 是 algebraically closed (例如 F =C) 時自然會成立. 利用 Primary Decomposition Theorem, 我們假設 T 的 minimal polynomial 為 µT(x) = (x−λ)m. 也就是說 (T−λid)◦m= O.
當一個 linear operator T : V→ V 滿足 T◦m= O, 我們稱之為 nilpotent, 而最小的正整數 m 使得 T◦m= O, 稱為這個 nilpotent operator 的 index. 因為我們假設 T−λid 為 nilpotent 且 index 為 m. 我們來特別探討 nilpotent operator 的性質.
對於一個 linear operator T : V → V. 若 v ∈ Im(T◦i), 表示存在 u∈ V 使得 v = T◦i(u), 因此當 i≥ 2 時, 我們有 v = T◦i−1(T (u))∈ Im(T◦i−1). 所以我們自然有以下的 chain of subspaces
V ⊇ Im(T) ⊇ Im(T◦2)⊇ ··· ⊇ Im(T◦i−1)⊇ Im(T◦i)⊇ ··· . 特別的, 當 T 為 nilpotent of index m, 我們有以下情形.
Lemma 4.2.1. 假設 dim(V ) > 0, 若 T 為 nilpotent operator of index m, 則我們有以下的 chain of subspaces.
V) Im(T) ) Im(T◦2)) ··· ) Im(T◦i−1)) Im(T◦i)) ··· ) Im(T◦m−1)) Im(T◦m) ={OV}.
Proof. 首先說明 Im(T◦m−1)) Im(T◦m) ={OV}. 因為 T◦m= O, 亦即對任意 v∈ V, T◦m(v) = OV, 所以 Im(T◦m) ={OV}. 另一方面, 若 Im(T◦m−1) = Im(T◦m) ={OV}, 則表示 T◦m−1= O, 此與 m 為最小的正整數使得 T◦m= O 相矛盾, 故知 Im(T◦m−1)̸= Im(T◦m).
接下來我們說明 V ) Im(T). 若 Im(T) = V, 表示對任意 v ∈ V 皆存在 v1 ∈ V 使得 v = T (v1). 而 v1∈ V, 故存在 v2∈ V 使得 v = T(v1) = T◦2(v2), 得 V = Im(T◦2). 如此一直 下去, 我們可證得 V = Im(T◦i), ∀i ∈ N. 因 V ̸= {OV}, 此與 T 為 nilpotent 相矛盾, 故知 V ̸= Im(T).
4.2. Triangular Form 73
同理, 當 1≤ i ≤ m − 2, 因對於所有 v ∈ Im(T◦i+1) 皆存在 u∈ V 使得 v = T◦i+1(u) = T (T◦i(u)). 現若 Im(T◦i) = Im(T◦i+1), 則由 T◦i(u)∈ Im(T◦i) = Im(T◦i+1) 知存在 w∈ V 使得 T◦i(u) = T◦i+1(w). 亦即 v = T (T◦i(u)) = T◦i+2(w)∈ Im(T◦i+2), 得證 Im(T◦i+1) = Im(T◦i+2).
如此一直下去會推得 Im(T◦m−1) = Im(T◦m),此與前面所得 Im(T◦m−1)̸= Im(T◦m) 相矛盾, 故
知 Im(T◦i)̸= Im(T◦i+1),得證本定理.
接下來我們說明若 dim(V ) = n 且 T : V → V 為 nilpotent operator of index m, 如何將其 化為 triangular form. 首先選取 Im(T◦m−1) 的 ordered basis (v1, . . . , vk1), 注意此時我們有 T (vi)∈ Im(T◦m) ={OV}, 故
T (vi) = OV,∀i = 1,...,k1.
接著加入{vk1+1, . . . , vk2} 使得 (v1, . . . , vk1, . . . , vk2) 為 Im(T◦m−2) 的 ordered basis. 此時我們 有
T (vi)∈ Im(T◦m−1) = Span({v1, . . . , vk1}), ∀i = k1+ 1, . . . , k2,
而且利用 ordered basis (v1, . . . , vk1, . . . , vk2) 所得 T|Im(T◦m−2) 的 representative matrix 為 ( Ok1,k1 ∗
Ok2−k1,k1 Ok2−k1,k2−k1 )
,
其中 Oi, j 表示為 i× j 階的零矩陣, 而右上角的 ∗ 為一個 k1× k2− k1 階的非零矩陣. 接下來 加入{vk2+1, . . . , vk3} 使得 (v1, . . . , vk1, . . . , vk2, . . . , vk3) 為 Im(T◦m−3) 的 ordered basis. 此時我 們有
T (vi)∈ Im(T◦m−2) = Span({v1, . . . , vk1, . . . , vk2}), ∀i = k2+ 1, . . . , k3,
而且利用 ordered basis (v1, . . . , vk1, . . . , vk2, . . . , vk3) 所得 T|Im(T◦m−3) 的 representative matrix
為
Ok1,k1 ∗ ∗ Ok2−k1,k1 Ok2−k1,k2−k1 ∗ Ok3−k2,k1 Ok3−k2,k2−k1 Ok3−k2,k3−k2
.
這樣一直下去我們可得到 Im(T ) 的 ordered basis (v1, . . . , vkm−1), 其中對於 j = 1, . . . , m− 1, 皆有 (v1, . . . , vkj) 為 Im(T◦m− j) 的 ordered basis 且
T (vi)∈ Im(T◦m−( j−1)) = Span({v1, . . . , vkj−1}), ∀i = kj−1+ 1, . . . , kj. 最後加入 {vkm−1+1, . . . , vn} 使得 (v1, . . . , vkm−1, . . . , vn) 為 V 的 ordered basis, 此時
T (vi)∈ Im(T) = Span({v1, . . . , vkm−1}), ∀i = km−1+ 1, . . . , kn, 而且利用 ordered basis (v1, . . . , vkm−1, . . . , vn)所得 T 的 representative matrix 為
O ∗ ∗ ... . .. ∗
O O O
.
這一個矩陣是對角線皆為 0 的 upper triangular matrix (上三角矩陣), 所以我們有以下的結 果.
Proposition 4.2.2. 假設 V 為 finite dimensional F-space 且 T : V→ V 為 linear operator.
則 T 為 nilpotent 若且唯若存在 V 的 ordered basis β 使得 [T]β 為 upper triangular matrix 且 [T ]β 的對角線皆為 0.
Proof. 由前面的討論我們知: 若 T 為 nilpotent, 則存在 V 的 ordered basisβ 使得 [T]β 為 upper triangular matrix 且其對角線皆為 0. 反之, 若 [T ]β 為 upper triangular matrix 且 其對角線皆為 0, 我們知 χT(x) =χ[T ]β(x) = xn (其中 n = dim(V )), 故知 T◦n= O, 得證 T 為
nilpotent.
Question 4.7. 若 V 為 finite dimensional F-space 且 T : V → V 為 nilpotent operator of index m, 則 χT(x) 為何? 又 µT(x) 為何?
回顧一下, 對於 linear operator T : V → V, 要找到 Im(T), 我們可以利用 V 的 ordered basis β, 先得到 representative matrix [T]β. 再求 [T ]β 的 column space C([T ]β) (我們用 C(A) 表示矩陣 A 的 column space). 接著將 column space 的元素用 τβ◦−1 還原成 V 的元素, 就得到 Im(T ) 的元素了. 我們看以下化為 upper triangular matrix 的例子.
Example 4.2.3. 考慮 linear operator T : P2(R) → P2(R), 定義為 T(ax2+ bx + c) = (c−a)x2+ cx + (c− a). 若考慮 P2(R) 的 ordered basisβ = (x2, x, 1), 我們有 [T ]β=
−1 0 1 0 0 1
−1 0 1
, 得
χT(x) = x3. 又 [T ]2β =
0 0 0
−1 0 1 0 0 0
知 µT(x) = x3, 即 T 為 nilpotent of index 3. 因 [T ]2β 的 column space 為 Span({(0,1,0)t}), 我們得 Im(T◦2) = Span({x}). 同理由 [T]β 的 column space, 可得 Im(T ) = Span({x,x2+ 1}). 最後因 x2̸∈ Im(T), 我們可以考慮 P2(R) 的 ordered basisβ′= (x, x2+ 1, x2). 因
T (x) = 0, T (x2+ 1) = 1x + 0(x2+ 1) + 0x2, T (x2) = 0x + (−1)(x2+ 1) + 0x2 得 [T ]β′=
0 1 0 0 0 −1 0 0 0
這一個 diagonal 皆為 0 的 upper triangular matrix.
現在我們回到 T 的 minimal polynomial 為 µT(x) = (x−λ)m 的情形, 此時 T−λ id 為 nilpotent 所以由 Proposition 4.2.2 知存在 ordered basis β 使得 [T − λ id]β = U 為一個 diagonal 皆為 0 的 upper triangular matrix
U =
0 ∗ ∗ ... . .. ∗ 0 ··· 0
.
然而若 dim(V ) = n, 因 [T−λ id]β= [T ]β−λIn, 故得 [T ]β=λIn+U , 為一個 diagonal 皆為λ 的 upper triangular matrix
λIn+U =
λ ∗ ∗
. .. ∗
O
λ
.
4.2. Triangular Form 75
Theorem 4.2.4. 假設 V 為 finite dimensional F-space. 若 T : V→ V 為 linear operator 其 characteristic polynomial 為
χT(x) = (x−λ1)c1···(x −λk)ck,
其中λ1, . . . ,λk 為 F 中相異的元素, 則存在 V 的 ordered basisβ 使得
[T ]β=
A
1 . ..O O Ak
,
其中每個 Ai 為 ci× ci 階的 upper triangular matrix
λi ∗ ∗ . .. ∗
O
λi
.
Proof. 由 Theorem 3.3.9 知存在 mi≤ ci 使得µT(x) = (x−λ1)m1···(x−λk)mk, 故由 Primary Decomposition Theorem, 我們知 V = V1⊕··· ⊕Vk, 其中 Vi= Ker((T−λiid)◦mi)且 µT|Vi(x) = (x−λi)mi. 得 T|Vi−λiid|Vi 為 nilpotent, 故利用 Proposition 4.2.2, 我們知存在 βi 為 Vi 的 ordered basis, 使得 [T|Vi]βi 為 Ai這樣的 ci×ci階的 upper triangular matrix. 故將β1, . . . ,βk
依序排列形成 V 的 ordered basisβ, 可得 [T]β 為所要的 triangular matrix. Theorem 4.2.4 告訴我們當 T 的 characteristic polynomial 可完全分解成 F[x] 中的一次 多項式乘積, 雖然 T 可能不能化成 diagonal form 不過一定可以化成 triangular form.
接著我們來看 linear operator 相對應到 n× n matrix 的結論.
Theorem 4.2.5. 假設 A∈ Mn(F) 且其 characteristic polynomial 和 minimal polynomial 分 別為
χA(x) = (x−λ1)c1···(x −λk)ck,µA(x) = (x−λ1)m1···(x −λk)mk 其中λ1, . . . ,λk 為 F 中相異的元素. 則存在 invertible matrix P 使得
P−1· A · P =
A
1 . ..O O Ak
,
其中每個 Ai 為 ci× ci 階的 upper triangular matrix
λi ∗ ∗ . .. ∗
O
λi
.
假設 A∈ Mn(F) 且 χA(X ) = (x−λ1)c1···(x −λk)ck, µA(x) = (x−λ1)m1···(x −λk)mk. 我們 說明如何找到 invertible matrix M 使得 M−1· A · M 為 upper triangular matrix. 首先我們
利用 Chapter 3 primary decomposition 的方法找到 invertible matrix P 使得 P−1· A · P 為 block diagonal matrix
A1
O
. ..
O
Ak
,
接著考慮每一個 ci× ci matrix Ai. 因為 µAi(x) = (x−λi)mi, Ai−λiIci 是 nilpotent of index mi, 我們可以利用 Proposition 4.2.2 的方法首先找 (Ai−λiIci)mi−1 的 column space 的一組 basis (此即相對於 Proposition 4.2.2 中 Im(T◦m−1) 的 basis), 然後擴大成 (Ai−λiIci)mi−2 的 column space 的一組 basis, 這樣一直下去直到擴大成 Fci 的一組 basis. 若令這組 basis 以 column by column 依序組成的 ci× ci 的 matrix 為 Qi, 則我們有 Q−1i · Ai· Qi 為 upper triangular matrix. 最後將這些 Qi 在 diagonal 的位置依序放入, 組成 n× n 的 invertible
matrix
Q1
O
. ..
O
Qk
,
就會使得
(P· Q)−1· A · (P · Q) = Q−1· (P−1· A · P) · Q =
Q−11 · A1· Q1
O
. ..
O
Q−1k · Ak· Qk
,
為 upper triangular matrix 了. 我們看以下的例子.
Example 4.2.6. 在 Example 3.5.10 中我們考慮 5× 5 matrix
A =
2 1 1 1 0
1 4 2 2 1
−1 −2 0 −1 −1
0 0 0 1 1
0 −1 −1 −1 0
因為 χA(x) =µA(x) = (x− 1)3(x− 2)2 在 Q[x] 中完全分解成一次多項式的乘積, 我們可找到 invertible matrix M∈ M5(Q) 使得 M−1· A · M 為 upper triangular matrix.
在 Example 3.5.10 中我們已找到 P∈ M5(Q) 將 A 化為 block diagonal matrix.
P−1· A · P =
0 −1 −1 0 0
1 1 0 0 0
0 1 2 0 0
0 0 0 1 −1
0 0 0 1 3
.
現在我們需將
B =
0 −1 −1
1 1 0
0 1 2
, C =(
1 −1 1 3
)
4.2. Triangular Form 77
化為 triangular forms. 因µB(x) = (x− 1)3, 考慮 B− I3 這一個 nilpotent matrix. 我們有
B− I3=
−1 −1 −1
1 0 0
0 1 1
, (B −I3)2=
0 0 0
−1 −1 −1
1 1 1
.
由 Proposition 4.2.2 的方法首先選 (B−I3)2的 column space 的 basis, 我們選 w1= (0,−1,1)t, 再加入 B−I3 的 column space 的元素 w2使得{w1, w2} 為 B−I3 的 column space 的 basis, 這裡我們選 w2= (−1,1,0)t. 最後再加入 w3∈ Q3 使得 {w1, w2, w3} 成為 Q3 的 basis, 此 處我們選 w3= (0, 0, 1)t. 此時有 Bw1 = w1, Bw2= w1+ w2, Bw3= w1+ w2+ w3, 故若令 Q1=
0 −1 0
−1 1 0
1 0 1
, 則 Q−11 · B · Q1=
1 1 1 0 1 1 0 0 1
為 upper triangular matrix.
另一方面因 µC(x) = (x− 2)2, 我們考慮 C− 2I2 這一個 nilpotent matrix. 因 C− 2I2= ( −1 −1
1 1 )
, 我們選 u1= ( −1
1 )
為 C− 2I2 的 basis, 再加上 u2= ( 1
0 )
使得 {u1, u2} 為 Q2 的 basis. 此時 Cu1= 2u1, Cu2= u1+ 2u2, 故若令 Q2=
( −1 1 1 0
)
, 則 Q−12 ·C · Q2= ( 2 1
0 2 )
為 upper triangular matrix. 最後將 Q1, Q2 合併為 5× 5 的 invertible matrix
Q =
0 −1 0 0 0
−1 1 0 0 0
1 0 1 0 0 0 0 0 −1 1 0 0 0 1 0
可得 upper triagular matrix
(P· Q)−1· A · (P · Q) = Q−1· (P−1· A · P) · Q =
1 1 1 0 0 0 1 1 0 0 0 0 1 0 0 0 0 0 2 1 0 0 0 0 2
.
若 T 是 diagonalizable, 我們可以利用對角化幫助我們求得 T◦i. 即利用 V 的 eigenvectors 所形成的 ordered basisβ 得 [T]β =
γ1 O
. ..
O γn
, 故可得 [T◦i]β =
γ1i O . ..
O γni
. 當
T 不能化為 diagonal form 時, 我們可利用 trianbular form 來幫助計算 T◦i.
首先將 V 寫成 T -invariant subspaces 的 direct sum V = V1⊕ ··· ⊕Vk. 由於任意 v∈ V, 都可以唯一寫成 v = v1+··· + vk, 其中 vi∈ Vi (Proposition 3.4.6). 對於所有的 i = 1, . . . , k, 我們可定義一個 linear operator πi : V → V, 其定義為 πi(v) = vi. 此 linear operator 稱 為 the projection to Vi with respect to the direct sum V = V1⊕ ··· ⊕Vk. 依此定義我們知 道對於所有 v∈ Vi, 皆有 πi(v) = v. 另一方面由於 Vi 為 T -invariant, 對於 v∈ Vi, 我們有 T (v)∈ Vi. 因此對於任意 v∈ V, 將之寫成 v = v1+··· + vk, 其中 vi∈ Vi, 則 T (πi(v)) = T (vi),
而 πi(T (v)) =πi(T (v1) +··· + T(vk)) = T (vi). 得證
T◦πi=πi◦ T, ∀i = 1,...,k. (4.1) Theorem 4.2.7. 假設 V 為 finite dimensional F-space. 若 T : V→ V 為 linear operator 其 minimal polynomial 為
µT(x) = (x−λ1)m1···(x −λk)mk
其中λ1, . . . ,λk 為 F 中相異的元素, 則 T = TD+ TN 其中 TD為 diagonalizable, TN 為 nilpotent of index m = max{m1, . . . , mk}, 而且 TD◦ TN= TN◦ TD.
Proof. 考慮 Primary Decomposition V = V1⊕ ··· ⊕Vk, 其中 Vi= Ker((T−λiid)◦mi), 且令 πi: V→ V 為 the projection to Vi with respect to the direct sum V = V1⊕ ··· ⊕Vk. 考慮 V 的 linear operator TD=λ1π1+··· +λkπk. 因對任意 vi∈ Vi, 皆有 TD(vi) =λivi, 所以每一組 Vi 的 basis, 皆由 TD 的 eigenvectors 所組成. 故由 V 為 V1, . . . ,Vk 的 direct sum, 這些 Vi 的 basis 可組成 V 的 basis. 也就是說 V 有一組 basis 皆由 TD 的 eigenvectors 所組成, 故 TD 為 diagonalizable.
現令 TN = T− TD 為 V 的 linear operator. 因對任意 vi∈ Vi, TN(vi) = T (vi)− TD(vi) = T (vi)−λivi ∈ Vi, 知 Vi 皆 為 TN-invariant. 又 已 知 µT|Vi(x) = (x−λi)mi, 即 mi 是 最 小 的 正整數使得 (T−λiid)◦mi(vi) = OV, ∀vi ∈ Vi, 故知 µTN|Vi(x) = xmi. 利用 Lemma 3.5.6 知 µTN(x) = lcm(xm1, . . . , xmk) = xm, 其中 m = max{m1, . . . , mk}, 得證 TN 為 nilpotent of index m.
最後因為
TD◦ T = (λ1π1+··· +λkπk)◦ T =λ1(π1◦ T) + ··· +λk(πk◦ T), 由等式 (4.1) 得
T◦ TD=λ1(T◦π1) +··· +λk(T◦πk) = TD◦ T.
因此得證
TD◦ TN= TD◦ (T − TD) = TD◦ T − TD◦ TD= T◦ TD− TD◦ TD= (T− TD)◦ TD= TN◦ TD.
Question 4.8. 考慮 Theorem 4.2.4 中的 ordered basis β, 若 [T]β 為 upper triangular matrix, 則 Theorem 4.2.7 中的 TD, TN 其對β 的 representative matrix [TD]β, [TN]β 應為何?
Question 4.9. 你能利用 Theorem 4.2.7, 證明若 T 的 minimal polynomial µT(x) 可以完全 分解成 F[x] 中相異的 monic 一次多項式之乘積, 則 T 為 diagonalizable?
由 Theorem 4.2.7, 我們便能利用 triangular form 來計算 T◦i 了. 由 TD◦TN= TN◦TD, 得 T◦2= (TD+ TN)◦ (TD+ TN) = TD◦2+ TD◦ TN+ TN◦ TD+ TN◦2= TD◦2+ 2TD◦ TN+ TN◦2. 故利用數學歸納法可得以下的二項式展開
T◦i=
∑
i j=0(i j
)
TD◦i− j◦ TN◦ j.
4.3. Jordan Form 79
由於 TD為 diagonalizable 我們很容易計算 TD◦ j, 而 TN 為 nilpotent of index m, 我們知道當 j≥ m, TN◦ j= O. 所以這是一個幫助我們計算 T◦i 的方法.
最後我們來看 Theorem 4.2.7 相對應的矩陣的形式.
Corollary 4.2.8. 假設 A∈ Mn(F) 且其 characteristic polynomial 和 minimal polynomial 分別為
χA(x) = (x−λ1)c1···(x −λk)ck,µA(x) = (x−λ1)m1···(x −λk)mk
其中 λ1, . . . ,λk 為 F 中相異的元素. 則存在 invertible matrix P 使得 P−1· A · P = D + N, 其中 D 為 diagonal matrix, N 為 nilpotent matrix 滿足 D· N = N · D 且 Nm= O, m = max{m1, . . . , mk}.
和 linear operator 的情況相同. 當 A 化成 triangular form P−1· A · P = D + N, 由於 D· N = N · D, 我們有
P−1· Ai· P =
∑
ij=0
(i j
)
Di− j· Nj. 因此得到一個幫助我們計算 Ai 的方法.
4.3. Jordan Form
將矩陣化為 Triangular form 並不容易讓我們判斷兩個矩陣是否為 similar. 我們將挑選 更好的 ordered basis 將其化為所謂的 Jordan form. 本節中我們仍假設 χT(x) 可以完全分 解成一次的多項式的乘積 (即 χT(x) = (x−λ1)c1···(x −λk)ck). 同樣的我們先討論 nilpotent 的情形.
對於一個 linear operator T : V → V. 這一次我們探討 T,T◦2, . . . 的 kernel 間的關係. 若 v∈ Ker(T◦i), 表示 T◦i(v) = OV, 故得 T◦i+1(v) = T (T◦i(v)) = OV. 所以我們自然有以下的 chain of subspaces
{OV} ⊆ Ker(T) ⊆ Ker(T◦2)⊆ ··· ⊆ Ker(T◦i−1)⊆ Ker(T◦i)⊆ ··· .
特別的, 當 T 為 nilpotent of index m, 我們有 Ker(T◦i+1)̸= Ker(T◦i), ∀i = 1,...,m − 1.
Lemma 4.3.1. 假設 dim(V ) > 0, 若 T 為 nilpotent operator of index m, 則我們有以下的 chain of subspaces.
{OV} ( Ker(T) ( Ker(T◦2)( ··· ( Ker(T◦i−1)( Ker(T◦i)( ··· ( Ker(T◦m−1)( Ker(T◦m) = V.
Proof. 首先說明 Ker(T◦m−1)( Ker(T◦m) = V . 因為 T◦m= O, 亦即對任意 v∈ V, T◦m(v) = OV, 所以 Ker(T◦m) = V . 另一方面, 若 Ker(T◦m−1) = Ker(T◦m) = V , 則表示 T◦m−1= O, 此與 m 為最小的正整數使得 T◦m= O 相矛盾, 故知 Ker(T◦m−1)̸= Ker(T◦m).
接 下 來 我 們 說 明 {OV} ( Ker(T). 對任意 v ∈ V 因 OV = T◦m(v) = T (T◦m−1(v)) 得 T◦m−1(v)∈ Ker(T). 現若 Ker(T) = {OV}, 則任意 v ∈ V 皆滿足 T◦m−1(v) = OV 而 得 到 T◦m−1= O 之矛盾, 故知 Ker(T )̸= {OV}.
同 理, 當 1≤ i ≤ m − 2, 因對於所有 v ∈ V 皆有 OV = T◦m(v) = T◦i+1(T◦m−(i+1)(v)), 即 T◦m−(i+1)(v)∈ Ker(T◦i+1). 現若 Ker(T◦i) = Ker(T◦i+1), 則由 T◦m−(i+1)(v)∈ Ker(T◦i) 得 OV = T◦i(T◦m−(i+1)(v)) = T◦m−1(v). 因為這是對任意 v∈ V 皆成立, 故得到 T◦m−1= O 之矛
盾, 得證 Ker(T◦i)̸= Ker(T◦i+1).
現假設 i≥ 2, 若 v1, . . . , vs∈ Ker(T◦i+1) 為 linearly independent 且 Span(v1, . . . , vs)∩ Ker(T◦i) ={OV}, 則 T (v1), . . . , T (vs)∈ Ker(T◦i) 亦為 linearly independent. 事實上若
r1T (v1) +··· + rsT (vs) = OV,
則由 T (r1v1+···+rsvs) = OV 得 r1v1+···+rsvs∈ Ker(T) ⊆ Ker(T◦i). 故由 Span(v1, . . . , vs)∩ Ker(T◦i) ={OV} 之假設得 r1v1+··· + rsvs= OV, 再由 v1, . . . , vs 為 linearly independent 得 r1=··· = rs= 0, 得證 T (v1), . . . , T (vs) 為 linearly independent. 另外我們也可得
Span(T (v1), . . . , T (vs))∩ Ker(T◦i−1) ={OV}.
這是因為若 v = r1T (v1) +··· + rsT (vs)∈ Ker(T◦i−1), 則
OV = T◦i−1(r1T (v1) +··· + rsT (vs)) = T◦i(r1v1+··· + rsvs),
即 r1v1+···+rsvs∈ Span(v1, . . . , vs)∩Ker(T◦i) ={OV}. 再由 v1, . . . , vs為 linearly independent 得 r1=··· = rs= 0, 得證 v = OV. 我們有以下之結論.
Lemma 4.3.2. 假設 T : V→ V 為 linear operator. 當 i ≥ 2 時, 若 v1, . . . , vs∈ Ker(T◦i+1)為 linearly independent 且 Span(v1, . . . , vs)∩ Ker(T◦i) ={OV}, 則 T(v1), . . . , T (vs)∈ Ker(T◦i) 為 linearly independent 且 Span(T (v1), . . . , T (vs))∩ Ker(T◦i−1) ={OV}.
特別地, 若 V 為 finite dimensional F-space, 則
dim(Ker(T◦i+1))− dim(Ker(T◦i))≤ dim(Ker(T◦i))− dim(Ker(T◦i−1)). (4.2) Proof. 我們僅剩要證明式子 (4.2). 假設{u1, . . . ut} 為 Ker(T◦i−1)的一組 basis, 將之擴大成 {u1, . . . ut, w1, . . . , wl} 使之為 Ker(T◦i)的一組 basis. 再擴大成{u1, . . . ut, w1, . . . , wl, v1, . . . , vs} 使 之為 Ker(T◦i+1) 的一 組 basis. 依 此得 v1, . . . , vs∈ Ker(T◦i+1) 為 linearly independent 且 Span(v1, . . . , vs)∩ Ker(T◦i) ={OV}. 由前面結果知 T(v1), . . . , T (vs)∈ Ker(T◦i) 為 linearly independent 且 Span(T (v1), . . . , T (vs))∩Ker(T◦i−1) ={OV}. 故 {u1, . . . ut, T (v1), . . . , T (vs)} 為 Ker(T◦i) 中的 linearly independent set. 得知 t + s≤ dim(Ker(T◦i)) = t + l, 亦即
dim(Ker(T◦i+1))− dim(Ker(T◦i)) = s≤ l = dim(Ker(T◦i))− dim(Ker(T◦i−1)).
接下來我們先說明何謂 Jordan form, 然後再說明如何得到 Jordan form.
4.3. Jordan Form 81
Definition 4.3.3. 給定λ ∈ F, 對於 1×1 matrix (λ) 以及如下形式的更高階 square matrix
λ 0 0 ··· 0 0 1 λ 0 ··· 0 0
0 1 λ 0 ··· 0
... . .. ... ... ... ...
0 ··· 0 1 λ 0 0 0 ··· 0 1 λ
,
也就是說對角線 (i, i)-th entry 為λ, 而對角線下方的位置即 (i,i − 1)-th entry 為 1, 其他位 置皆為 0 的矩陣, 我們稱為 elementary Jordan matrix associated with λ. 而由 associated withλ 的 elementary Jordan matrices 所組成的 block diagonal matrix, 即
J
1 . ..O O Jk
,
其中每個 Ji 皆為 elementary Jordan matrix associated with λ, 稱為 Jordan block matrix associated withλ.
注意有些書本的 elementary Jordan matrix 的定義為 1 在對角線的上方 (即 (i, i + 1) 的 位置), 不過只要將 ordered basis 順序前後對調, 不難發現這兩種矩陣為 similar.
Question 4.10. 假設 T : V → V 為 linear operator 且 β = (v1, v2, . . . , , vn−1, vn) 為 V 的 ordered basis. 若 [T ]β 為 elementary Jordan matrix associated with λ, 考慮 ordered basis β′= (vn, vn−1, . . . , v2, v1), 則 [T ]β′ 為何種形式的 matrix?
接下來我們說明 nilpotent linear operator 皆可找到 ordered basis 使其 representative matrix 為 Jordan block matrix associated with 0.
Proposition 4.3.4. 假設 V 為 finite dimensional F-space. 若 T : V→ V 是一個 nilpotent linear operator of index m, 則存在 V 的 ordered basis β 使得 [T]β 為 Jordan block matrix associated with 0.
Proof. 令 S1 為 Ker(T ) 的一組 basis, 將之擴大為 Ker(T◦2) 的一組 basis S2, 一直下去直到 得到 Sm 為 Ker(T◦m) = V 的一組 basis. 也就是說當 i = 1, . . . , m 時 Si 為 Ker(T◦i) 的 basis (注意 Lemma 4.3.1 告訴我們當 i = 2, . . . , m 時 Si−1( Si). 現考慮 {v1, . . . , vk1} = Sm\Sm−1 這 組 linear independent subset (它不是空集合). Corollary 1.4.4 告訴我們 Span({v1, . . . , vk1}) 和 Span(Sm−1) = Ker(T◦m−1) 的交集為 {OV} 故由 Lemma 4.3.2 知 {T(v1), . . . , T (vk1)} 為 Ker(T◦m−1)中的 linearly independent set 且 Span({T(v1), . . . , T (vk1)})∩Ker(T◦m−2) ={OV}, 故利用 Corollary 1.4.4 知{T(v1), . . . , T (vk1)}∪Sm−2為 Ker(T◦m−1)中的 linearly independent set. 若{T(v1), . . . , T (vk1)}∪Sm−2 亦為 Ker(T◦m−1)的 spanning set, 則它就是 Ker(T◦m−1)的 一組 basis. 而若 {T(v1), . . . , T (vk1)} ∪ Sm−2 不是 Ker(T◦m−1) 的 spanning set, 則我們可在 Ker(T◦m−1) 中選取 vk1+1, . . . , vk2 使得
{T(v1), . . . , T (vk1), vk1+1, . . . , vk2} ∪ Sm−2
為 Ker(T◦m−1) 中的一組 basis. 也就是說我們將集合 Sm−1\ Sm−2 用 {T(v1), . . . , T (vk1), vk1+1, . . . , vk2}
取代. 注意此時{v1, . . . , vk1, T (v1), . . . , T (vk1), vk1+1, . . . , vk2}∪Sm−2 仍為 Ker(T◦m) = V 的一組 basis.
接下來考慮取代 Sm−1\ Sm−2 的集合 {T(v1), . . . , T (vk1), vk1+1, . . . , vk2}. 再次利用 Lemma 4.3.2, 我們知{T◦2(v1), . . . , T◦2(vk1), T (vk1+1), . . . , T (vk2)} ∪ Sm−3 為 Ker(T◦m−2) 中的 linearly independent set. 所以再加入 Ker(T◦m−2) 中的元素 vk2+1, . . . , vk3 使得
{T◦2(v1), . . . , T◦2(vk1), T (vk1+1), . . . , T (vk2), vk2+1, . . . , vk3} ∪ Sm−3
為 Ker(T◦m−2) 的 basis. 也就是說我們將 Sm−2\ Sm−3 集合用
{T◦2(v1), . . . , T◦2(vk1), T (vk1+1), . . . , T (vk2), vk2+1, . . . , vk3}
取代. 這樣一直下去, 簡單的說就是將取代 Si+1\Si的集合 S′i+1代入 T 得到 T (S′i+1)這一組在 Ker(T◦i) 的 linearly independent set, 再加入 Ker(T◦i)中的子集合 S′′i 使得 T (S′i+1)∪S′′i ∪Si−1
為 Ker(T◦i) 的 basis. 接著就是將 Si/Si−1 用 Si′= T (S′i+1)∪ S′′i 取代. 我們用以下圖表來表示:
Sm\ Sm−1 v1, . . . vk1
Sm−1\ Sm−2 T (v1), . . . , T (vk1), vk1+1, . . . , vk2
Sm−2\ Sm−3 T◦2(v1), . . . , T◦2(vk1), T (vk1+1), . . . , T (vk2), vk2+1, . . . , vk3 ..
.
.. .
.. .
.. .
.. .
S1 T◦m−1(v1), . . . , T◦m−1(vk1), T◦m−2(vk1+1), . . . , T◦m−2(vk2), T◦m−3(vk2+1), . . . , T◦m−3(vk3), ··· T (vkm−2+1), . . . , T (vkm−1), vkm−1+1, . . . , vkm
最後一個步驟就是將取代 S2\ S1 的元素
T◦m−2(v1), . . . , T◦m−2(vk1), T◦m−3(vk1+1), . . . , T◦m−3(vk2), . . . ,
T (vkm−3+1), . . . , T (vkm−2), vkm−2+1, . . . , vkm−1 代入 T , 得到 Ker(T ) 中的 linearly independent set
{T◦m−1(v1), . . . , T◦m−1(vk1), T◦m−2(vk1+1), . . . , T◦m−2(vk2), . . . ,
T◦2(vkm−3+1), . . . , T◦2(vkm−2), T (vkm−2+1), . . . , T (vkm−1)} 再加入 Ker(T ) 中的元素 vkm−1+1, . . . , vkm 使其成為 Ker(T ) 的 basis. 所以上面圖表的最後一 個 row 的元素就是取代 S1 的元素, 即 Ker(T ) 的 basis. 將之與取代 S2\ S1 的集合聯集就 是取代 S2 的元素, 即 Ker(T◦2) 的 basis. 同理圖表中取代 Si\ Si−1 的那一個 row 及其以下 各 row 的元素即為組成 Ker(T◦i) 的 basis. 也因此上表中的各元素即組成 V = Ker(T◦m) 的 basis. 考慮將它們按順序一個 column 一個 column 由上往下排序所形成的 ordered basis β, 即 β 的第一個元素為 v1 接著為 T (v1), 一直到第 m 個為 T◦m−1(v1) 接著放 v2, T (v2), . . . 這樣一直下去最後依序為 vkm−1, T (vkm−1), vkm−1+1, . . . , vkm. 很容易看出 [T ]β 便是一個 Jordan