• 沒有找到結果。

Linear Operator

N/A
N/A
Protected

Academic year: 2022

Share "Linear Operator"

Copied!
24
0
0

加載中.... (立即查看全文)

全文

(1)

Chapter 3

Linear Operator

當 V 是一個 vector space 時, 從 V 到 V 的 linear transformation, 就稱為是一個 linear operator on V . 當 T : V → V 是一個 linear operator 時, 我們很自然的可以考慮其合成 T◦2= T◦ T, 以及 T◦3= T◦ T◦2, . . . 這樣一直下去對任意 i∈ N 都可以定出 T◦i= T◦ T◦i−1 (T◦0= id). 如此一來賦予 V 一個很豐富的代數結構 (稱為 F[T ]-module), 所以我們可以進 一步去了解 T 和 V 的關係. 這就是我們這一章進一步談 linear operator 的原因. 由於大家 可能對代數不是很熟悉, 所以我們會避免使用太多額外的代數語言, 用大家熟悉的方法 (藉 由矩陣, 行列式) 來介紹相關的理論.

3.1. Basic Concept

一個 linear operator 就是一個 linear transformation 所以前一章的理論我們都可以利用.

由於定義域和對映域是同一個 vector space, 我們可以選相同的 ordered basis, 這會讓矩陣表 示法變得較簡單. 也就是說若 T : V→ V 是一個 linear operator, 要得到 T 的 representative matrix, 我們可以選定 V 的一個 ordered basisβ = (v1, . . . , vn),兩邊都用β, 得β[T ]β 這一個 n× n matrix. 為了方便起見當兩邊選的 ordered basis 相同時, T 的 representative matrix, 我們就會用 [T ]β 來表示, 也就是說

[T ]β =(

τβ(T (v1)), . . . ,τβ(T (vn))) .

例如若 T1, T2 皆為 V 的 linear operator, 由 Chapter 2 的 Proposition 2.4.5 我們知

[T2◦ T1]β= [T2]β· [T1]β. (3.1) 另外依此表法, 我們有 [id]β = In.

習慣上我們會把 V 的 linear operators 所成的 vector space L (V,V) 簡化成 L (V). 又 因為這裡的矩陣皆為 n×n 的方陣, 所以我們用 Mn(F) 來表示所有 over F 的 n×n matrices.

利用這些符號, 當固定一個 V 的 ordered basisβ 時, Theorem 2.4.4 告訴我們可以得到一個 L (V) 到 Mn(F) 的 isomorphism, 即 Φ : L (V) → Mn(F), T 7→ [T]β. 特別的由於 [id]β = In, 我們有 [T ]β= In 若且唯若 T = id. 同理 [T ]β 是一個 zero matrix 若且唯若 T : V → V 是 zero 41

(2)

mapping, 即 T (v) = OV,∀v ∈ V. 為了方便起見, 我們將 zero matrix 和 zero mapping 都用 O 表示. 所以我們有以下之結論.

Lemma 3.1.1. 假設 V 為 finite dimensional vector space, dim(V ) = n 且 β 為 V 的一個 ordered basis. 設 T : V → V 為 linear operator, 我們有以下結果:

[T ]β= In⇔ T = id and [T]β = O⇔ T = O.

前面說過考慮 linear operator 時, 我們幾乎都會選定義域和對映域有相同的 ordered basis. 不過有一個例外, 就是 identity 這個 linear operator, id : V→ V. 因為對同一個 linear operator 若換另外的一個 ordered basis 來處理, 它的 representative matrix 就可能不一樣 了, 我們需了解這樣的 matrices 之間有何關係, 就得靠β[id]β 這樣的 change of basis matrix 來幫忙了. 利用 Proposition 2.4.6, 我們有以下之結果.

Lemma 3.1.2. 設 β,β 為 V 的 ordered bases, T : V → V 為 linear operator, 則 [T ]β=β[id]−1β · [T]β·β[id]β.

Proof. 利用 Proposition 2.4.6, 我們知 [T ]β =β [id]β· [T]β·β[id]β. 然而若 dim(V ) = n, 由 式子 (2.6) 我們知

β[id]β·β[id]β=β[id]β·β[id]β = In,

亦即β[id]β=β[id]−1β , 得證本定理. 

當 A, B∈ Mn(F), 而 P 為 Mn(F) 中的 invertible matrix, 若 B = P−1· A · P, 則稱 A,B 為 similar matrix, 用 A∼ B 來表示. 此時因 det(P−1) = det(P)−1

det(B) = det(P−1· A · P) = det(P−1) det(A) det(P) = det(A).

由 Lemma 3.1.2 我們知道 [T ]β ∼ [T]β, 故得 det([T ]β) = det([T ]β). 也就是說不管用哪一個 ordered basis, T 的 representative matrix 的 determinant 皆相同, 我們也因此定義這就是 T 的 determinant, 也就是說 det(T ) = det([T ]β).

Lemma 3.1.2 反過來是對嗎? 有就是說若 A∼ [T]β, 是否可找到 V 的一個 ordered basis β 使得 A = [T ]β 呢? 事實上, 若 P 是一個 invertible matrix 使得 A = P−1· [T]β· P, 則由 Proposition 2.4.7, 我們能找到 V 的一個 ordered basis β 滿足 P =β [id]β, 故由 Lemma 3.1.2 知

A = P−1· [T]β· P =β [id]−1β · [T]β·β[id]β = [T ]β. 因此我們有以下之結論.

Proposition 3.1.3. 假設 V 為 finite dimensional vector space, dim(V ) = n 且β 為 V 的一 個 ordered basis. 設 T : V→ V 為 linear operator 且 A ∈ Mn(F), 則 A∼ [T]β 若且唯若存在 V 的一個 ordered basisβ 使得 A = [T ]β.

(3)

3.1. Basic Concept 43

當我們要探討一個 linear operator 的性質時, 我們可以固定一個 ordered basis 將之轉 換成 square matrix 的問題, 而 Proposition 3.1.3 告訴我們這些性質應對於 similar matrices 應是不變的, 以後我們會看到許多例子和這事實相呼應. 我們先看一個簡單的情形.

Lemma 3.1.4. 假設 V 為 finite dimensional vector space,β 為 V 的一個 ordered basis 且 T : V → V 為 linear operator, 則下列是等價的:

(1) T 是一個 isomorphism.

(2) [T ]β 是一個 invertible matrix.

(3) det(T )̸= 0.

Proof. 我們知 [T ]β 是一個 invertible matrix 若且唯若 det([T ]β)̸= 0, 所以僅要證 (1) ⇔ (2).

假設 dim(V ) = n, 由 T 是 isomorphism, 知 T◦−1 存在且為 linear operator, 故由 [T◦−1]β· [T]β = [id]β= [T ]β· [T◦−1]β 以及 [id]β = In

知 [T ]β 為 invertible. 反之, 若 A· [T]β = In, 由 Φ : L (V) → Mn(F), 為 isomorphism, 知存 在 T: V → V 使得 Φ(T) = [T]β= A. 故由 [T◦ T]β = [T]β· [T]β = In 以及 Lemma 3.1.1 得 T◦ T = id, 同理由 [T]β· [T]β= In 得 T◦ T= id, 得證 T 為 isomorphism.  Question 3.1. 可否從 Lemma 3.1.4 知若 A∼ B 則 A 是 invertible 若且唯若 B 是 invertible.

由這裡我們可以看出求一個談論 linear operator 的性質離不開 determinant, 我們在這 裡複習一個求 determinant 的方法. 若 A∈ Mn(F), 令 aik∈ F 表示在 A 的 (i,k)-th entry (即 在 A 的 i-th row 及 k-th column 位置的元素), 且令 Aik∈ Mn−1(F) 為將 A 的 i-th row 和 k-th column 刪除後所得的 (n− 1) × (n − 1) matrix. 我們可以用降階的方法求 det(A) 即對 i-th row 降階, 得

det(A) =

n k=1

(−1)i+kaikdet(Aik), 也可對 j-th column 降階得

det(A) =

n k=1

(−1)k+ jak jdet(Ak j).

我們也可定義一個 n×n matrix 稱為 adjoint matrix of A, 用 adj(A) 來表示, 其定義為 adj(A) 的 (i, j)-th entry 為

adj(A)i j= (−1)i+ jdet(Aji).

利用此矩陣我們有以下的結果.

Lemma 3.1.5. 假設 A 為 n× n matrix, 令 adj(A) 為 A 的 adjoint matrix, 則 A· adj(A) = adj(A) · A = det(A)In.

(4)

Proof. det(A)In 是一個 diagonal matrix, 即在對角線的位置是 det(A) 而其他非對角線位置 為 0. 先檢查 A· adj(A) 的 (i,i)-th entry, 依矩陣乘法定義此即

n k=1

aikadj(A)ki=

n k=1

(−1)k+iaikdet(Aik) = det(A).

另一方面當 i̸= j, A · adj(A) 的 (i, j)-th entry, 依矩陣乘法定義為

n k=1

aikadj(A)k j=

n k=1

(−1)k+ jaikdet(Ajk).

若將矩陣 A 的 j-th row 用 i-th row 取代, 所得的矩陣用 A 表示, 由於 A 的 i-th row 和 j-th row 相同, 我們知 det(A) = 0. 然而利用 A 的 ( j, k)-th entry ajk 為 aik 以及 Ajk= Ajk, 對 A 的 j-th row 降階, 我們有

0 = det(A) =

n k=1

(−1)j+kajkdet(Ajk) =

n k=1

(−1)j+kaikdet(Ajk), 故知當 i̸= j 時 A · adj(A) 的 (i, j)-th entry 為

n k=1

aikadj(A)k j=

n k=1

(−1)k+ jaikdet(Ajk) = 0.

得證 A· adj(A) = det(A)In. 同理, 利用對 column 降階求 determinant, 可得 adj(A)· A =

det(A)In. 

3.2. Characteristic Polynomial

前面提過一個 linear operator 的問題, 我們可以轉化成有關於 square matrix 的問題, 所 以我們會先探討一般 n× n matrix, 然後再將之轉化成 linear operator 的情形.

給定一個係數在 F 的 polynomial f (x) = cdxd+··· + c1x + c0 以及一個 n× n matrix A, 我們定義

f (A) = cdAd+··· + c1A + c0In.

很明顯的, f (A) 仍然是一個 n× n matrix. 一般來說矩陣相乘是不可交換的, 不過 Ai 和 f (A) 相乘是可以交換的. 事實上

Ai· f (A) = Ai· (cdAd+··· + c1A + c0In)

= cdAd+i+··· + c1A1+i+ c0Ai= (cdAd+··· + c1A + c0In)· Ai= f (A)· Ai. 因此加上利用矩陣加法乘法的分配律, 我們可以得到以下的結果.

Lemma 3.2.1. 假設 f (x), g(x), h(x)∈ F[x] 且 f (x) = g(x)h(x). 若 A ∈ Mn(F), 則 g(A)· h(A) = h(A) · g(A) = f (A).

再次強調這裡都是和 A 相關的矩陣相乘才會成立, 一般來說若 g(x), h(x)∈ F[x] 以及 A, B∈ Mn(F), 不一定會有 g(A)· h(B) = h(B) · g(A).

接下來我們有興趣的是若 A∼ B, 是否 f (A) ∼ f (B) 呢? 首先觀察若 P 為 invertible, 則 (P−1· A · P)2= (P−1· A · P) · (P−1· A · P) = P−1· A2· P.

(5)

3.2. Characteristic Polynomial 45

利用數學歸納法可得

(P−1· A · P)i= P−1· Ai· P.

我們有以下結果.

Lemma 3.2.2. 假設 f (x)∈ F[x] 且 A,B ∈ Mn(F). 若 A∼ B, 則 f (A) ∼ f (B).

Proof. 由 A∼ B 知存在 P 為 invertible 使得 B = P−1· A · P. 若 f (x) = cdxd+··· + c1x + c0, 則

f (B) = cdBd+··· + c1B + c0In= cd(P−1· A · P)d+··· + c1(P−1· A · P) + c0In

= cd(P−1·Ad·P)+···+c1(P−1·A·P)+c0In= P−1·(cdAd+···+c1A + c0In)·P = P−1· f (A)·P,

得證 f (A)∼ f (B). 

我們也可把這概念推廣到 linear operator, 假設 f (x) = cdxd+··· + c1x + c0∈ F[x] 以及 T : V → V 是一個 linear operator, 由於 linear operators 之間的合成和矩陣之間的相乘相對 應 (參見式子 (3.1)), 我們定義

f (T ) = cdT◦d+··· + c1T + c0id,

很明顯的 f (T ) 仍然是 V 到 V 的 linear operator. 我們可以檢查 T◦i◦ f (T) = f (T) ◦ T◦i, 所 以一樣有以下結果.

Lemma 3.2.3. 假設 f (x), g(x), h(x)∈ F[x] 且 f (x) = g(x) · h(x). 若 T ∈ L (V), 則 g(T )◦ h(T) = h(T) ◦ g(T) = f (T).

這裡要強調一下當 f (x) = g(x)· h(x) 時 f (T) = g(T) ◦ h(T) 而不是等於 g(h(T)). 也就是 說將 g(T ) 和 h(T ) 這兩個 linear operator 合成會得到 f (T ) 這個 operator, 但並不是將 h(T ) 這個 linear operator 代入 g(x) 這個多項式.

給定 V 的一個 ordered basis β 我們自然要問 F(T) 的 representative matrix 是否和 T 的 representative matrix 有關. 事實上再次利用等式 3.1, 我們有 [T◦2]β= [T ]2β, 利用數學歸 納法可得

[T◦i]β= [T◦ T◦i−1]β= [T ]β· [T]iβ−1= [T ]iβ, 由此我們有以下之結果.

Lemma 3.2.4. 假設 V 是一個 finite dimensional F-space,β 為 V 的一個 ordered basis 且 T : V → V 是一個 linear operator. 若 f (x) = cdxd+··· + c1x + c0∈ F[x], 則

[ f (T )]β = f ([T ]β) = cd[T ]dβ+··· + c1[T ]β+ c0In.

Proof. 依定義 [ f (T )]β 是 f (T ) 的 representative matrix, 利用Φ 是 linear transformation, 我們知

[ f (T )]β= [cdT◦d+··· + c1T + c0id]β =

cd[T◦d]β+··· + c1[T ]β+ c0[id]β= cd[T ]dβ+··· + c1[T ]β+ c0In= f ([T ]β).

(6)

 現在回到 n× n matrix 的情形. 我們知 dim(Mn(F)) = n2, 現若 A∈ Mn(F), 考慮 S = {In, A, A2, . . . , An2}. 由於 #(S) = n2+ 1 > dim(Mn(F)), 我們知 S 為 linearly dependent. 亦即 存在 c0, c1, . . . , cn2 ∈ F 不全為 0 使得

cn2An2+··· + c1A + c0In= O.

若令 f (x) = cn2xn2+··· + c1x + c0, 則得 f (A) = O. 因此我們可以說: 對任意的 n× n matrix A, 皆存在一個次數不大於 n2 的非零多項式 f (x)∈ F[x] 使得 f (A) 為 n × n 的 zero matrix O. 注意這裡 cn2 有可能是 0 所以我們不能說 deg( f (x)) = n2, 另外 cn2, . . . , c1, c0 不全為 0, 所 以 f (x) 不是零多項式.

Question 3.2. 若 A∼ B 且 f (x) ∈ F[x] 滿足 f (A) = O, 是否可得 f (B) = O?

Question 3.3. 若 dim(V ) = n 且 T : V→ V 是一個 linear operator, 是否可找到一個 nonzero polynomial f (x)∈ F[x] 且 deg( f (x)) ≤ n2 使得 f (T ) = O?

事實上我們可以找到次數為 n 的多項式 f (x) 使得 f (A) = O, 就是所謂的 characteristic polynomial.

Definition 3.2.5. 假設 A∈ Mn(F), 考慮χA(x) = det(xIn−A) ∈ F[x], 稱為 A 的 characteristic polynomial.

注意有的書定義 det(A−xIn)為 A 的 characteristic polynomial, 我們用 det(xIn−A) 主要 是讓χA(x) 是一個 monic polynomial (最高次項係數為 1). 利用降階求 determinant 的方法 以及數學歸納法, 我們可以知當 A 為 n×n matrix 時,χA(x) 的次數為 n 且最高次項係數為 1.

也可更進一步得到χA(x) 的次高項 (即 xn−1 項) 係數為−tr(A) (註: tr(A) 為 A 的 trace, 即對 角線之和). 另外將 x = 0 代入χA(x) 可得χA(x) 的常數項為 χA(0) = det(−A) = (−1)ndet(A).

Example 3.2.6. 由於 xIn− In= (x− 1)In, 我們可得 χIn(x) = det((x− 1)In) = (x− 1)n. 我們 計算幾個 2× 2 matrix 的 characteristic polynomial. 考慮

A1=

( 1 −1 1 −1

) , A2=

( 1 −1 0 −1

) , A3=

( 1 −1 2 −1

) ,

χA1 = det

( x− 1 1

−1 x + 1 )

= (x− 1)(x + 1) + 1 = x2, χA2 = det

( x− 1 1 0 x + 1

)

= (x− 1)(x + 1) = x2− 1, χA3 = det

( x− 1 1

−2 x + 1 )

= (x− 1)(x + 1) + 2 = x2+ 1.

Question 3.4. 試檢查看看 χI2(I2), χA1(A1), χA2(A2), χA3(A3) 是哪些矩陣.

接下來我們來看看 similar matrices 它們的 characteristic polynomial 有什麼關係.

(7)

3.2. Characteristic Polynomial 47

Proposition 3.2.7. 若 A, B∈ Mn(F) 且 A∼ B, 則 χA(x) =χB(x).

Proof. 由 A∼ B 知存在 invertible matrix P 使得 B = P−1· A · P. 因 xIn 為 diagonal matrix, 我們知 xIn· P = P · xIn, 故有 P−1· xIn· P = xIn. 因此

xIn− B = xIn− P−1· A · P = P−1· xIn· P − P−1· A · P = P−1· (xIn− A) · P.

得證

χB(x) = det(xIn− B) = det(P−1· (xIn− A) · P) = det(P)−1det(xIn− A)det(P) =χA(x).

 特別的, 當 T : V→ V 是一個 linear operator, β,β 為 V 的 ordered bases, 由於 [T ]β [T ]β, Proposition 3.2.7 告訴我們 χ[T ]β(x) =χ[T ]β(x). 因此我們可以定義 linear operator 的 characteristic polynomial.

Definition 3.2.8. 假設 V 為 finite dimensional F-space. 對於 V 的 linear operator T : V V , 任取 V 的一個 ordered basis β, 定義 T 的 characteristic polynomial 為 χ[T ]β(x), 且以 χT(x) 來表示.

由 於 A 的 characteristic polynomial 牽 涉 到 xIn− A 這樣的矩陣, 也就是說矩陣的 entry 中有多項式, 現在我們來探討這一類的矩陣. 首先, 我們可以將這一類的矩陣寫成 xdAd+··· + xA1+ A0, 其中 Ai∈ Mn(F) 這樣的型式. 例如我們可以有以下的表示法

( 5x2+ 3 4x− 1 7 x3− 2x2+ x

)

= x3

( 0 0 0 1

) + x2

( 5 0 0 −2

) + x

( 0 4 0 1

) +

( 3 −1 7 0

) . 由 於 我 們 是 將 F 的 元 素 代 入 x, 所 以 我 們 可 將 xA 視 為 常 數 x 乘 上 矩 陣 A. 因 此 當 A, B∈ Mn(F), 由矩陣乘法 (rA)· (sB) = (rs)A · B, 我們有

(xiA)· (xjB) = xi+ jA· B.

例如因矩陣加法乘法有分配律, 我們有

(A + xB)2= (A + xB)· (A + xB) = A2+ A· (xB) + xB · A + (xB)2= A2+ x(A· B + B · A) + x2B2, 不過要注意因矩陣乘法沒有交換律, (A + xB)2 不一定等於 A2+ 2x(A· B) + x2B2.

當兩個 entry 中有多項式的 square matrices 相乘時, 我們可以它們如同一般的矩陣來相 乘. 也可利用上面的方法將它們有 x 的部分提出, 然後像多項式相乘一樣展開. 由於這樣處 理仍依循著矩陣乘法的規律, 所以得到的結果會相同. 我們看一個例子.

Example 3.2.9. 考慮

( 5x2+ 3 4x− 1

7 x

)

= x2

( 5 0 0 0

) + x

( 0 4 0 1

) +

( 3 −1 7 0

) .

以及 (

x− 1 1

−x x + 2 )

= x

( 1 0

−1 1 )

+

( −1 1 0 2

) .

(8)

直接相乘我們有

( 5x2+ 3 4x− 1

7 x

)

·

( x− 1 1

−x x + 2 )

=

( 5x3− 9x2+ 4x− 3 9x2+ 7x + 1

−x2+ 7x− 7 x2+ 2x + 7 )

, 而另一邊如多項式相乘展開有

( x2

( 5 0 0 0

) + x

( 0 4 0 1

) +

( 3 −1 7 0

))

· (

x

( 1 0

−1 1 )

+

( −1 1 0 2

))

= x3

( 5 0 0 0

)( 1 0

−1 1 )

+ x2

(( 5 0 0 0

)( −1 1 0 2

) +

( 0 4 0 1

)( 1 0

−1 1 ))

+ x

(( 0 4 0 1

)( −1 1 0 2

) +

( 3 −1 7 0

)( 1 0

−1 1 ))

+

( 3 −1 7 0

)( −1 1 0 2

)

= x3

( 5 0 0 0

) + x2

( −9 9

−1 1 )

+ x

( 4 7 7 2

) +

( −3 1

−7 7 )

所以兩種算法結果是相等的.

接著我們要強調若 xdAd+··· + xA1+ A0= xdBd+··· + xB1+ B0, 其中 Ai, Bi∈ Mn(F), 則 Ai= Bi,∀i = 0,1,...,d. 這是因為若有某個 Ai̸= Bi, 表示等式兩邊的矩陣有個 entry 其 xi 的 係數不相同, 造成矛盾. 了解了這些概念, 我們就可以處理 characteristic polynomial 的重要 性質.

Theorem 3.2.10 (Cayley-Hamilton Theorem). 若 A∈ Mn(F), χA(x) 為 A 的 characteristic polynomial, 則 χA(A) = O.

Proof. 令 χA(x) = xn+··· + c1x + c0. 利用 xIn− A 的 adjoint matrix, 由 Lemma 3.1.5 我們

adj(xIn− A) · (xIn− A) = det(xIn− A)InA(x)In= xnIn+··· + xc1In+ c0In.

若將 xIn−A 的 i-th row 和 k-th column 移除, 所得的 (n−1)×(n−1) matrix 其 determinant 為次數小於 n 的多項式, 所以依 adjoint matrix 的定義 adj(A− xIn) 的每個 entry 皆為次數 小於 n 的多項式, 故假設 adj(A− xIn) = xn−1Bn−1+··· + xB1+ B0, 其中 Bi∈ Mn(F). 因此我 們有以下的等式

(xn−1Bn−1+ xn−2Bn−2+··· + xB1+ B0)· (xIn− A) = xnIn+ xn−1cn−1In+··· + xc1In+ c0In (3.2) 將等式 (3.2) 左邊展開, 我們得

(xn−1Bn−1+ xn−2Bn−2+··· + xB1+ B0)· (xIn− A)

= xn(Bn−1· In) + xn−1(Bn−2· In− Bn−1· A) + ··· + x(B0· In− B1· A) − B0· A

(9)

3.3. Minimal Polynomial 49

應該和等式 (3.2) 右式相同, 故比較係數得

−B0· A = c0In B0· In− B1· A = c1In

...

Bn−2· In− Bn−1· A = cn−1In Bn−1· In = In

將第一式不動, 第二式兩邊右乘 A, 第三式兩邊右乘 A2, . . . , 最後一式兩邊右乘 An, 我們得

−B0· A = c0In B0· A − B1· A2 = c1A

...

Bn−2· An−1− Bn−1· An = cn−1An−1 Bn−1· An = An 因未左邊全部加起來會等於右邊全部加起來, 得證

O = An+ cn−1An−1+··· + c1A + c0InA(A).

 當β 為 V 的一個 ordered basis, T : V → V 為 linear operator, 我們定義 χT(x) =χ[T ]β(x).

此時χT(T ) 為 linear operator, 其對 β 的 representative matrix , 依 Lemma 3.2.4 知為 [χ[T ]β(T )]β[T ]β([T ]β).

故由 Theorem 3.2.10 知 [χT(T )]β = O, 因此利用 Lemma 3.1.1 得知 χT(T ) = O. 這就是 linear operator 版本的 Cayley-Hamilton Theorem.

Corollary 3.2.11 (Cayley-Hamilton Theorem). 若 V 為 finite dimensional F-space, T : V → V 為 linear operator, 則 χT(T ) = O.

3.3. Minimal Polynomial

若 A 是 n× n matrix, 利用 A 的 characteristic polynomial, 我們知道存在次數為 n 的多 項式 f (X)∈ F[x] 使得 f (A) = O. 會不會有次數更小的多項式可以達到這個目的呢? 這是有 可能的, 例如 A = In 時, χIn(x) = (x− 1)n, 但考慮 f (x) = x− 1, 我們有 f (In) = In− In= O. 所 以我們想要找到次數最小的非零多項式 f (X)∈ F[x] 使得 f (A) = O.

Definition 3.3.1. 設 A∈ Mn(F), 在所有非零多項式 f (x)∈ F[x] 中滿足 f (A) = O, 且次數 最小的 monic polynomial (即最高次項係數為 1) 稱為 A 的 minimal polynomial, 用 µA(x) 來表示.

(10)

我們知道一定存在次數最小的非零多項式 f (x)∈ F[x] 使得 f (A) = O, 而這裡要求 monic 就是要求唯一性. 事實上若 f (x), g(x)∈ F[x] 為次數最小的非零 monic polynomial 使得 f (A) = g(A) = O, 因皆為次數最小故必有 deg( f ) = deg(g), 又要求 f (x), g(x) 為 monic, 故 知 deg( f (x)− g(x)) < deg( f (x)). 但此時 f (A) − g(A) = O − O = O, 故由次數最小的要求知

f (x)− g(x) 必為零多項式, 即 f (x) = g(x), 所以 minimal polynomial µA(x) 是唯一的.

接下來我們要問若 A∼ B, 那麼它們的 minimal polynomial µA(x),µB(x) 是否相等. 首先 來看一個 minimal polynomial 最基本的性質.

Lemma 3.3.2. 假設 A∈ Mn(F) 且 f (x)∈ F[x]. 則 f (A) = O 若且唯若 µA(x)| f (x).

Proof. 假設 f (x)|µA(x), 表示存在 h(x)∈ F[x] 使得 f (x) =µA(x)h(x), 因 µA(A) = O, 利用 Lemma 3.2.1 知 f (A) =µA(A)·h(A) = O·h(A). 因為零矩陣乘以任何同階的矩陣亦為零矩陣, 故得 f (A) = O.

另一方面, 因 F 是一個 field, 考慮多項式的除法 f (x) =µA(x)h(x) + r(x), 其中 h(x), r(x)∈ F[x] 且 deg(r(x)) < deg(µA(x)). 由 f (A) = O 的假設我們得

O = f (A) =µA(A)· h(A) + r(A) = O · h(A) + r(A) = r(A).

亦即 r(x)∈ F[x] 是一個次數比µA(x) 小卻滿足 r(A) = O 的多項式. 依µA(x) 是 A 的 minimal polynomial 之定義得 r(x) 為零多項式, 得證 f (x) 是 µA(x) 的倍式, 即 µA(x)| f (x).  現若 A∼ B, 利用 Lemma 3.2.2 知µA(B)∼µA(A) = O, 然而和零矩陣 similar 的矩陣必為 零矩陣 (因對任意 invertible matrix P, P−1·O·P = O), 故得 µA(B) = O. 由 Lemma 3.3.2 知 µB(x)|µA(x). 同理利用 µB(A)∼µB(B) = O, 得 µA(x)|µB(x). 然而 µA(x),µB(x) 皆為 monic, 故得µA(x) =µB(x). 證得以下之結果.

Proposition 3.3.3. 若 A, B∈ Mn(F) 且 A∼ B, 則 µA(x) =µB(x).

我們也可以定一個 linear operator 的 minimal polynomial.

Definition 3.3.4. 設 V 為一個 finite dimensional F-space, T : V→V 為一個 linear operator.

在所有非零多項式 f (x)∈ F[x] 中滿足 f (T) = O, 且次數最小的 monic polynomial 稱為 T 的 minimal polynomial, 用µT(x) 來表示.

同 matrix 的情形, T 的 minimal polynomial 必存在且唯一. 利用 Lemma 3.3.2 相同的 證明方法 (需用到零函數和任何函數合成仍為零函數) 我們會有以下結果.

Lemma 3.3.5. 假設 V 為一個 finite dimensional F-space, T : V→V 為一個 linear operator.

則 f (T ) = O 若且唯若 µT(x)| f (x).

Question 3.5. 你會證明 Lemma 3.3.5 嗎?

β 為 V 的 ordered basis, T 的 characteristic polynomial χT(x) 是由 T 的 representative matrix [T ]β 的 characteristic polynomial χ[T ]β(x) 定義而得. 不過 T 的 minimal polynomial µT(x) 並不是由µ[T ]β 定義得到, 所以我們要探討它們是否相同.

(11)

3.3. Minimal Polynomial 51

Proposition 3.3.6. 設 V 為一個 finite dimensional F-space, β 為 V 的一個 ordered basis 且 T : V → V 為 linear operator. 則

µT(x) =µ[T ]β(x).

Proof. 首先注意, 若 f (x)∈ F[x], 則利用 Lemma 3.2.4 以及 Lemma 3.1.1 我們有 f (T ) = O⇔ [ f (T)]β= O⇔ f ([T]β) = O.

所以由 µT(T ) = O 可得 µT([T ]β) = O, 故由 Lemma 3.3.2 知 µ[T ]β(x)|µT(x). 同樣的由 µ[T ]β([T ]β) = O, 可得 µ[T ]β(T ) = O, 故知 µT(x)|µ[T ]β(x). 又因 µT(x),µ[T ]β(x) 皆為 monic

polynomial, 得證µT(x) =µ[T ]β(x). 

最後我們來探討 minimal polynomial 和 characteristic polynomial 之間的關係.

Theorem 3.3.7.

(1) 假設 A∈ Mn(F), 則 µA(x)|χA(x). 而且 λ ∈ F 滿足 χA(λ) = 0 若且唯若 µA(λ) = 0.

(2) 假設 V 為 finite dimensional F-space, T : V→V 為 linear operator, 則µT(x)|χT(x).

而且 λ ∈ F 滿足 χT(λ) = 0 若且唯若 µT(λ) = 0.

Proof.

(1) 因χA(A) = O, 由 Lemma 3.3.2 知µA(x)|χA(x). 由此可得若µA(λ) = 0 則 χA(λ) = 0.

反之, 若 χA(λ) = 0, 則表示 det(λIn− A) = 0 亦即 λIn− A 不是 invertible matrix.

現考慮 µA(x) 除以 x−λ, 得 µA(x) = (x−λ)h(x) + r, 其中 h(x) ∈ F[x] 且 r ∈ F. 代 入 A, 得 O =µA(A) = (A−λIn)· h(A) + rIn. 若 r̸= 0, 由 (λIn− A) · h(A) = rIn 得 (λIn− A) · r−1h(A) = In. 此代表 r−1h(A) 為 λIn− A 的 inverse, 與 λIn− A 不是 invertible matrix 相矛盾, 得知 r = 0, 亦即 x−λ | µA(x). 得證 µA(λ) = 0.

(2) 對於 linear operator T : V→V, 選定 V 的一個 ordered basisβ, 由於 χT(x) =χ[T ]β(x) 以及 µT(x) =µ[T ]β(x). 套用 (1) 的結果於 [T ]β, 我們得證 µT(x)|χT(x) 且

χT(λ) = 0 ⇔ µT(λ) = 0.

 Example 3.3.8. 我們利用前面 Example 3.2.6 所得的 characteristic polynomial 來求它們 的 minimal polynomial. 因χA1(x) = x2, 依 Theorem 3.3.7 知µA1(x) 應為 x 或 x2. 但 A1̸= O, 知 A1 的 minimal polynomial 不可能為 x, 得知 µA1(x) = x2.

因χA2(x) = x2−1, 依 Theorem 3.3.7 知 x−1 和 x+1 都是µA2(x) 的因式, 又µA2(x)| x2−1 得知µA2(x) = x2− 1.

因 χA3(x) = x2+ 1, 依 Theorem 3.3.7 知 µA3(x)| x2+ 1. 若 F =R, x2+ 1 的 monic factor (因式) 僅有 1 和 x2+ 1, 又 minimal polynomial 不能是常數多項式, 得證 µA3(x)| x2+ 1. 又 若 F =C, 因 i,−i 皆為 x2+ 1 = 0 的根, 依 Theorem 3.3.7 知µA3(x) = x2+ 1.

Question 3.6. 你能找到 A∈ M2(R), 使得 µA(x)̸=χA(x) 嗎?

(12)

Question 3.7. 若 A∈ Mn(F) 且χA(x) = (x−λ1)···(x −λn) 其中λi∈ F 且λi̸=λj for i̸= j, 則 µA(x) 是什麼?

我 們 可 以 將 Theorem 3.3.7 做 進 一 步 的 推 廣, 這 需 要 複 習 一 下 學 過 的 代 數. 假 設 p(x)∈ F[x] 是一個 irreducible polynomial, 我們可以找到 F 的一個 finite extension ˜F, 使 得 p(x) = 0 在 ˜F 中有根. 假設λ ∈ ˜F 為一根 (即 p(λ) = 0), 則對於任意 f (x) ∈ F[x], 滿足 f (λ) = 0, 因 p(x) 為 irreducible, 我們知 p(x) | f (x). 現若 A ∈ Mn(F), A 也可視為在 Mn( ˜F) 中.

A 的 characteristic polynomial 不管將 A 視為哪裡的矩陣, 其定義皆為 det(xIn− A), 此和將 A 視為 Mn(F) 或 Mn( ˜F) 中的 matrix 無關. 但 minimal polynomial 的定義就和哪一個 field 有關了. 若將 A 視為 Mn( ˜F) 的矩陣, 其 minimal polynomial (在此用 ˜µA(x) 表示), 其定義為 在 ˜F[x] 中次數最小的 monic polynomial f (x) 使得 f (A) = O. 所以因為µA(x)∈ F[x] ⊆ ˜F[x], 利用 Lemma 3.3.2 我們知 ˜µA(x)|µA(x). 了解了這一層關係, 我們便有以下之重要定理.

Theorem 3.3.9.

(1) 假設 A∈ Mn(F) 且 p(x)∈ F[x] 是一個 irreducible polynomial. 則 p(x) |χA(x) 若且 唯若 p(x)|µA(x).

(2) 假設 V 為 finite dimensional F-space, T : V→ V 為 linear operator, 且 p(x) ∈ F[x]

是一個 irreducible polynomial. 則 p(x)|χT(x) 若且唯若 p(x)|µT(x).

Proof.

(1) 由 Theorem 3.3.7 我們知 µA(x)|χA(x), 故若 p(x)|µA(x) 則得 p(x)|χA(x). 另一方 面, 若 p(x)∈ F[x] 為 irreducible 且 p(x) |χA(x). 考慮 ˜F 為 F 的 finite extension, 使得 p(x) = 0 在 ˜F 中有一根λ. 將 A 視為在 Mn( ˜F) 的矩陣且令 ˜µA(x)∈ ˜F[x] 為 A∈ Mn( ˜F) 在 ˜F[x] 的 minimal polynomial. 此時由於 p(x)|χA(x), 我們有χA(λ) = 0.

利用 Theorem 3.3.7 套用在 ˜F 的情形, 得 ˜µA(λ) = 0. 然而已知 ˜µA(x)|µA(x), 得 µA(λ) = 0. 現因 µA(x)∈ F[x] 且 p(x) ∈ F[x] 為 irreducible, 得證 p(x) |µA(x).

(2) 對於 linear operator T : V→V, 選定 V 的一個 ordered basisβ, 由於 χT(x) =χ[T ]β(x) 以及 µT(x) =µ[T ]β(x). 套用 (1) 的結果於 [T ]β, 我們得證

p(x)|χT(x)⇔ p(x) |χ[T ]β(x)⇔ p(x) |µ[T ]β(x)⇔ p(x) |µT(x).

 Question 3.8. 若 A∈ Mn(F) 且 χA(x) = pc11(x)··· pckk(x) 其中 ci∈ N, pi(x)∈ F[x] 為 monic irreducible polynomial 且 pi(x)̸= pj(x) for i̸= j, 則 µA(x) 會是怎樣的形式?

Example 3.3.10. 考慮 linear operator T : P2(R) → P2(R) 滿足

T (1) = 2x2− 1,T(x + 1) = 3x2+ 2x + 2, T (−x2+ x + 1) = 4x2+ 2x + 2.

我們想找出 T 的 minimal polynomial µT(x).

首先考慮 P2(R) 的 ordered basisβ = (−x2+ x + 1, x + 1, 1). 因

(13)

3.4. Internal Direct Sum 53

T (−x2+ x + 1) = (−4)(−x2+ x + 1) + 6(x + 1) T (x + 1) = (−3)(−x2+ x + 1) + 5(x + 1)

T (1) = (−2)(−x2+ x + 1) + 2(x + 1) + (−1)1 得 [T ]β=

−4 −3 −2

6 5 2

0 0 −1

. 計算得 χT(x) =χ[T ]β(x) = (x + 1)2(x− 2). 又

([T ]β+ I3)· ([T]β− 2I3) =

−3 −3 −2

6 6 2

0 0 0

 ·

−6 −3 −2

6 3 2

0 0 −3

 =

 0 0 6 0 0 −6 0 0 0

,

知 µT(x) =µ[T ]β(x)̸= (x + 1)(x − 2), 而得 µT(x) =µ[T ]β(x) = (x + 1)2(x− 2). 事實上

([T ]β+ I3)2· ([T]β− 2I3) =

−3 −3 −2

6 6 2

0 0 0

 ·

 0 0 6 0 0 −6 0 0 0

 = O.

Question 3.9. 試利用 ordered basis (x2, x, 1) 處理 Question 3.3.10. 會不會有一樣結果?

3.4. Internal Direct Sum

給定一個 linear operator T : V → V, 若選夠好的 ordered basis, T 的 representative matrix 可以是較好處理的 matrix. 不過這需要將 V 寫成所謂的 internal direct sum of T -invariant subspaces. 所以這一節我們先不談 linear operator, 先探討 internal direct sum 的性質.

我們在 Chapter 1 所介紹的 direct sum 其實是所謂的 external direct sum, 它是不管每 個 vector space 之間的關係, 而造出的 vector space. 不過若每個 vector space 間有關係, 那 麼我們便可以探討有關於 internal direct sum 的問題.

假設 U,W 皆為 V 的 subspace. 可以考慮函數 T : U⊕W → U +W, 定義為 T ((u, w)) = u + w, ∀u ∈ U,w ∈ W.

依定義很容易得到 T 是 well-defined function, 且可得 T 是一個 onto 的 linear transforma- tion. 接下來我們自然要問 Ker(T ) 是什麼? 若 (u, w)∈ Ker(T), 表示 T((u,w)) = u+w = OV, 得 u =−w. 但 u ∈U,w ∈W, 故得 u = −w ∈U ∩W. 反之, 若 u ∈U ∩W, 考慮 (u,−u) ∈U ⊕W, 可得 T ((u,−u)) = OV. 得證 Ker(T ) ={(u,−u) | u ∈ U ∩W}.

Question 3.10. 為何要得到 T : U⊕W → U +W 這個函數需要 U,W 皆為 V 的 subspace 這個假設?

Question 3.11. 試證明 {(u,−u) | u ∈ U ∩W} ≃ U ∩W. 利用 the First Isomorphism Theo- rem, 我們可不可以說 (U⊕W)/(U ∩W) ≃ U +W?

特別地, 當 U∩W = {OV} 時, 因 (OV, OV) = OU⊕W, 我們得 Ker(T ) = OU⊕W. 亦即 T 為 one-to-one, 我們有以下之結果.

(14)

Proposition 3.4.1. 假設 U,W 皆為 V 的 subspace, 若 U∩W = {OV}, 則 U⊕W ≃ U +W.

就是因為這個原因, 當 U,W 皆為 V 的 subspace 且 U∩W = {OV} 時, 我們會將 U +W 用 U⊕W 來表示. 要注意此時 U ⊕W 指的是 V 的 subspace U +W, 不是以前定的那個新的 vector space. 這裡我們用 U⊕W 這個符號來強調 U ∩W = {OV}. 為了區分清楚, 我們會說 這是 U,W 的 internal direct sum. 所以要注意, 若 U,W 皆為 V 的 subspace 且 U∩W ̸= {OV} 時 U⊕W 這個符號絕對是代表 external direct sum. 若 U,W 皆為 V 的 subspace, 而我們強 調 U⊕W ⊆ V 或說是 internal direct sum, 就表示 U ∩W = {OV}. 當然了若 U,W 沒有任何 關聯, 那麼 U⊕W 指的是原本的 external direct sum.

當 V 為 finite dimensional vector space, 且 U 是 V 的 subspace. 我們可以找到另一個 V 的 subspace W 使得 V = U⊕W. 事實上任取 U 的一組 basis S = {u1, . . . , um}, 我們知可 以將 S 擴大成 V 的一組 basis{u1, . . . , um, w1, . . . , wn}. 此時若令 W = Span({w1, . . . , wn}), 由{u1, . . . , um, w1, . . . , wn} 為 linearly independent, 我們知 U ∩W = {OV}. 所以可得 U ⊕W 這 一 個 U,W 的 internal direct sum. 又 因 為 V = Span({u1, . . . , um, w1, . . . , wn}), 我們得 U⊕W = V. 由於將一組 linearly independent 元素擴展成 basis 的方法並不唯一, 從這裡我 們也了解到給定 V 的一個 subspace U, 可將 V 寫成 U⊕W 的 W 並不唯一.

Example 3.4.2. 考慮 F2={(x,y) | x,y ∈ F}, 若 U = {(x,0) | x ∈ F}, 則 W1={(0,y) | y ∈ F}

和 W2={(y,y) | y ∈ F} 都滿足 F2= U⊕W1 以及 F2= U⊕W2.

將 V 寫成 internal direct sum V = U⊕W 的一個好處就是若 v ∈ V, 則存在唯一的 u ∈ U 以及 w∈ W 使得 v = u + w. 我們將 V 寫成兩個 subspaces 的 internal direct sum 的性質列 舉如下.

Proposition 3.4.3. 假設 U,W 為 V 的 subspaces. 下列是等價的 (1) V = U⊕W.

(2) 若 v∈ V, 則存在唯一的 u ∈ U,w ∈ W 使得 v = u + w.

(3) 對任意 U,W 的 basis S1, S2, 我們有 S1∩ S2= /0 且 S1∪ S2 為 V 的一組 basis.

Proof. (1)⇒ (2): 依定義 V = U +W, 故對任意 v ∈ V, 必存在 u ∈ U,w ∈ W 使得 v = u+w.

現若 u∈ U,w∈ W 使得 v+w = u+ w, 則考慮 u−u= w−w ∈ U ∩W = {OV}, 得證 u = u 且 w = w.

(2)⇒ (3): 假設 v ∈ S1∩ S2, 表示 v∈ U ∩W. 考慮 v = v + OV = OV + v 其中第一個 v 看成在 U, 第二個 v 看成在 W 且第一個 OV 看成在 W , 第二個 OV 看成在 U, 則利用唯 一性知 v = OV. 但 v∈ S1, 此和 S1 為 linearly independent 相矛盾, 得知 S1∩ S2= /0. 另外 對任意 v∈ V, 知存在 u ∈ U,w ∈ W 使得 v = u + w, 然而因 S1, S2 分別為 U,W 的 basis, 知 存在 u1, . . . , um∈ S1, w1, . . . , wn∈ S2 以及 c1, . . . , cm, d1, . . . , dn∈ F 使得 u = c1u1+··· + cmum, w = d1w1+··· + dnwn. 因此得 v = c1u1+··· + cmum+ d1w1+··· + dnwn, 得證 S1∪ S2 為 V 的

(15)

3.4. Internal Direct Sum 55

spanning set. 另一方面若 S1∪ S2 不為 linearly independent, 利用 Corollary 1.4.4 知存在 v̸= OV 使得 v∈ Span(S1)∩ Span(S2) = U∩W. 同前面證明 S1∩ S2= /0 的方法知, 此與 v 寫 成 U, W 元素相加的唯一性相矛盾. 故知 S1∪ S2 為 linearly independent.

(3)⇒ (1): 由 S1∪ S2 為 V 的一組 basis, 知 V = Span(S1) + Span(S2) = U +W . 現僅需證 U∩W = {OV}. 因 S1∩S2= /0 我們有 (S1∪S2)\S1= S2, 故利用 Corollary 1.4.4 知 S1∪S2為 linearly independent 表示 Span(S1)∩ Span(S2) ={OV}, 亦即 U ∩W = {OV}.  我們可以把兩個 subspaces 的 internal direct sum 推廣到更多 subspaces 的 internal direct sum. 例如 V = U⊕W, 我們還可將 W 寫成兩個 W 的 subspaces W1,W2 的 direct sum, W = W1⊕W2, 而得 V = U⊕W1⊕W2. 這裡因 W = W1⊕W2, 我們有 W1∩W2={OV}, 又 因 V = U⊕W, 我們也有 U ∩W1⊆ U ∩W = {OV}, U ∩W2⊆ U ∩W = {OV}. 不過這些條件 (即 W1∩W2={OV}, U ∩W1={OV} 和 U ∩W2={OV}) 並不足以讓我們有類似 Proposition 3.4.3 的性質 (例如任意 v 有唯一的 u∈ U,w1∈ W1, w2∈ W2 使得 v = u + w1+ w2), 我們看以 下的例子.

Example 3.4.4. 在 Example 3.4.2 中 U∩ W1 = W1∩ W2 = U∩ W2={(0,0)}, 不過任意 (x, y)∈ F2, 若 y̸= 0, 我們有 (x,y) = (x,0) + (0,y) + (0,0) = (x − y,0) + (0,0) + (y,y), 其中 ((0, 0)∈ W1 但 (0, 0)̸= (0,y) ∈ W1. 同樣的, (0, 0)̸= (y,y) ∈ W2. 所以 F2 中的元素寫成 U,W1,W2 之和的方法不唯一.

到底要怎麼定義 internal direct sum 呢? 我們可以回到 external direct sum 的看法. 假 設 V1,V2,V3 為 V 的 subspace, 考慮從 external direct sum V1⊕V2⊕V3 到 V1+ V2+ V3linear transformation T , 定義為 T (v1, v2, v3) = v1+ v2+ v3. 依定義 T 為 onto. 若 T 為 one- to-one, 則需 Ker(T ) ={(OV, OV, OV)} 亦即若 v1∈ V1, v2∈ V2, v3∈ V3 且 v1+ v2+ v3= OV, 則 v1= v2= v3= OV. 然而 v1+ v2+ v3= OV, 知 v1=−(v2+ v3)∈ V1∩ (V2+ V3), 同理知 v2∈ V2∩(V1+V3), v3∈ V3∩(V1+V2). 因此若知 V1∩(V2+V3) = V2∩(V1+V3) = V3∩(V1+V2) = {OV}, 則可得 Ker(T) = {(OV, OV, OV)}. 反之, 若 v1∈V1∩(V2+V3),則存在 v1∈V2, v3∈V3滿 足 v1= v2+ v3, 此時 (v1,−v2,−v3)∈ Ker(T). 因此若 Ker(T) = {(OV, OV, OV)} 表示 v1= OV, 故知 V1∩ (V2+ V3) = OV. 同理可得 V2∩ (V1+ V3) = V3∩ (V1+ V2) = OV. 將此推廣到任意有 限多個 subspaces, 我們有以下之定義.

Definition 3.4.5. 假設 V1, . . . ,Vk 為 V 的 subspaces, 且 Vi∩ (

j̸=i

Vj) ={OV}, ∀i = 1,...,k

則 V 的 subspace V1+··· +Vk 稱為 V1, . . . ,Vk 的 internal direct sum, 用 V1⊕ ··· ⊕Vk 表示.

再次強調, 對於 V 的 subspaces V1, . . . ,Vk, 我們都有 V1+··· +Vk 這一個 subspace. 若我 們寫成 V1⊕···⊕Vk⊆ V 或強調為 internal direct sum, 便是說 V1, . . . ,Vk 滿足 Vi∩(∑j̸=iVj) = {OV}, ∀i = 1,...,k 這些條件. 另外, 以後我們要談的 decomposition theorem, 都是將一個 vector space 拆解成一些 subspaces 的 internal direct sum, 我們不會再去談 external direct sum, 所以我們就不再強調為 internal direct sum.

(16)

將 vector space 寫成多個 subspaces 的 direct sum, 和寫成兩個 subspaces 的 direct sum 有同樣的性質. 由於證明和 Proposition 3.4.3 相同, 我們就不再證明了.

Proposition 3.4.6. 假設 V1, . . . ,Vk 為 V 的 subspace. 下列是等價的 (1) V = V1⊕ ··· ⊕Vk.

(2) 若 v∈ V, 則對於所有 i = 1,...,k 皆存在唯一的 vi∈ Vi 使得 v = v1+··· + vk. (3) 對任意 Vi 的 basis Si, 我們有 S1∩ ··· ∩ Sk= /0 且 S1∪ ··· ∪ Sk 為 V 的一組 basis.

Question 3.12. 若 V 為 finite dimensional vector space 且 V1, . . . ,Vk 為 V 的 subspaces 使 得 V = V1⊕ ··· ⊕Vk, 那麼可以知道 dim(V ) 會等於 dim(V1) +··· + dim(Vk) 嗎?

當 U,W 為 V 的 subspaces 且 V = U⊕W, 又 W1, . . . ,Wk 為 W 的 subspaces 且 W = W1⊕ ··· ⊕ Wk, 那麼我們可以得 V = U⊕ W1⊕ ··· ⊕ Wk 嗎? 答案是肯定的. 這是因為若 v∈ V, 由 V = U ⊕W 知存在 u ∈ U,w ∈ W 使得 v = u + w. 另一方面由 W = W1⊕ ··· ⊕Wk, 知 存 在 wi ∈ Wi, 使 得 w = w1+··· + wk. 也 就 是 說 對 任 意 v∈ V, 皆存在 u ∈ U,w1 W1, . . . , wk∈ Wk 使得 v = u + w1+···+wk (證得存在性). 又若 u∈ U,w1∈ W1, . . . , wk∈ Wk 使 得 v = u+ w1+··· + wk, 則因 u, u∈ U 以及 w1+··· + wk, w1+··· + wk∈ W, 由 V = U ⊕W 得 u = u 以及 w1+···+wk= w1+···+wk. 又因 wi, wi∈ Wi, 由 W = W1⊕···⊕Wk 得 wi= wi (證得唯一性), 所以由 Proposition 3.4.6 我們有以下之結果.

Corollary 3.4.7. 若 U,W 為 V 的 subspaces 且 V = U⊕ W, 又若 W1, . . . ,Wk 為 W 的 subspaces 且 W = W1⊕ ··· ⊕Wk, 則 V = U⊕W1⊕ ··· ⊕Wk.

3.5. Primary Decomposition

讓我們回到 linear operator. 若 T : V→ V 為 linear operator, 我們希望將 V 寫成一些 subspaces 的 direct sum, 使這些 subspaces 的 ordered basis 所組成 V 的 ordered basis 讓 T 的 representative matrix 有比較好的形式. 要達到這個目的, 我們希望 T 限制在這些 subspaces 上是不會跑掉的 (即希望它們仍為 linear operator), 所以我們有以下的定義.

Definition 3.5.1. 假設 T : V → V 是一個 linear operator. 若 W 為 V 的 subspace 且滿足 T (W )⊆ W (即對所有 w ∈ W 皆有 T(w) ∈ W), 則稱 W 為 T-invariant.

Question 3.13. 假設 T : V→V 是一個 linear operator. 下列哪些 subspaces 是 T-invariant?

(1) V. (2){OV}. (3) Im(T ). (4) Ker(T ).

回顧一下, 當 T : V → V 為 linear operator, 對於 f (x) = adxd+··· + a1x + a0∈ F[x], 我們 可定義一個 linear operator f (T ) = adT◦d+··· + a1T + a0id.

Lemma 3.5.2. 假設 V 為 F-space, T : V → V 為 linear operator. 若 W 為 T-invariant, 則 對任意 f (x)∈ F[x], W 為 f (T)-invariant

(17)

3.5. Primary Decomposition 57

Proof. 因 W 為 T -invariant, 對任意 w∈ W, 因為 T(w) ∈ W 故得 T◦2(w) = T (T (w))∈ W.

利用數學歸納法知 T◦i(w)∈ W, ∀i ∈ N. 現若 f (x) = adxd+··· + a1x + a0∈ F[x], 因 W 為 subspace, 得 f (T )(w) = adT◦d(w) +··· + a1T (w) + a0w∈ W, ∀w ∈ W. 得證 W 為 f (T)-

invariant. 

很容易判斷 Im(T ) 和 Ker(T ) 皆為 T -invariant. 我們可以利用 f (x)∈ F[x] 得到更多 T -invariant subspaces.

Lemma 3.5.3. 假設 V 為 F-space, T : V→ V 為 linear operator 且 f (x) ∈ F[x]. 則 Im( f (T)) 和 Ker( f (T )) 皆為 T -invariant subspaces.

Proof. 假 設 w∈ Im( f (T)), 即存在 v ∈ V 使得 w = f (T)(v). 由 Lemma 3.2.3 我們知 T◦ f (T) = f (T) ◦ T, 因此

T (w) = T ( f (T )(v)) = (T◦ f (T))(v) = ( f (T) ◦ T)(v) = f (T)(T(v)) ∈ Im( f (T)), 得證 Im( f (T )) 為 T -invariant.

假設 v∈ Ker( f (T)), 亦即 f (T)(v) = OV. 此時 f (T )(T (v)) = T ( f (T )(v)) = T (OV) = OV, 亦即 T (v)∈ Ker( f (T)), 得證 Ker( f (T)) 為 T-invariant.  給定一個 linear operator T : V→ V, 考慮 V 的一個 subspace W, 我們可以將 T 的定義域 限制在 W 上, 即考慮 T|W: W → V, 定義為 T|W(w) = T (w),∀w ∈ W. 這是一個從 W 到 V 的 linear transformation, 我們稱為 the restriction on W . 當 W 為 T -invariant 時, 因 T (w)∈ W,

∀w ∈ W, 我們有 T|W : W → W, 為一個 W 上的 linear operator. 我們自然可以探討 T|W

和 T 的 minimal polynomial 之間的關係. 首先對於 f (x)∈ F[x], 因 W 亦為 f (T)-invariant (Lemma 3.5.2), 我們有興趣知道 f (T )|W 和 f (T|W) 這兩個 W 的 linear operator 之間的關 係. 現對所有 w∈ W, 因

T◦2|W(w) = T◦2(w) = T (T (w)) = T|W(T|W(w)) = T|W◦2(w),

我們知 T◦2|W 和 T|W◦2 為 W 上相同的 linear operator. 利用數學歸納法可得 T◦i|W = T|W◦i,∀i ∈ N. 現若 f (x) = adxd+··· + a1x + a0∈ F[x], 則對於任意 w ∈ W, 皆有

f (T )|W(w) = f (T )(w) = adT◦d|W(w) +··· + a1T|W(w) + a0id|W(w)

= adT|W◦d(w) +··· + a1T|W(w) + a0id|W(w) = f (T|W)(w).

也就是說 f (T )|W 和 f (T|W) 是 W 上相同的 linear operator, 因此知

f (T )|W = f (T|W). (3.3)

利用此結果, 我們有以下之 Lemma.

Lemma 3.5.4. 假設 T : V → V 為 linear operator, W 為 T-invariant subspace, 則 T 的 restriction on W , T|W: W→ W 為 W 上的 linear operator, 且其 minimal polynomialµT|W(x) 滿足

µT|W(x)|µT(x).

(18)

Proof. 已 知 µT(T ) = O 為 一 個 zero mapping, 故 µT(T )|W = O. 故 由 等 式 (3.3) 知 µT(T|W) =µT(T )|W = O, 再由 Lemma 3.3.5 得證 µT|W(x)|µT(x).  假設 V 可以寫成兩個 T -invariant subspace U,W 的 (internal) direct sum V = U⊕W, 分 別選取 U,W 的一個 ordered basisβ1= (u1, . . . , ul),β2= (w1, . . . , wm),則由 Proposition 3.4.3 知 β = (u1, . . . , ul, w1, . . . , wm) 亦為 V 的 ordered basis. 此時由於 T (ui) = T|U(ui)∈ U, 我們 知 [T ]β 的前面 l 個 columns, 每個 column 的前 l 個 entry 都和 [T|U]β1 相同, 而且後面 m 個 entry 皆為 0. 同樣的, 由於 T (wj) = T|W(wj)∈ W, 我們知 [T]β 的後面 m 個 columns, 每 個 column 的前 l 個 entry 都是 0 而後面 m 個 entry 皆和 [T|W]β2 相同. 也就是說 T 對於 β 的 representative matrix 為

[T ]β =

( [T|U]β1 O O [T|W]β2

)

(3.4) 要探討 T, T|U, T|W 的 characteristic polynomial 間的關係, 需了解等式 (3.4) 這類 block diagonal matrix 的 determinant 算法. 我們簡單回顧一下, 考慮 matrix

A =

( B O O C

)

其中 A∈ Ml+m(F), B∈ Ml(F),C∈ Mm(F) 皆為 square matrix. 我們可以用降階及數學歸 納法證得 det(A) = det(B) det(C). 方法大致如下: 我們對第一個 row 作降階得 det(A) =

l+mk=1(−1)1+ka1kdet(A1k),然而 A1k 是將 A 的 first row 和 k-th column 刪除, 因此當 1≤ k ≤ l 時, a1k= b1k 且 A1k =

( B1k O O C

)

這樣的 block diagonal matrix. 所以依數學歸納法假設, 此時 det(A1k) = det(B1k) det(C). 又當 l < k≤ l + m 時, a1k= 0, 故得

det(A) =

l+m

k=1

(−1)1+ka1kdet(A1k) =

l k=1

(−1)1+kb1kdet(B1k) det(C) = det(B) det(C).

利用這個結果我們就可以得到 characteristic polynomial 的關係了.

Lemma 3.5.5. 假設 V 為 finite dimensional F-space, T : V → V 為 linear operator. 若 V = U⊕W, 其中 U,W 為 T-invariant subspace, 則

χT(x) =χT|U(x)χT|W(x).

Proof. 選定 U,W 的 ordered basis β1= (u1, . . . , ul),β2= (w1, . . . , wm), 可得 V 的 ordered basisβ = (u1, . . . , ul, w1, . . . , wm). 此時利用等式 (3.4) 我們有

xIl+m− [T]β=

( xIl− [T|U]β1 O O xIm− [T|W]β2

) . 利用上面所述有關於 block diagonal matrix 的 determinant 算法得

χT(x) = det(xIl+m− [T]β) = det(xIl− [T|U]β1) det(xIm− [T|W]β2) =χT|U(x)χT|W(x).



(19)

3.5. Primary Decomposition 59

至於 minimal polynomial, 我們需要在複習一下代數有關於 F[x] 這一個 polynomial ring 的性質. 因為 F 是一個 field, F[x] 上的元素有除法的性質, 即給定 f (x), g(x)∈ F[x], 若 g(x)̸= 0, 則存在 h(x),r(x) ∈ F[x] 其中 deg(r(x)) < deg(g(x)) 使得 f (x) = g(x)h(x) + r(x).

這個性質使得 F[x] 成為所謂的 Euclidean domain. 所以 F[x] 會是一個 principle ideal domain, 也因此是一個 unique factorization domain. 換言之, 任取 f (x)∈ F[x], 我們都可以 將 f (x) 唯一寫成一些 irreducible polynomial 的乘積. 所以任取兩個 F[x] 上的 polynomial f (x), g(x), 我們可以定義它們的最高公因式 (用 gcd( f (x), g(x)) 表示) 以及最低公倍式 (用 lcm( f (x), g(x)) 表示). 注意, 這裡為了要有唯一性 gcd( f (x), g(x)), lcm( f (x), g(x)) 我們都選 monic polynomial. 若令 l(x) = lcm( f (x), g(x)), 則我們有以下性質:

(1) f (x)| l(x), g(x) | l(x).

(2) 若 h(x)∈ F[x] 則 f (x) | h(x), g(x) | h(x) ⇔ l(x) | h(x).

利用這個性質我們可以得到以下有關 minimal polynomials 間的關係.

Lemma 3.5.6. 假設 V 為 finite dimensional F-space, T : V → V 為 linear operator. 若 V = U⊕W, 其中 U,W 為 T-invariant subspace, 則

µT(x) = lcm(µT|U(x),µT|W(x)).

Proof. 令 l(x) = lcm(µT|U(x),µT|W(x)). 由 Lemma 3.5.4 得 µT|U(x)|µT(x),µT|W(x)|µT(x), 故知 l(x)|µT(x).

另一方面, 對於任意 v∈ V, 存在 u ∈ U,w ∈ W 使得 v = u + w, 故由等式 (3.3) 知 l(T )(v) = l(T )(u) + l(T )(w) = l(T )|U(u) + l(T )|W(w) = l(T|U)(u) + l(T|W)(w).

然而µT|U(x)| l(x),µT|W(x)| l(x), 故知 l(T|U) = O, l(T|W) = O, 亦即 l(T|U)(u) = OU= OVl(T|W)(w) = OW = OW. 由此知 l(T )(v) = OV,∀v ∈ V, 得證 l(T) = O. 故由 Lemma 3.3.5 知 µT(x)| l(x). 因此由 l(x) |µT(x) 且µT(x)| l(x) 以及µT(x), l(x) 皆為 monic polynomial, 得證 µT(x) = l(x) = lcm(µT|U(x),µT|W(x)).  現在我們來說明如何將 V 寫成 T -invariant subspaces 的 direct sum. 由於 F[x] 是一 個 principle ideal domain (P.I.D.), 給定 f (x), g(x)∈ F[x], 我們可以考慮 f (x), g(x) 所生成 的 ideal ( f (x), g(x)), 這個 ideal 中的元素都是 a(x) f (x) + b(x)g(x) (其中 a(x), b(x)∈ F[x]) 這 樣 的 形 式. 因 為 F[x] 是 P.I.D. 所 以 存 在 d(x)∈ F[x] 使得 ( f (x),g(x)) = (d(x)). 亦 即 ( f (x), g(x)) 中 的 元 素, 都 可 以 寫 成 h(x)d(x) 的 形 式. 因 為 f (x)∈ ( f (x),g(x)), 所以 d(x)| f (x), 同理 d(x) | g(x). 另外又 d(x) ∈ ( f (x),g(x)) 所以存在 a(x), b(x) ∈ F[x] 使得 d(x) = a(x) f (x) + b(x)g(x). 由此可知若 h(x)| f (x), h(x) | g(x) 則 h(x) | a(x) f (x) + b(x)g(x), 即 h(x)| d(x). 可以看出其實 d(x) 就是 f (x),g(x) 的最高公因式, 即 d(x) = gcd( f (x),g(x)). 我們 將 d(x) = gcd( f (x), g(x)) 的性質列出如下:

(1) d(x)| f (x), d(x) | g(x).

(2) 若 h(x)∈ F[x] 則 h(x) | f (x), h(x) | g(x) ⇔ h(x) | d(x).

(20)

(3) 存在 a(x), b(x)∈ F[x] 使得 d(x) = a(x) f (x) + b(x)g(x).

特別地, 當 f (x), g(x) 沒有共同的質因式時, 我們稱為 relatively prime, 此時 gcd( f (x), g(x)) = 1, 故存在 a(x), b(x)∈ F[x] 使得 a(x) f (x) + b(x)g(x) = 1.

Theorem 3.5.7. 假設 V 為 finite dimensional F-space, T : V → V 為 linear operator 且 µT(x) = f (x)g(x), 其中 f (x), g(x)∈ F[x] 為 monic polynomials 且 relatively prime. 若令 U = Ker( f (T )), W = Ker(g(T )), 則 V 可 以 寫 成 T -invariant subspaces U,W 的 internal direct sum, 即 V = U⊕W, 而且 µT|U(x) = f (x) 以及 µT|W(x) = g(x).

Proof. 我們已知 U,W 為 T -invariant subspaces. 現在要證明 V = U +W 而且 U∩W = {OV}.

首先因 f (x), g(x) 為 relatively prime, 故存在 a(x), b(x)∈ F[x] 使得 a(x) f (x) + b(x)g(x) = 1.

因此知 a(T )◦ f (T) + b(T) ◦ g(T) = id. 亦即對任意 v ∈ V, 我們有

v = a(T )◦ f (T)(v) + b(T) ◦ g(T)(v). (3.5) 令 w = a(T )◦ f (T)(v),u = b(T) ◦ g(T)(v), 此時利用 Lemma 3.2.3 得

f (T )(u) = f (T )◦ (b(T) ◦ g(T))(v) = b(T) ◦ ( f (T) ◦ g(T))(u) = b(T) ◦µT(T )(v).

然而 µT(T ) = O, 故知 f (T )(u) = OV, 亦即 u∈ Ker( f (T)). 同理可得 w ∈ Ker(g(T)). 得證 V = Ker( f (T )) + Ker(g(T )) = U +W .

現若 v∈ U ∩W = Ker( f (T)) ∩ Ker(g(T)), 表示 f (T)(v) = g(T)(v) = OV. 故由等式 (3.5) 得 v = a(T )(OV) + b(T )(OV) = OV. 得證 U∩W = {OV}.

現考慮 minimal polynomial. 由於 U = Ker( f (T )), 故 f (T )|U = O. 因此由等式 (3.3) 得 f (T|U) = O. 再由 Lemma 3.3.5 得 µT|U(x)| f (x). 同理得 µT|W(x)| g(x). 但 f (x),g(x) 為 relatively prime, 故知 µT|U(x),µT|W(x) 亦為 relatively prime, 得

lcm(µT|U(x),µT|W(x)) =µT|U(x)µT|W(x).

因此由 Lemma 3.5.6 得

µT|U(x)µT|W(x) =µT(x) = f (x)g(x).

故再由 µT|U(x)| f (x) 以及µT|W(x)| g(x) 得證 µT|U(x) = f (x) 以及 µT|W(x) = g(x).  F[x] 是一個 unique factorization domain (U.F.D.), 表示 F[x] 中的非常數多項式都可 以唯一寫成一些 irreducible polynomials 的乘積. 因此對於 linear operator T 的 mini- mal polynomial, 我們可以找到相異的 monic irreducible polynomials p1(x), . . . , pk(x) 使得 µT(x) = p1(x)m1··· pk(x)mk, 其中 m1, . . . , mk∈ N. 由於 characteristic polynomial χT(x) 和 µT(x) 有相同的質因式 (Theorem 3.3.9) 且µT(x)|χT(x), 我們知道χT(x) = p1(x)c1··· pk(x)ck, 其中 ci∈ N 且 ci≥ mi.

Theorem 3.5.8 (Primary Decomposition Theorem). 假設 V 是 dimension 為 n 的 F-space, T : V → V 為 linear operator 且

µT(x) = p1(x)m1··· pk(x)mk and χT(x) = p1(x)c1··· pk(x)ck

參考文獻

相關文件

在 abelian group 最好用的性質就是其每個 subgroup 都 是 normal subgroup, 所以每次碰到有關 abelian group 的性質時, 我們都可先找一個 nontrivial subgroup 再利用其為

利用 determinant 我 們可以判斷一個 square matrix 是否為 invertible, 也可幫助我們找到一個 invertible matrix 的 inverse, 甚至將聯立方成組的解寫下.

在這一節中, 我們介紹 change of basis 的概念, 了解到一個 linear operator 換了 ordered basis

在 abelian group 最好用的性質就是其每個 subgroup 都 是 normal subgroup, 所以每次碰到有關 abelian group 的性質時, 我們都可先找一個 nontrivial subgroup 再利用其為

北韓,對我們來說是一個既熟悉、又陌生的國家。我們熟悉的是它的過去,陌生的是它

要讀書,就是提醒我們要了解和重視前人研究的成果。要有心得,則

首先第一個是堅強 ,每當自己想放 棄做一件事時,我會想起孤兒們的 情況,我們也要學像他們一樣堅強 起來。第二個是 笑

• 以下我們將說明為什麼 average running time 會接近 bes t-case. • 假設很糟的一個狀況 :