• 沒有找到結果。

線性代數五講一一

N/A
N/A
Protected

Academic year: 2022

Share "線性代數五講一一"

Copied!
20
0
0

加載中.... (立即查看全文)

全文

(1)

32 2 , pp. 34-53

線性代數五講一一

第五講 向量空間在線性算子下的分解

龔 昇 · 張德健

5.1. 向量空間是主理想整環上有限生成模

1. 在上一講研究模理論的目的是為了站在更高的層面上來認識線性代數。 在這一講回到 向量空間和線性變換, 應用上一講中的結果翻譯成向量空間的語言。 這裡 V 不僅僅是域 F 上 的向量空間, 更是多項式 F [x] 上的模, 其數乘定義為

p(x)v = p(T )(v),

這裡 p(x) ∈ F [x], v ∈ V , T ∈ L(V )。 本講中向量空間均指有限維的, 以下不再每次注明。

若 V 是域 F 上的向量空間, 線性算子 T ∈ L(V ), 對於 V 中的一個基底, T 對應於 F 上的一個矩陣, 對於 V 中另一個基, T 對應另一個矩陣, 在 3.1節中已經知道, 這兩個矩陣是相 似的。

問題是: 對於一個固定的 T ∈ L(V ), 如何來選取 V 的基底, 使得對應於 T 的矩陣盡可 能簡單。 當然最簡單的矩陣是對角線矩陣, 但不是所有的 T ∈ L(V ), 都能做到這點。 為此, 只 能求其次, 希望能找到另一種簡單的矩陣。

上述問題也可敘述為: 若 V 是域 F 上的向量空間, 要找出所有與 L(V ) 中給定的線性算 子相對應的矩陣在相似意義下的標準形式。 這是線性代數中討論的最基本問題之一。

首先, 若 V 是域 F 上的 n 維向量空間, 則 V 作為 F [x] -模是撓模。 顯然, L(V ) 同構 於由所有 n × n 矩陣組成的向量空間 Mn(F )。 Mn(F ) 的維數為 n2, 故對於 L(V ) 中任一 固定的 T , n2+ 1 個向量

Id, T, T2, . . . , Tn2,

34

(2)

是線性相依的, 故在 F [x] 中有 p(x) 使得 p(T ) = 0。 故 p(x)v = {0}。 因此 V 中所有元素 是撓元。

其次, V 作為 F [x]− 模是有限生成模。 若 B = {v1, . . . , vn} 是向量空間 V 的一組基 底, 則每個向量 v ∈ V , 存在純量 r1, . . . , rn ∈ F ⊂ F [x] 使得有下面的線性組合關係成立 :

v = r1v1+ r2v2 + . . . + rnvn, 故 B 生成模 V 。

在 1.2 節中已知 F [x] 是一主理想整域 (Principal ideal integral domain), 其中 F 是 一個域。 因此, 向量空間 V 也是主理想整環 F [x] 上有限生成撓模。 所以上一講中討論的分解 定理能夠在此應用。

2. 前面已定義過向量空間 V 的一個子空間 S, 對一個固定的 T ∈ L(V ) 來講不變的意 思, 也就是如果 T (S) ⊂ S, S 稱為關於 T 的不變子空間。 不難證明, V 作為 F [x] 上的模, 其部分集合 S 是一個子模若且唯若 S 是向量空間 V 關於 T 的不變子空間。

固定 T ∈ L(V ), 模 V 的零化子為

ann(V ) =p(x) ∈ F [x] : p(x)T = {0} .

這是 F [x] 上的一個非零主理想 (因為 F [x] 是主理想環)。 由於 V 的階, 即 ann(V ) 的生成 元, 是相伴的, 而 F [x] 的可逆元就是 F 中的非零元素, 故 V 有唯一的 首一階 (monic or- der)。稱這個唯一的首一階, 即生成 ann(V ) 的唯一首一多項式, 為 T 的 極小多項式 (minimal polynomial), 記作 mT(x) 或 m(T )。 於是

ann(V ) = hmT(x)i 及

p(x) V = {0} ⇔ mT(x) p(x), 或

p(T ) = 0 ⇔ mT(x) p(x).

在傳統的線性代數的書中, 並未引入模的概念, 對於線性算子 T 的極小多項式定義為使 p(T ) = 0 的最低次的唯一的首一多項式。 對矩陣也可定義極小多項式。 若 A 是域 F 上的一個方陣, A 的極小多項式 mA(x) 是使 p(A) = 0 的最低次的唯一的首一多項式 p(x) ∈ F [x]。

我們立即可以得到下面幾個明顯的推論。

(1) 若 A 與 B 是相似矩陣, 則 mA(x) = mB(x), 即極小多項式在相似的意義下不變;

(3)

36 32 2 97 7

(2) T ∈ L(V ) 的極小多項式與 T 相對應的矩陣 AT 的極小多項式 mAT(x) 是相同的;

(3) 若 S 是模 V 的子模, 則 S 的首一階是限制 T

S 的極小多項式。

3. 固定 T ∈ L(V ), 考慮循環子模

hvi =p(x)v : p(x) ∈ F [x] . 設其首一階是 m(x)。 於是 m(x) 是限制 σ = T

hvi 的極小多項式 (見 (2))。 若 m(x) = a0+ a1x+ a2x2+ . . . + an−1xn−1 + anxn, 則可證

B = v, xv, . . . , xn−1v = v, σ(v), . . . , σn−1(v) 是向量空間 hvi 的一組基底。

我們先證 B 是線性獨立的。 若存在非零純量 αj , j = 0, 1, . . . , n − 1 使得 α0v+ α1σ(v) + . . . + αn−1σn−1(v) = 0,

α0+ α1x+ . . . + αn−1xn−1v = 0, 則

α0+ α1x+ . . . + αn−1xn−1hvi = {0},

故 m(x) α0+ α1x+ . . . + αn−1xn−1 = 0, 這導致 αj = 0 , j = 0, 1, . . . , n − 1。 現在再 證 B 生成 hvi。 我們知道 hvi 中每個元素是 p(x)v, p(x) ∈ F [x] 的形式, 將 p(x) 除以極小 多項式 m(x), 得

p(x) = q(x)m(x) + r(x),

這裡 deg r(x) < deg m(x) = n。 由於 m(x)v = 0, 故 p(x)v = r(x)v, 這表明 hvi 中每個 元素是 r(x)v 的形式。 也就是

hvi =r(x)v : deg r(x) < deg m(x) = span(B).

因此, B 是 hvi 的一組基底。

現在我們來計算 σ 在基底 B 之下的矩陣表示 [σ]B。 當 j = 0, 1, . . . , n − 2, 則 σ σj(v) = σj+1(v).

(4)

而由於 m(x) 是 σ 的極小多項式, 所以 σ σn−1(v)

= σn(v) = − a0+ a1σ+ · · · + an−1σn−1(v)

= − a0v − a1σ(v) − · · · − an−1σn−1(v).

於是在基底 B 之下的矩陣表示為 C[m(x)],

σB = BC[m(x)], 而

C[m(x)] =

0 0 · · · 0 − a0

1 0 · · · 0 −a1

0 1 · · · · ... ... ... 0 −an−2

0 0 · · · 1 − an−1

 ,

C[m(x)] 稱為多項式

m(x) = a0+ a1x+ · · · + an−1xn−1+ xn 的友矩陣(companion matrix)。 這只對首一多項式定義。

若 τ ∈ L(V ), V 的一個子空間 S 稱為 τ -循環 (τ -cyclic), 若存在 v ∈ S 使得

v , τ (v), · · · , τm−1(v) 是 S 的一組基底, 這裡 m = dim(S)。 於是我們得到

(1) S 是 V 的部分集合, S 是 V 的循環子模若且唯若它是 V 的循環部分空間。

(2) 若 hvi 是 V 的一個循環子模, hvi 的首一階 (即 σ = τ

hvi 的極小多項式) 是 mσ(x) = a0+ a1x+ · · · + an−1xn−1+ xn,

B =v, xv, . . . , xn−1v = v, σ(v), . . . , σn−1(v) 是 hvi 的一組基底, σ 對 B 而言的矩陣 [σ]B 是 mσ(x) 的友矩陣 C mσ(x)。

5.2. 向量空間的分解

有了上一節作準備, 就可以將上一講中的分解定理翻譯成向量空間中的結果。 定理 4.3.5 便可以寫成下面的形式 :

(5)

38 32 2 97 7

定理5.2.1: (向量空間關於線性變換的循環分解定理) 若 V 為有限維向量空間, τ ∈ L(V )。 若 τ 的極小多項式為

mτ(x) = pe11(x) . . . penn(x),

這裡 pj(x), j = 1, . . . , n 是相互不同的, 不可約的首一多項式, 則 V 可分解為直和 V = Vp1 ⊕ · · · ⊕ Vpn,

這裡

Vpj =v ∈ V : pejj(v) = 0 是 V 的不變子空間 (子模), 而 τ

V

pj 的極小多項式為 min(τ

Vpj) = pejj(x), j = 1, . . . , n.

再進一步講, Vpj, j = 1, . . . , n 可以再分解為 τ -循環子空間 (循環子模) 的直和 Vpj = hvj,1i ⊕ . . . ⊕ hvj,kji,

這裡 τ

Vpj 的極小多項式為 min(τ

hvj,ℓi) = pejj,ℓ(x), j = 1, . . . , n, ℓ = 1, . . . , kj, 而

ej = ej,1 ≥ ej,2 ≥ · · · ≥ ej,kj ≥ 1, j = 1, . . . , n,

V 的初等因子 pejj,ℓ(x), 也就是 τ 的初等因子, 由算子 τ 唯一決定。 歸納起來, V 可以分解為 τ -循環子空間的直和

V = hv1,1i ⊕ . . . ⊕ hv1,k1i ⊕ · · · ⊕ (hvn,1i ⊕ . . . ⊕ hvn,kni. (5.2.1) 在定理 4.3.5 中, 要求階 µ = pe11· · · penn, 這裡 pj, j = 1, . . . , n, 為互不相伴的素元素。

在定理 5.2.1中, 說 pj(x), j = 1, . . . , n, 為互不相同的不可約多項式。 由於 F [x] 是主理想整 環, 故素元素與不可約元素是一致的。

我們現在可以用循環分解定理來決定相似意義下的標準形式。 若 V = S ⊕ T , S, T 都 是 τ ∈ L(V ) 之下的不變子空間, 則稱 (S, T ) 約化 (reduce) τ 。 若 V = S ⊕ T 且

τ

S : S → S, τ

T : T → T

(6)

分別是 S, T 上的線性算子。 記 τ = ρ ⊕ σ, 若存在 V 的子空間 S 與 T , 使得 (S, T ) 約化 τ, 及

ρ= τ

S, σ= τ T.

假設 C = (c1, . . . , cs) 是 S 的一組基底, D = (d1, . . . , dt) 是 T 的一組基底, 則 B = (c1, . . . , cs, d1, . . . , dt), s+ t = n

是 V 的一組基底。 於是矩陣 [τ ]B 可以寫成分塊對角矩陣 (block diagonal matrix):

[τ ]B =

"

[ρ]C 0 0 [σ]D

# . 這可推廣到 τ 可分解為多個線性算子的直和的情形。

回到 (5.2.1)。 若 Bj,ℓ 是循環子模 hvj,ℓi 的一組基底, 而 B = B1,1,B1,2, . . . ,Bn,kn

 為 V 的一組基底, 則由定理 5.2.1,

[τ ]B =

[τ1,1]B1,1

. ..

[τn,kn]Bn,kn

 .

這裡 τj,ℓ = τ

hvj,ℓi, j = 1, . . . , n 及 ℓ = 1, . . . , kn。

我們知道循環子模 hvj,ℓi 有一首階 pejj,ℓ(x), 即限制 τj,ℓ 有極小多項式 pejj,ℓ(x)。 於是若 deg

pejj,ℓ(x)

= dj,ℓ, 則

Bj,ℓ = vj,ℓ, τj,ℓ(vj,ℓ), . . . , τj,ℓdj,ℓ−1(vj,ℓ)

是 hvj,ℓi 的一組基底, j = 1, . . . , n, ℓ = 1, . . . , kn。 因此便得到下面的定理。

定理5.2.2: 若 V 是有限維的向量空間, τ ∈ L(V ) 的極小多項式為 mτ(x) = pe11(x) . . . penn(x),

這裡首一多項式 pejj(x), j = 1, . . . , n, 是相互不同的, 不可約的, 則 V 有如下分解 V = hv1,1i ⊕ . . . ⊕ hv1,k1i ⊕ · · · ⊕ (hvn,1i ⊕ . . . ⊕ hvn,kni,

(7)

40 32 2 97 7

這裡 hvj,ℓi, j = 1, . . . , n, ℓ = 1, . . . , kn 是 V 的 τj,ℓ -循環子空間; 這裡 τj,ℓ = τ

hvj,ℓi, 它的 極小多項式是 V 的初等因子

min τj,ℓ = pejj,ℓ(x), 這裡

ej = ej,1 ≥ ej,2 ≥ · · · ≥ ej,kj ≥ 1, j = 1, . . . , n.

初等因子由 τ 唯一決定。 若

deg

pejj,ℓ(x)

= dj,ℓ, 則

Bj,ℓ = vj,ℓ, τj,ℓ(vj,ℓ), . . . , τj,ℓdj,ℓ−1(vj,ℓ) 是 hvj,ℓi 的一組基底, τ 相對於基底

B = B1,1,B1,2, . . . ,Bn,kn

 的矩陣表示是分塊對角矩陣

[τ ]B =

C[pe11,1(x)]

. ..

C[pe11,k1(x)]

. ..

C[penn,1(x)]

. ..

C[penn,kn(x)]

 .

上式右邊的矩陣稱為 τ 的 有理標準形式 (rational canonical form)。 這還可以寫成 [τ ]B = diag C[pe11,1(x)], . . . , C[penn,kn(x)].

由向量空間的循環分解的唯一性定理, 這樣的有理標準形式是唯一的。

定理 5.2.2 用矩陣的語言為: 任意矩陣 A 唯一地 (除去對角線上分塊的次序) 相似於一個 有理標準形式的矩陣。 由此還可得到 : 代數域 F 上兩個矩陣是相似的若且唯若它們有相同的 初等因子。

定理 5.2.1 及定理 5.2.2 是線性代數的頂峰之一。 從幾何上講, 它們徹底解決了代數域上的 向量空間, 在一個線性變換下的分解。 從代數上講, 它們徹底地解決了一個代數域上的矩陣在相 似變換下的分類。

(8)

5.3. 特徵多項式、 特徵值與特徵向量

1. 若 p(x) = a0+ a1x+ · · · + an−1xn−1+ xn, C[p(x)] 為其友矩陣, 令

A= xI − C[p(x)] =

x 0 · · · 0 a0

− 1 x · · · 0 a1

0 − 1 . .. ... ... ... ... . .. x an−2

0 0 · · · − 1 x + an−1

 .

顯然 A 是 x, a0, . . . , an−1 的函數, 記作 A = A(x; a0, . . . , an−1)。

命題5.3.1: 我們有 det xI − C[p(x)] = p(x)。

證明: 當 n = 2 時, 則

det A(x; a0, a1) =

x a0

− 1 x + a1

= x(x + a1) + a0

=a0+ a1x+ x2 = p(x).

當 n = 3 時, 則

det A(x; a0, a1, a2) =

x 0 a0

− 1 x a1

0 − 1 x + a2

=x

x a1

− 1 x + a2

+ a0

− 1 x 0 − 1

=a0+ a1x+ a2x2+ x3 = p(x).

對一般的 n, 對行列式沿第一行展開, 得到

det A(x; a0, · · · , an−1 = x det A(x; a1, . . . , an−1) + (−1)n+1(−1)n−1a0. 由數學歸納法假設, 這等於

x xn−1+ an−1xn−2+ · · · + a1 + a0 = p(x).

由命題 5.3.1可得如下結論 :

命題5.3.2: 若 τ ∈ L(V ), R 是 τ 的有理標準形式, 則 Cτ(x) = det xI − R =Y

j,ℓ

pejj,ℓ(x),

(9)

42 32 2 97 7

這個行列式稱為 τ 的 特徵多項式 (eigenpolynomial 或 characteristic polynomial)。

在線性代數通常的書中, 往往先定義矩陣的特徵多項式, 然後再定義線性算子的特徵多項 式。 方陣 A 的特徵多項式定義為 det xI − A。 由此可得下面的結論。

(a) 若 A 與 B 相似, 則 CA(x) = CB(x)。 即特徵多項式在相似下不變。

(b) 線性代數 τ 的特徵多項式和與 τ 相對應矩陣的特徵多項式相等。

(c) 線性代數 τ 的特徵多項式是 τ 的初等因子的乘積。

2. λ ∈ F 是線性算子 τ ∈ L(V ) 的特徵多項式 Cτ(x) 的根, 若且唯若 det λI − R = 0,

即矩陣 λI − R 是奇異的。 若 dim(V ) = d, 則 τ 的有理標準形式 R 為 d × d 的矩陣。 故 det λI − R = 0 若且唯若存在非零向量 x ∈ Fd, 使得

λI − R (x) = 0, 即

R(x) = λx.

若 v ∈ V 是非零向量使得 [v]B = x, 這裡 B 是 V 的基底使 τ 的矩陣為 R, 則上式等價於 τ(v) = λv.

定義5.3.1: 若 τ ∈ L(V ), 數量 λ ∈ F 是 τ 的一個特徵值 (eigenvalue), 若存在非零向 量 v ∈ V , 使得

τ(v) = λv.

這時稱 v 為 τ 的一個特徵向量 (eigenvector)。

若 A 為 F 上的矩陣, λ ∈ F 是 A 的特徵值若存在非零特徵向量 x, 使得 A(x) = λx.

這時稱 x 為 A 的以 λ 為特徵值的特徵向量。 對一個給定的特徵值 λ, 所有以 λ 為特徵值的特 徵向量加上零向量, 組成 V 的一個子空間, 稱為 λ 的特徵空間 (eigenspace), 記作 Eλ。 由此 得如下結論

命題5.3.3:

(a) λ ∈ F 是 τ ∈ L(V ) 的一個特徵值若且唯若它是 τ 的特徵多項式 Cτ(x) 的根。

(10)

(b) λ ∈ F 是 τ ∈ L(V ) 的一個特徵值若且唯若它是 τ 的極小多項式 mτ(x) 的根。

(c) λ ∈ F 是 τ ∈ L(V ) 的一個特徵值若且唯若它是與 τ 相對應任何矩陣的特徵值。

(d) 矩陣的特徵值在相似意義下不變。

(e) 若 λ ∈ F 是矩陣 A 的一個特徵值, 則特徵空間 Eλ 是幾次方程組 λI− A (x) = 0,

的解組成的空間。

證明: 這裡只證明 (c)。 λ ∈ F 是 τ ∈ L(V ) 的一個特徵值若且唯若存在 0 6= v ∈ V , 使得

τ(v) = λv.

假設 dim(V ) = d, B 為 V 的一組基底, 令

φB : V → Fd 為由 φB(u) = [u]B 定義的同構。 若 A = [τ ]B, 則

τ = φB

−1

A φB. 於是 τ (v) = λv 就是

φB−1

A φB(v) = λv = φB

−1

λ φB(v), 即

AφB(v) = λφB(v).

這表明 λ 是 A 的一個特徵值。 因此, λ 是 τ 的一個特徵值若且唯若它是 A 的特徵值。 證明因 而完畢。

命題 5.3.4 與不同的特徵值對應的特徵向量是線性獨立的, 即若 vj ∈ Eλj, j = 1, . . . , k, 則 {v1, . . . , vk} 線性獨立。 特別地, 若 λ1, . . . , λk 是線性算子 τ ∈ L(V ) 不同的特徵值, 則

j ∩ Eλ = {0}.

證明: 若 vj, j = 1, . . . , k 是線性相依的, 則在所有的非平凡的線性組合為零的式子中, 有一個最短的式子, 為

α1v1 + . . . + αkvk= 0. (5.3.1)

(11)

44 32 2 97 7

將 τ 作用在 (5.3.1), 我們便得到

α1τ(v1) + . . . + αkτ(vk) = 0, 即

α1λ1v1+ . . . + αkλkvk = 0.

另一方面, 我們若將 (5.3.1)兩邊乘上 λ1, 再與上式相減便得到 α2(λ2 − λ1)v2+ . . . + αk(λk− λ1)vk = 0.

但這是一個更短的線性組合為零的式子, 故所有 αj, j = 2, . . . , k 全為零; 將之代回 (5.3.1), 因而得到 α1 = 0。 證明因而完畢。

由於 τ 的特徵多項式 Cτ(x) 是所有初等因子的乘積, 而 τ 的極小多項式為 mτ(x) = pe11(x) . . . penn(x),

故 mτ(x)

Cτ(x)。 因此得到下面重要的定理 : 定理5.3.1: 若 τ ∈ L(V ), 則

(a) 極小多項式 mτ(x) 與特徵多項式 Cτ(x) 有相同的素因子。

(b) (Caley-Hamilton 定理) mτ(x)

Cτ(x), 即 Cτ(τ ) = 0。

5.4. Jordan 標準形式

有限維向量空間的每個線性算子 τ 都有標準形式, 即所有有理標準形式的矩陣的全體組 成一個標準形式集合。 顯然, 有理標準形式還不是像我們所指望的那樣有具體簡單的形式。 對一 些重要的特殊的形式, 我們可以得到更為簡單的標準形式。 這種重要的特殊的情形是 : 若算子 τ ∈ L(V ), 它的極小多項式可以分解為線性因子的乘積, 即

mτ(x) = (x − λ1)e1· · · (x − λn)en. (5.4.1) 當一個多項式在體 F 上分解為線性因子的乘積時, 稱多項式可以在 F 上分裂 (split)。

若體 F 上任一非常數的多項式的根仍在 F 中, 稱 F 為代數封閉的 (algebraic closed)。

因此, 在代數封閉域上不可約多項式只有線性多項式。 故任意非常數多項式在 F 上分裂。 代數 封閉體簡單的例子是複數體。

回顧有理標準形式 hvj,ℓi 是循環子模, 其首一階為初等因子 pejj,ℓ(x)。 由於對 pejj,ℓ(x) 了 解甚少, 以致作為 V 的 τ -循環子空間, 選取基底為

Bj,ℓ = vj,ℓ, τj,ℓ(vj,ℓ), . . . τj,ℓdj,ℓ−1(vj,ℓ).

(12)

當極小多項式是 (5.4.1)時, 其初等因子為

pejj,ℓ(x) = (x − λj)ej,ℓ. 這時, 我們可以更有效地選取基底。 由於

dim(hvj,ℓi) = deg pejj,ℓ(x), 不難看出

Gj,ℓ= vj,ℓ, (τj,ℓ− λj)(vj,ℓ), . . . (τj,ℓ− λj)ej,ℓ−1(vj,ℓ)

也是 hvj,ℓi 的一組基底。 記 Gj,ℓ 中第 k 個向量為 bk, 則當 k = 0, . . . , ej,ℓ− 2 時, τj,ℓ(bk) = τj,ℓ(τj,ℓ− λj)k(vj,ℓ)

= (τj,ℓ− λj + λj)(τj,ℓ− λj)k(vj,ℓ)

= (τj,ℓ− λj)k+1(vj,ℓ) + λj(τj,ℓ− λj)k(vj,ℓ)

= bk+1+ λjbk; 當 k = ej,ℓ− 1 時, 應用

(τj,ℓ− λj)k+1(vj,ℓ) = (τj,ℓ− λj)ej,ℓ(vj,ℓ) = 0, 可得

τj,ℓ(bej,ℓ−1) = λjbej,ℓ−1. 因此, 相對於基底 Gj,ℓ, τj,ℓ = τ

hvj,ℓi 所對應的矩陣為 ej,ℓ× ej,ℓ 方陣 :

G(λj, ej,ℓ) =

λj 0 · · · 0 1 λj · · · 0 0 1 . .. ... ...

... ... ... ... 0 0 0 · · · 1 λj

 .

這個矩陣稱為 λj 的 Jordan 塊 (Jordan block)。 即 Jordan 塊為在主對角線上元素為 λj, 在 次對角線上元素為 1, 其餘元素為零。 於是在選取新的基底之後, 我們得到類似於定理 5.2.2 的 如下定理 :

定理5.4.1: 若算子 τ ∈ L(V ) 的極小多項式在體 F 上可分裂, 即 mτ(x) = (x − λ1)e1· · · (x − λn)en.

(13)

46 32 2 97 7

則 V 可分解為

V = hv1,1i ⊕ . . . ⊕ hv1,k1i ⊕ · · · ⊕ (hvn,1i ⊕ . . . ⊕ hvn,kni, 這裡 hvj,ℓi, j = 1, . . . , n, ℓ = 1, . . . , kn 是 V 的 τ -循環子空間; τj,ℓ = τ

hvj,ℓi 的極小多項 式為 V 的初等因子

min τj,ℓ = (x − λj)ej,ℓ, 這裡

ej = ej,1 ≥ ej,2 ≥ · · · ≥ ej,kj ≥ 1, j = 1, . . . , n.

這些初等因子由 τ 唯一決定。 令

Gj,ℓ= vj,ℓ, (τj,ℓ− λj)(vj,ℓ), . . . (τj,ℓ− λj)ej,ℓ−1(vj,ℓ) 是 hvj,ℓi 的一組基底, 則與 τ 相對應的矩陣在基底

G = G1,1,G1,2, . . . ,Gn,kn

 下是分塊對角矩陣

[τ ]B =

G(λ1, e1,1) . ..

G(λ1, e1,k1) . ..

G(λn, en,1)

. ..

G(λn, en,kn)

 .

上式右邊的矩陣稱為 τ 的 Jordan 標準形式 (Jordan canonical form)。

用矩陣的語言, 在代數封閉域 F 上每個矩陣都相似於唯一的一個 Jordan 標準形式, 也 就是所有的 Jordan 標準形式的確組成了在相似意義下的標準形式集合。

若 τ 有 Jordan 標準形式 G, 則 G 中主對角線上元素就是特徵多項式 Cτ(x) 的根 (包括 重數)。 也就是, G 中主對角線元素 λj 出現的次數就是特徵多項式的根 λj 的重數。 定理 5.4.1 是線性代數的另一個高峰。 從幾何的意義來講, 它徹底解決了在代數封閉體上的一個向量空間 在一個線性變換下的分解。 從代數的角度來講, 它徹底解決了在代數封閉體上的矩陣在相似變 換下的分類。

(14)

5.5. 內積空間上算子的標準形式

1. 在 2.4 節及 3.3 節中介紹了內積空間以及其上的三種重要算子 : 自共軛算子、 酉算子及 正規算子, 還討論了它們的一些簡單性質。

若 V, W 為 F 上有限維內積空間, τ ∈ L(V ), 則存在唯一的線性變換 τ : W → V 定義為

hτ (v), wi = hv, τ(w)i, 這裡 v ∈ V , w ∈ W 。 τ 稱為 τ 的共軛算子。

若 V 是內積空間, τ ∈ L(V ), 則 τ 稱為自共軛算子 (或埃爾米特), 如果 τ = τ。算子 τ 稱為酉算子, 如果 τ 是雙射而且 τ−1 = τ。 如果 τ τ = ττ, 則 τ 稱為正規算子。 我們現 在來看看這些算子的特徵值和特徵空間。

命題5.5.1: 若 τ 是自共軛, 則 τ 的特徵多項式 Cτ(x) 的根都是實的。 換句話說, 特徵值 全是實的。

證明: 先設 V 是複向量空間, λ 是 V 的特徵多項式 Cτ(x) 的根, 則有 v 6= 0 使得 τ(v) = λv。 於是

hτ (v), vi = hλv, vi = λhv, vi.

由於 τ 是自共軛, 所以

hτ (v), vi = hv, τ (v)i = hv, λvi = ¯λhv, vi.

故 λ = ¯λ, 即 λ ∈ R。

若 V 是實向量空間, 則 τ 對 V 的某一組基底其對應的矩陣是實對稱矩陣 A, 於是 Cτ(x) = CA(x)。 因 A 是實對稱矩陣, 可看作複向量空間 Cn 的一個自共軛線性算子, 如 上面所證, 其特徵多項式的根是實數。 將 A 看作實的或複的矩陣, 其特徵多項式是一樣的, 命 題因而證畢。

命題5.5.2: 若 τ 是酉線性算子, 則 τ 的特徵值的絕對值為 1。

證明: 若 τ 為酉算子及 τ (v) = λv 則

λ ¯λhv, vi = hλv, λvi = hτ (v), τ (v)i = hv, vi.

故 |λ|2 = 1, 即 |λ| = 1。

命題 5.5.3: 若 τ 為正規算子, λ, µ 為 τ 不同的特徵值, 則對應的特徵子空間互相正交。

特別地, 自共軛算子和酉算子的不同特徵值對應的特徵子空間互相正交。

(15)

48 32 2 97 7

證明: 若 τ (v) = λv 及 τ (w) = µw, 這裡 λ 6= µ, 則

λhv, wi = hτ (v), wi = hv, τ(w)i = hv, ¯µwi = µhv, wi.

因為 λ 6= µ, 故 hv, wi = 0。 這裡用到 τ(w) = ¯µw, 參閱 3.3 節中正規算子的性質 (5), 命 題因而證畢。

前面的有理標準形式及 Jordan 標準形式一般不是對角矩陣, 什麼情況下可化為對角矩 陣?

定義5.5.1: 若 V 是有限維內積空間, τ ∈ L(V ), 若有 V 的正規正交基底 O 使得 [τ ]O

是一個對角矩陣, 則稱 τ 可正交對角化 (orthogonal diagonalizable)。

定理5.5.1: 若 V 是有限維複內積空間。

(a) V 上一個線性算子 τ 可以正交對角化若且唯若它是正規的。

(b) τ 是 V 上的一個正規算子, 它是自共軛若且唯若它的特徵值均為實的。

(c) τ 是 V 上的一個正規算子, 它是酉的若且唯若它的特徵值的絕對值均為 1。

證明: (a) 若 τ 為是複內積空間 V 上的一個正規算子, 且 τ 的極小多項式的素因子分解 為

mτ(x) = (x − λ1)e1· · · (x − λk)ek,

則由准素模分解定理 (Decomposition Theorem for Primary modules), V 可分解為 V = V1 ⊕ . . . ⊕ Vk.

由 3.3節中有關正規算子的命題 3.3.5的 (4), 我們有

Vj =v ∈ V : (τ − λj)ej(v) = 0

=v ∈ V : (τ − λj)(v) = 0 = Eλj, j = 1, . . . , k。 故 τ

Vj 的極小多項式為 x − λj, 故 ej = 1, j = 1, . . . , k。 因此 V = Eλ1 ⊕ . . . ⊕ Eλk.

由命題 5.5.3 知道, V 可分解為正交直和

V = Eλ1 ⊕⊥ . . . ⊕⊥ Eλk.

所以將每個特徵空間的正規正交基底組合起來構造出由 τ 的特徵向量組成的 V 的一個正規正 交基底, 即 τ 是可以正交對角化的。

(16)

反之, 若 τ 是可以正交對角化, 則 V 有一個正規正交基底 O = {u1, . . . , uk} 其中 τ(uj) = λjuj, j = 1, . . . , k。 於是

huj, τ(uℓ)i = hτ (uj), uℓi = λjhuj, uℓi

= λjδj,ℓ= λℓδj,ℓ = huj, ¯λℓuℓi, 所以 τ(uℓ) = ¯λℓuℓ。 因此

τ τ(uℓ) = ¯λℓτ(uℓ) = ¯λℓλℓuj

= λℓτ(uℓ) = ττ(uℓ), 故 τ 為正規算子。

(b). 已知自共軛算子是正規的, 則特徵值均為實的。 反之, 若 τ 是複內積空間 V 上的一 個正規算子, 且其特徵值均為實的, 則對應於 λℓ 的任何特徵向量 uℓ, 我們有

τ(uℓ) = ¯λℓuℓ = λℓuℓ = τ (uℓ).

由於這些 uℓ 是特徵向量構成的基底, 故 τ 為自共軛算子。

(c). 若 τ 為酉算子, 則它的特徵值的絕對值均為 1。 反之, 若 τ 是複內積空間 V 上的一 個正規算子, 且其特徵值之絕對值均為 1, 則對應於 λℓ 的任何特徵向量 uℓ, 我們有

huℓ, uℓi = λℓλ¯ℓhuℓ, uℓi = hλℓuℓ, λℓuℓi = hτ (uℓ), τ (uℓ)i = huℓ, ττ(uℓ)i.

由於這些 uℓ 是特徵向量構成的基底, 故 τ = τ−1, 因此 τ 為酉算子。

定理因而證明完畢。

上面給出了複內積空間上線性算子 τ 可正交對角化的充要條件是 τ 為一正規線性算子。

下面給出實內積空間上線性算子可正交對角化的充要條件。

定理5.5.2: 有限維實內積空間 V 上的一個線性算子 τ 可正交對角化若且唯若 τ 是自共 軛。

證明: 若 τ 為是 V 上的自共軛算子, 則由命題 5.5.1 知 τ 的極小多項式可在 R 上分裂。

由 3.3 節中關於自共軛算子的命題 3.3.2 的 (8) 及命題 5.5.3 得到, 在 V 中存在一組由 τ 的特 徵向量構成的正規正交基底; 其證明類似於定理 5.5.1之證明。

反方向我們用矩陣來證明 : 若 τ 可正交對角化, 則 V 中存在一組正規正交基底 O, 使得 [τ ]O 對角化。 由於 [τ ]O 是實對稱, 所以

]O = [τ ]O = [τ ]TO = [τ ]O,

(17)

50 32 2 97 7

即 τ = τ

定理 5.5.1與定理 5.5.2之矩陣形式如下。

定理5.5.3:

(a) 設 A 是一個複方陣, 則存在酉矩陣 U 使得 U A U−1 是對角矩陣若且唯若 A 是正規的;

一個正規複方陣 A 是 Hermitian 若且唯若 A 的特徵值均為實的。 一個正規複方陣 A 是 酉矩陣若且唯若它的特徵值絕對值均為 1。

(b) A 是一個實方陣, 則存在正交陣 O 使得 O A O−1 是對角方陣若且唯若 A 是對稱的 (見 定理 2.3.5)。

2. 上面給出了正規算子與自共軛算子分別在複數體 C 及實數體 R 上的標準形式是對角 矩陣。 現在來給出實數體 R 上的酉算子的標準形式。

若 τ 是一個實酉算子, 則 σ = τ + τ = τ + τ−1 是自共軛算子, 故有一實特徵值的完備 集合, 如在定理5.5.1中那樣, V 可分解為

V = Eλ1 . . . ⊕k, 這裡

j =v ∈ V : (τ + τ−1− λj)(v) = 0 , 或乘以 τ ,

j =v ∈ V : (τ2− λjτ + 1)(v) = 0 . 若 λj = 2, 則由於 τ 是正規的, 因而有

E2 =v ∈ V : (τ − 1)2(v) = 0 = v ∈ V : (τ − 1)(v) = 0 . 若 λj = −2, 我們有

E−2 =v ∈ V : (τ + 1)2(v) = 0 = v ∈ V : (τ + 1)(v) = 0 . 故算子 τ 在特徵空間 E2 及 E−2 (如存在的話) 上的限制分別就是乘以 +1 或 −1。

當 λj 6= ±2 時, 若 v ∈ Eλj, 考慮 span{v, τ (v)}。 這是 Eλj 中的一個不變子空間, 因 為

τ(τ (v)) = τ2(v) = λjτ(v) − v.

於是

j = span{v, τ (v)} ⊕⊥ span{v, τ (v)}.

(18)

連續這樣的步驟, 每個 Eλj 分解為二維子空間的正交直和, τ 在每個子空間上是一個實酉算子 : V = E2 ⊕⊥ E−2 ⊕⊥ D1 ⊕⊥ · · · ⊕⊥Dm,

這裡 dimDi = 2, i = 1, . . . , m, 每一項在 τ 下不變。

於是, 我們只要算出在二維空間 D 上的實酉算子 τ 的矩陣即可。 由於對 D 的任意正規 正交基底, τ 的矩陣是正交的, 故若

[τ ] =

"

a b c d

# ,

a2+ b2 = 1, c2+ d2 = 1, ac+ db = 0.

由於 det([τ ]) = 1 , 即 ad − bc = 1 , 解這些方程式, 我們得到 d = a, c = −b, 於是

[τ ] =

"

a b

− b a

# .

但 (a, b) 是 R2 中的單位向量, 因此 (a, b) = (cos θ, sin θ), 這裡 θ ∈ R, 因而

[τ ] =

"

cos θ sin θ

− sin θ cos θ

# .

歸納起來, 我們得到下面的定理 :

定理5.5.4: 若 τ 是有限維實內積空間 V 上的一個酉算子, 則 V 有一組正規正交基底, 使得 τ 的矩陣有分塊形式

 Im1

−Im2

cos θ1 sin θ1

− sin θ1cos θ1

. ..

cos θk sin θk

− sin θkcos θk

. (5.5.1)

這裡 Imj, j = 1, 2 是 mj × mj 單位矩陣。

定理 5.5.4的矩陣形式可以寫成如下定理 :

(19)

52 32 2 97 7

定理5.5.5: 若 A 是正交矩陣, 則存在正交矩陣 O, 使得 O A O−1 是形如 (5.5.1)的矩陣。

5.6. 附記

在 5.1節中已經說到, 本講是將體 F 上的向量空間 V 看成 F 上多項式環 F [x] 上的模, 於是上一講中的結果可以翻譯成為向量空間的語言, 這就得到一系列十分重要的分解定理。

在 4.1 節中, 還說到環 R 上的一個 R -模, 當 R = Z (整數環) 時, 則 Z -模就是 Abel 群, 也就是可以將 Abel 群看作 Z -模。 於是也可以將上一講中的結果翻譯成為 Abel 群的語 言, 也可以得到十分重要的分解定理。

如果 G 是一個有限生成的 Abel 群, 則 G 可以視為一個有限生成的 Z -模。 由定理 4.3.1, G 可以分解為一個撓模 Gtor 和一個自由 Z -模 Gf ree 的直和。 設 Gf ree 的秩為 r, 則 Gf ree ≈ Zr

若 Gtor 也是有限生成的。 設 x1, . . . xm 是它的一組生成元素, 於是 Gtor 的每一個元素 都可以用這組生成元來素表示; 由於這些生成元的階都是有限的, 所以, Gtor 是一個有限 Abel 群。

由定理 4.3.2., Gtor 的階為 µ = pe11 . . . penn, 這裡 pj, j = 1, . . . , n, 為不同質數, 則 Gtor 可分解為

Gtor = Gp1 ⊕ . . . ⊕ Gpn,

這裡 Gpj = {v ∈ Gtor : pejj(v) = 0}, 即 Gpj 為 Gtor 的階為 pejj 的子群, 換句話說, Gpj 為 Gtor 的 Sylow pj -子群, j = 1, . . . , n。

這裡要注意的是: 對於有限 Abel 群 G 有兩個階的概念, 其一指 |G|, 即 G 中元素的個 數; 其二指 G 作為 Z -模的零化子的生成元素。 一般而言, 這兩個階是不同的。 在上一段的討 論中所講的階是指後者。 回顧群 G 的 Sylow p -子群是指 G 的階為 pm 的子群, 其中 pm

|G|, 且 pm+1 ∤ |G|。 Sylow p -子群總是存在的, 因此在上一段的討論中, Gpj 必是 Gtor 的 Sylow pj -子群, j = 1, . . . , n。

由定理 4.3.3., 有限 Sylow pj -子群, pj 為質數, j = 1, . . . , n, 又可以分解成一些循環 pj -子群的直和, 即

Gpj = Gj,1 ⊕ . . . ⊕ Gj,kj, j = 1, . . . , n, 這裡 Gj,1 是階為 pejj,ℓ 的循環 pj -子群, ℓ = 1, . . . , kj, 且滿足

ej = ej,1 ≥ ej,2 ≥ · · · ≥ ej,kj.

(20)

換句話說

pejj,jk

pejj,jk−1 · · ·

pejj,1. 歸納起來, 有以下的定理

定理5.6.1: (有限生成的 Abel 群的分解定理) 若 G 是一個有限生成的 Abel 群, 則 G 可以分解成 r 個無限循環子群及一些有限循環 pj -子群的直和。 r 和有限循環 pj -子群的階 pejj,ℓ, j = 1, . . . , n, ℓ = 1, . . . , kj, 是 G 上一組完全不變量, 即兩個有限生成 Abel 群同構若 且唯若它們的不變量完全相同。

這就是第四講中主理想整環上有限生成模的分解定理譯成有限生成 Abel 群時的語言。 由 此可以看出, 這完全解決了有限生成 Abel 群的分類問題。 當然這些內容不屬於線性代數的範 圍, 所以作為附記, 用以顯示模理論的有力作用。

參考文獻

1. 呂輝雄, 線性代數講義, 凡異出版社, 新竹, 1977。

2. 莫宗堅、 藍以中、 趙春來, 代數學, 北京大學出版社, 北京, 1986。

3. 李炯生、 查建國, 線性代數學, 中國科學技術大學出版社, 合肥, 1989。

4. 劉紹學, 近世代數基礎, 高等教育出版社, 北京, 1999。

5. 聶靈沼、 丁石孫, 代數學引論 (第二版), 高等教育出版社, 北京, 2000。

6. 龔昇, 線性代數五講, 科學出版社, 北京, 2005。

7. T. W. Hungerford, Algebra, GTM 73, Springer-Verlag, Berlin-New York-Heidelberg, 1974。

8. N. Jacobson, Basic Algebra I, W. H. Freeman & Company, San Francisco, 1985。

9. T. S. Blyth, Module Theory - An Approach to Linear Algebra, Oxford Univesity Press, London, 1990。

10. S. Roman, Advanced Linear Algebra, GTM 135, Springer-Verlag, Berlin-New York- Heidelberg, 1992。

—本文作者龔昇任教於中國科技大學; 張德健任教於美國 Georgetown University 數學系—

參考文獻

相關文件

elementary row operations reduced echelon form,. echelon form Gauss

augmented matrix [A |I 4 ], elementary row operation A

column vector

Proposition 9.4.2, A orthogonal diagonalizable, Spectral Theorem.. Theorem 9.4.6

Theorem 8.2.6 (3) elementary column operation.. determinant elementary row

, A echelon form ( reduced echelon form) pivot column vectors.. elementary row operations column

minimal element; vector space linearly independent set

若我們能知道有 k 個 row 的矩陣一 定能利用 elementary row operations 化為 echelon form 這個事實且利用這個事實證得有 k + 1 個 row 的矩陣一定能利用 elementary row