在Fn 中, 我們有一個最簡單的 basis, 即 standard basis{e1

(1)

4.3. Matrix Representation

給定一個 matrix A∈ Mm×n(F), 前面我們已知可以定義出一個 linear transformation T : Fⁿ→ F^m, 其定義為 T (v) = Av,∀v ∈ Fⁿ. 在這一節中, 我們要說明所有的 Fⁿ 到 F^m 的 linear transformations 都可以寫成這樣的形式, 並將此概念推廣到一般 linear spaces 之間的 linear transformation. 也就是說, 我們將 linear transformation 和 matrix 相連結並推得一些重要的性質.

4.3.1. Fⁿ 到 F^m 的 linear transformations. 前面 Theorem 4.1.8 告訴我們給定一個 linear transformation, 只要知道此 linear transformation 將一組Fⁿ 的 basis 對應到哪些向量, 就可以唯一確定這一個 linear transformation. 在Fⁿ 中, 我們有一個最簡單的 basis, 即 standard basis{e1, . . . , e_n}. 若 T : Fⁿ→ F^m 是一個 linear transformation, 由前面所述, 我們 僅要知道 T (e₁), . . . , T (en) 是哪些F^m 的 vectors, 就可以知道任意 v∈ Fⁿ, T (v) 為何了.

事實上對於每一個 v∈ Fⁿ, 都可以找到 c1, . . . , cn∈ F 使得 v = c1e₁+··· + cne_n, 也就是

說此時 v 的坐標表示法為 v =





 c1

c2

... cn





. 因此由 T 為 linear, 得 T (v) = T (c₁e₁+··· + cne_n) =

c1T (e1) +··· + cnT (en). 現若考慮 m× n matrix A, 其中 A 的 i-th column 為 T(ei), 則

Av =





T (e₁) T (e₂) ··· T(en)









 c1

c2

... cn





= c₁T (e₁) +··· + cnT (e_n) = T (v).

也就是說對任意 v∈ Fⁿ, 皆有 T (v) = Av. 因此 T 就等同於將 v 左邊乘上 A 這一個矩陣這樣 的 linear transformation. 我們有以下這一個重要的定理.

Theorem 4.3.1. 給定一個 Fⁿ 到 F^m 的 function T . 則 T 為 linear transformation 若且唯 若存在一個 m× n matrix A 使得 T(v) = Av, ∀v ∈ Fⁿ. 此 m× n matrix A 是唯一的, 事實上 對任意 i = 1, . . . , n, A 的 i-th column 為 T (ei), 其中 {e1, . . . , en} 為 Fⁿ 的 standard basis.

Proof. 由 Lemma 4.1.5 我們知道, 若 T (v) = Av, ∀v ∈ Fⁿ, 則 T 為 linear transformation.

反之, 若 T :Fⁿ→ F^m 為 linear transformation, 如前面所討論的, 我們可以考慮 A 為 i-th column 為 T (e_i) 的 m× n matrix, 則由矩陣乘法性質知 T(v) = Av, ∀v ∈ Fⁿ.

現若 B 為 m× n matrix 亦滿足 T(v) = Bv, 依矩陣乘法定義知對任意 i = 1,...,n, Bei 為 B 的 i-th column. 但由假設 Bei = T (e_i), 亦即 B 的 i-th column 為 T (e_i). 因此 B 的所有

column 皆與前述 A 的 column 相一致, 證得唯一性.

簡單來說 Theorem 4.3.1 告訴我們從 Fⁿ 到 F^m 的 linear transformations 和 m× n matrices 之間有一個一對一的對應關係 (注意矩陣階數與定義域, 對應域之間的關係). 由於 一個 linear transformation 和其對應的 m× n matrix 關係特別密切, 我們有以下的定義.

(2)

Definition 4.3.2. 假設 T :Fⁿ→ F^m 為 linear transformation 且{e1, . . . , e_n} 為 Fⁿ 的 stan- dard basis. 則對於 i = 1, . . . , n, 其 i-th column 為 T (ei) 的 m× n matrix 稱為 T 的 standard matrix representation.

由於 T 的 standard matrix representation 是唯一的且和 T 有關, 以後我們都用 [T ] 來 表示 T 的 standard matrix representation. 也就是說對任意 v∈ Fⁿ, 我們有 T (v) = [T ]v.

Example 4.3.3. 我們探討 Example 4.2.5 中的 linear transformation 其 standard matrix representation.

(1) 考慮 T :R³→ R² 定義為 T (



 x1

x2

x3



) =[

x1+ x₂ x1− x3

] . 由於

T (e1) = T (



1 0 0



) =[ 1 1 ]

, T (e2) = T (



0 1 0



) =[ 1 0 ]

, T (e3) = T (



0 0 1



) =[ 0

−1 ]

, 故得

[T ] =



 T (e₁) T (e₂) T (e₃)



 =[

1 1 0 1 0 −1

] . 事實上我們有

[T ]



x1

x2

x3



 =[

1 1 0 1 0 −1

]x1

x2

x3



 =[

x1+ x2

x1− x3

]

= T (



 x1

x2

x3



).

(2) 考慮 T :R²→ R³ 定義為 T ( [ x1

x2

] ) =



 x₁ x1+ x₂ x1− x2



. 由於

T (e1) = T ( [1

0 ]

) =



1 1 1



,T(e₂) = T ( [0

1 ]

) =



 0 1

−1



,

故得

[T ] =



 T (e₁) T (e₂)



 =



 1 0 1 1 1 −1



.

事實上我們有

[T ] [x1

x2

]

=



 1 0 1 1 1 −1



[ x1

x2

]

=



 x1

x1+ x2

x1− x2



 = T([ x1

x2

] ).

有了 standard matrix representation, 我們就可以利用以下的定理幫助我們找出它的的 range 和 null space.

Proposition 4.3.4. 假設 T :Fⁿ→ F^m 為 linear transformation 且令 [T ]∈ Mm×n(F) 為其 standard matrix representation. 則 T 的 range 等於 [T ] 的 column space, 而 T 的 null space 等於 [T ] 的 null space.

(3)

Proof. 由於 e₁, . . . , e_n 為 Fⁿ 的一組 basis, 由 Proposition 4.2.4 我們知 T 的 range, 即 R(T ) = Span(T (e₁), . . . , T (e_n)). 然而 T (e₁), . . . , T (e_n) 剛好就是 [T ] 的 n 個 column, 故由定 義 Span(T (e1), . . . , T (en)) 就是 [T ] 的 column space. 得證 T 的 range 就是 [T ] 的 column space.

另一方面, 若 v∈ N(T), 表示 T(v) = 0. 然而依 standard matrix representation 之定義 T (v) = [T ]v, 故得 [T ]v = 0, 亦即 v 屬於 [T ] 的 null space. 得證 N(T ) 包含於 [T ] 的 null space. 反之, 若 v 屬於 [T ] 的 null space, 表示 [T ]v = 0, 亦即 T (v) = 0, 得證 v∈ N(T). 證明 了 [T ] 的 null space 包含於 N(T ), 因此 T 的 null space 等於 [T ] 的 null space.

回顧一個矩陣 A 的 column space 的維度, 我們稱為 A 的 rank, 用 rank(A) 來表示. 而 A 的 null space 的維度稱為 A 的 nullity, 用 nullity(A) 來表示 (參見 Definition 3.6.13). 由 Proposition 4.3.4, 我們知道 T 的 range 的維度等於 rank([T ]), 而 T 的 null space 的維度等 於 nullity([T ]), 也就是說我們有以下的結果.

Corollary 4.3.5. 假設 T :Fⁿ→ F^m 為 linear transformation 且令 [T ]∈ Mm×n(F) 為其 standard matrix representation. 則

rank(T ) = dim(R(T )) = rank([T ]) and nullity(T ) = dim(N(T )) = nullity([T ]).

因為這個原因一般我們也稱 T 的 range 的維度為 T 的 rank, 而 T 的 null space 的維度 稱為 T 的 nullity. 這更進一步的強調了 linear transformation 以及 matrix 之間的關係. 例 如我們也很容易利用 linear transformation 的 Dimension Theorem (Theorem 4.2.9) 推得矩陣的 Dimension Theorem (Theorem 3.6.14).

Example 4.3.6. 我們利用 Example 4.3.3 中的 linear transformation 及其 standard matrix representation 探討其 range 和 null space.

(1) 考慮 T :R³→ R² 定義為 T (



 x₁ x2

x3



) =[

x₁+ x₂ x1− x3

]

, 以及其 standard matrix repre-

sentation [T ] =

[ 1 1 0 1 0 −1

]

. 由於 [T ] 的 column space 為 Span(

[1 1 ]

, [1

0 ]

, [ 0

−1 ]

) =R². 因 此由 Proposition 4.3.4 我們有 R(T ) =R² (此與 Example 4.2.5(1) 一致). 另一方面, [T ] 的 null space 為聯立方程組 [T ]x = 0, 即

{ x1 +x2 = 0

x1 −x3 = 0 ∼

{ x1 +x2 = 0

−x2 −x3 = 0

的解集合. 因此由 Proposition 4.3.4 我們有 N(T ) = Span(



 1

−1 1



) (此與 Example 4.2.7(1) 一致).

(4)

(2) 考慮 T :R²→ R³定義為 T ( [ x₁

x2

] ) =



 x₁ x1+ x₂ x1− x2



, 以及其 standard matrix represen-

tation [T ] =



 1 0 1 1 1 −1



. 由於 [T] 的 column space 為 Span(



1 1 1



,



 0 1

−1



). 因此由 Proposition

4.3.4 我們有 R(T ) = Span(



1 1 1



,



 0 1

−1



) (此與 Example 4.2.5(2) 一致). 另一方面, [T] 的 null space 為聯立方程組 [T ]x = 0, 即





x1 = 0

x1 +x2 = 0 x1 −x2 = 0

∼

{ x1 = 0 x2 = 0

的解集合. 因此由 Proposition 4.3.4 我們有 N(T ) ={ [0

0 ]

} = {0} (此與 Example 4.2.7(2) 一 致).

當 T₁, T₂ 皆為 Fⁿ 到 F^m 的 linear transformation 時, 對任意 c₁, c₂∈ F, 我們可以利用它 們得到一個新的Fⁿ 到 F^m的 linear transformation c₁T1+ c2T2 (參見 Proposition 4.1.6). 我 們自然會想知道 c₁T₁+ c₂T₂ 的 standard matrix representation 和 T₁, T₂的 standard matrix representation 是否有關. 另外, 若 T 為F^m 到F^k 的 linear transformation, 我們可得合成函 數 T◦ T1 為 Fⁿ 到 F^k 的 linear transformation (參見 Proposition 4.1.7). 同樣的, 我們要探 討 T◦ T1 的 standard matrix representation 和 T₁, T 的 standard matrix representation 是 否有關.

Lemma 4.3.7. 設 T1, T2 為 Fⁿ 到F^m 的 linear transformations, 而 T 為F^m 到F^k 的 linear transformation. 令 [T₁], [T₂]以及 [T ] 分別為 T₁, T₂ 和 T 的 standard matrix representation.

(1) 對任意 c₁, c₂∈ F, 皆有 c1T₁+ c₂T₂:Fⁿ→ F^m 的 standard matrix representation 為 c1[T₁] + c₂[T₂], 亦即

[c₁T₁+ c₂T₂] = c₁[T₁] + c₂[T₂].

(2) T◦ T1:Fⁿ→ F^k 的 standard matrix representation 為 [T ][T₁],亦即 [T◦ T1] = [T ][T₁].

Proof. (1) 依定義對任意 v∈ Fⁿ, 我們有 (c1T1+ c2T2)(v) = c1T1(v) + c2T2(v). 又依 standard matrix representation 的定義 T₁(v) = [T₁]v, T₂(v) = [T₂]v, 故依矩陣乘法的分配律得

(c1T1+ c2T2)(v) = c1[T1]v + c2[T2]v = (c1[T1] + c2[T2])v.

換言之, c₁[T₁] + c₂[T₂]是一個 m× n matrix 且滿足 c1T₁+ c₂T₂:Fⁿ→ F^m的 standard matrix representation 之要求, 故由 standard matrix representation 的唯一性 (Theorem 4.3.1) 知 [c₁T₁+ c₂T₂] = c₁[T₁] + c₂[T₂].

(5)

(2) 依定義對任意 v∈ Fⁿ, 我們有 (T ◦ T1)(v) = T (T₁(v)). 又依 standard matrix rep- resentation 的定義 T1(v) = [T₁]v, 故得 (T◦ T1)(v) = T ([T₁]v). 又依定義, 對任意 w∈ F^m 皆有 T (w) = [T ]w, 故得 (T◦ T1)(v) = T ([T1]v) = [T ]([T1]v). 再依矩陣乘法的結合律得 [T ]([T₁]v) = ([T ][T₁])v. 換言之, [T ][T₁]是一個 k×n matrix 且滿足 T ◦T1:Fⁿ→ F^k 的 standard matrix representation 之要求 (T◦ T1)(v) = ([T ][T1])v, 故由 standard matrix representation 的唯一性 (Theorem 4.3.1) 知 [T◦ T1] = [T ][T₁]. Example 4.3.8. 我們利用 Example 4.3.3 中的 linear transformations 及其 standard matrix representations 探討它們的合成函數.

考慮 T :R³→ R² 定義為 T (



 x1

x2

x3



) =[

x1+ x2

x1− x3

]

. 我們知 T 的 standard matrix repre-

sentation 為 [T ] =

[ 1 1 0 1 0 −1

]

.另外考慮 T^′:R²→ R³ 定義為 T^′( [ x1

x2

] ) =



 x1

x1+ x2

x₁− x2



.

我們知 T^′ 的 standard matrix representation 為 [T^′] =



 1 0 1 1 1 −1



. 依合成函數定義

T^′◦ T : R³→ R³ 滿足 (T^′◦ T)(



 x1

x2

x₃



) = T^′(

[ x1+ x2

x₁− x3

] ) =



 x1+ x2

(x1+ x2) + (x1− x3) (x₁+ x₂)− (x1− x3)



 =



 x1+ x2

2x1+ x2− x3

x₂+ x₃



.

依此結果, 我們得 T^′◦ T 的 standard matrix representation 為 [T^′◦ T] =



 1 1 0 2 1 −1 0 1 1



. 另

一方面, 考慮矩陣乘法, 我們有 [T^′][T ] =



 1 0 1 1 1 −1



[

1 1 0 1 0 −1

]

=



 1 1 0 2 1 −1 0 1 1



. 的確

得到 [T^′◦ T] = [T^′][T ].

我們利用 matrix 來幫助我們了解 linear transformation. 反過來, 我們也可以利用 linear transformation 來幫助我們了解 matrix 的性質. 例如當 T :Fⁿ→ F^m, T^′:F^m→ F^k 為 linear transformations. 由於 T 的 range 是F^m 的 subspace, 即 R(T ) = T (Rⁿ)⊆ R^m, 我們有 (T^′◦ T)(Rⁿ) = T^′(T (Rⁿ))⊆ T^′(R^m). 也就是說 T^′◦ T : Rⁿ→ R^k 這一個 linear transformation 的 range 是包含於 T^′ 的 range, 即 R(T^′◦T) ⊆ R(T^′). 利用 subspace 之間 dimension 的關係 (Proposition 2.6.11(4)), 我們得 rank(T^′◦ T) ≤ rank(T^′). 因此當 A∈ Mm×n(F), B ∈ Mk×m(F), 我們可以推得 Col(BA)⊆ Col(B) 且 rank(BA) ≤ rank(B) (Proposition 3.6.16(1)).

Question 4.12. 假設 T :Fⁿ→ F^m, T^′:F^m→ F^k 為 linear transformations. 證明 N(T )⊆ N(T^′◦T), 並依此證明若 A ∈ Mm×n(F), B ∈ Mk×m(F), 則 N(A) ⊆ N(BA) 且 rank(BA) ≤ rank(A).

4.3.2. Coordinatization. 我們將介紹一種很重要的 linear transformation, 就是將一個 vector space 裡的元素坐標化. 利用坐標化我們可以將抽象的 vector space 的問題, 化成具體的Fⁿ 空間的問題處理.

(6)

假設 V 是 finite dimensional vector space, 選定 V 的一組 basis, 我們可以將此組 basis 裡的元素排序, 並固定這個順序不變, 那麼這樣的一組有順序的 basis, 我們稱之為 ordered basis (有序基底). 這裡要特別強調, 即使 basis 裡的元素相同但排序不同, 我們也視為相異 的 ordered basis. 所以一般在談論 ordered basis 時, 我們會用 (v₁, . . . , v_n)來表示, 以強調其順序. 舉例來說

([1 0 ]

, [0

1 ])

和 ([0

1 ]

, [1

0 ])

就是R² 中兩組不同的 ordered basis.

有時為了方便起見, 給了一組 ordered basis 後, 我們會用一個符號來表示這一組 ordered basis. 例如給定 β = (v1, . . . , vn) 為 V 的一組 ordered basis, 我們就會 β 來表示這一組 ordered basis (v₁, . . . , v_n). 對於 Fⁿ 的 standard basis, 我們通常用ε 來表示 (e1, . . . , e_n) 這一組 ordered basis.

有了 vector space V 的一組 ordered basisβ = (v1, . . . , v_n)後, 我們就可以將 V 中的元素

“坐標化” (coordinatization). 意思就是對任意 v∈ V, 我們利用 β 這一組 ordered basis 將 v 寫成 v = c₁v₁+··· + cnv_n 後,



 c1

... cn



 就是利用 β 將 v 坐標化後所得的坐標表示法. 為了方便,

我們就用 [v]_β 來表示利用β 將 v 坐標化後所得的坐標. 坐標化的好處是, 我們可以將 [v]_β 看成是Fⁿ 中的一個向量. 這樣我們就可以將較抽象的 vector space 中的元素, 看成是Fⁿ 中的向量來處理.

Example 4.3.9. 我們看看前面提過的幾個 vector space 坐標化的情形.

(A) 考慮 M2×2(F) 及其 ordered basis ε =

([ 1 0 0 0

] ,

[ 0 1 0 0

] ,

[ 0 0 1 0

] ,

[ 0 0 0 1

])

(通常我們稱這一組 basis 為 M2×2(F) 的 standard basis). 對於任意 M2×2(F) 中的元素 [ a b

c d ]

, 由於 [ a b

c d ]

= a [ 1 0

0 0 ]

+ b [ 0 1

0 0 ]

+ c [ 0 0

1 0 ]

+ d [ 0 0

0 1 ]

,

我們得

[ a b c d

]

利用ε 所得的坐標表示法為

[[ a b c d

]]

ε

=





 a b c d





.

例如在 M₂_×2(R), 我們有

[[ 1 −2

−3 4 ]]

ε

=





 1

−2

−3 4





.

(7)

(B) 在 P₂(F) 中通常我們會稱 1,x,x² 這組 basis 為 standard basis. 考慮ε = (1,x,x²)這 組 ordered basis. 很容易看出在 P₂(R) 中, 2x²− 3x + 4 用ε 所得的坐標為



 4

−3 2



, 所以我們

有

[2x²− 3x + 4]ε =



 4

−3 2



.

我們也可考慮 ordered basisβ = (p1(x), p2(x), p3(x)) 其中

p1(x) =−(x − 1)(x + 1), p2(x) = (1/2)x(x + 1) and p3(x) = (1/2)x(x− 1) (參見 Example 2.6.12). 由於

p₁(0) = 1, p₁(1) = p₁(−1) = 0; p2(1) = 1, p₂(0) = p₂(−1) = 0; p3(−1) = 1, p3(0) = p₃(1) = 0, 若 2x²−3x+4 = c1p1(x) + c₂p2(x) + c₃p3(x), 則分別代 x = 0, 1,−1, 可得 c1= 4, c₂= 3, c₃= 9.

故

[2x²− 3x + 4]_β=



4 3 9



.

(C) 我們也可將Fⁿ 中的向量用不同的 ordered basis 坐標化. 例如在R³ 中考慮 ordered basisβ = (



1 1 1



,



0 1 1



,



1 0 1



). 若要求向量



1 2 3



 以 β 為 ordered basis 的坐標表示, 我們要求 出 c₁, c₂, c₃∈ R 滿足



1 2 3



 = c₁



1 1 1



 + c₂



0 1 1



 + c₃



1 0 1



 =



 1 0 1 1 1 0 1 1 1







c₁ c₂ c₃



.

解聯立方程組得, c₁= 0, c₂= 2, c₃= 1, 故得



1 2 3





β

=



0 2 1



.

要注意這裡我們有



1 2 3





ε

=



1 2 3



, 其中 ε 為 R³ 的 standard ordered basis (e₁, e₂, e₃). 這是因為我們原來就是用 standard ordered basisε 來將所有 R³ 的向量的坐標化.

給定 V 的一組 ordered basisβ = (v1, . . . , v_n),將 V 中的元素利用 β 坐標化, 其實就定出 了一個從 V 到Fⁿ 的函數 T_β : V → Fⁿ, 其中對任意 v∈ V, 我們有 T_β(v) = [v]_β. 為什麼這是一個函數呢? 因為 v₁, . . . , v_n 為 V 的一組 basis, 所以由{v1, . . . , v_n} 是 V 的 spanning set, 可得任意的 v∈ V 確實都存在 c1, . . . , cn∈ F 使得 v = c1v₁+···+cnv_n. 所以 T_β 確實可以將每個定義域中的元素 v 對應到對應域 Fⁿ 中的向量



 c₁

... c_n



. 而且這個對應關係是 well-defined, 也

(8)

就是說不會有將同一個 v 對應到Fⁿ 中兩個不同向量的情況. 這是因為 v₁, . . . , v_n 為 linearly independent, 所以每個 v∈ V, 僅有一組 c1, . . . , c_n∈ F 會使得 v = c1v₁+··· + cnv_n.

既然 T_β: V → Fⁿ 是一個 well-defined 的函數, 那它會是 linear transformation 嗎? 答案 是肯定的. 考慮 v, w∈ V 且假設 v = c1v₁+··· +cnv_n, w = d1v₁+··· +dnv_n, 其中 c1, . . . , cn與 d₁, . . . , d_n 皆屬於F. 依定義我們有

T_β(v) = [v]_β=



 c1

... cn



 and Tβ(w) = [w]_β=



 d1

... dn



.

對於任意 r∈ F, 由於

v + rw = (c₁v₁+··· + cnv_n) + r(d₁v₁+··· + dnv_n) = (c₁+ rd₁)v₁+··· + (cn+ rd_n)v_n, 我們有

T_β(v + rw) = [v + rw]_β=





c1+ rd1

... cn+ rdn



 =



 c1

... cn



 + r



 d1

... dn



 = Tβ(v) + rT_β(w).

得證 T_β: V → Fⁿ 為 linear transformation.

T_β: V → Rⁿ 不只是 linear transformation, 事實上 T_β : V → Rⁿ 是 one-to-one 且 onto.

要檢查 T_β 為 one-to-one, 我們僅要檢查 N(T_β) ={0} 即可 (參見 Proposition 4.2.6). 然而 若 v∈ N(T_β), 表示 v 用β 的坐標表示法是 Fⁿ 中的零向量, 亦即 v = c₁v₁+··· + cnv_n, 其中 c₁=··· = cn= 0. 很自然的, 這表示 v = 0, 故知 N(T_β) ={0}. 要檢查 T_β 為 onto, 我們可以利 用 T_β(v_i) = e_i, ∀i = 1,...,n, 故得證 R(T_β) = Span(T_β(v₁), . . . , T_β(v_n)) = Span(e₁, . . . , e_n) =Fⁿ (參見 Proposition 4.2.4), 即 T_β 為 onto. 我們證得了以下的定理.

Theorem 4.3.10. 假設 V 為 vector space over F, dim(V) = n 且 β 為 V 的一組 ordered basis. 考慮 T_β : V→ Rⁿ 定義為 T_β(v) = [v]_β, ∀v ∈ V. 則 T_β 為 linear transformation 且是 one-to-one 以及 onto.

一般來說當一個 linear transformation T : V→ W 是 one-to-one 且 onto 時, 為了方便 以及強調其特殊性, 我們會稱 T 為一個 isomorphism. 知道 T_β : V → Fⁿ 為 isomorphism 的 好處就是, 以後我們要探討 V 中元素的性質, 我們可以利用 T_β, 將問題轉換成大家熟悉的 Fⁿ 中的向量的性質. 例如我們要判斷 V 中的元素 w₁, . . . , wk 是否為 linearly independent.

我們可以先找到一組 V 的 ordered basis β, 然後考慮 [w1]_β, . . . , [w_k]_β, 這一組Fⁿ 中的向量.

利用我們熟悉的判斷Fⁿ 中向量是否為 linearly independent 的方法判斷 [w₁]_β, . . . , [w_k]_β 是 否為 linearly independent. 由於對於 i = 1, . . . , k, [wi]_β= T_β(wi), 因此由 T_β 為 isomorphism 以後我們會知道 w₁, . . . , w_k 為 linearly independent 若且唯若 [w₁]_β, . . . , [w_k]_β 為 linearly independent (參見 Proposition 4.4.4). 因此我們可以由 [w1]_β, . . . , [wk]_β 是否為 linearly independent, 來決定 w₁, . . . , w_k 是否為 linearly independent. 我們看以下的例子.

Example 4.3.11. 我們看利用坐標化來處理一般 vector space 是否 linear independent 的 問題.

(9)

(A) 考慮 P₂(R) 中 3 個非零多項式 f2(x), f₁(x), f₀(x), 其次數分別為為 2, 1, 0 的多項式.

假設 f₂(x) = ax²+ bx + c, f₁(x) = dx + e, f₀(x) = r 其中 a, d, r 皆不等於 0. 我們利用 P₂(R) 的 standard ordered basisε = (1,x,x²), 可得

[ f₂(x)]_ε=



c b a



, [ f₁(x)]_ε=



e d 0



 and [ f0(x)]_ε=



r 0 0



.

由於 a, d, r 皆不等於 0, 很容易看出矩陣



 c e r b d 0 a 0 0





的 rank 為 3, 亦即 [ f2(x)]_ε, [ f1(x)]_ε, [ f0(x)]_ε 為 linearly independet. 因此得證 f₂(x), f1(x), f₀(x) 為 linearly independent. 再由 dim(P₂(R)) = 3, 得證 f0(x), f₁(x), f₂(x) 為 P₂(R) 的一組 basis.

我們可以將這個結果推廣到 P_n(R). 也就是說考慮 Pn(R) 中 n + 1 個非零多項式 f0(x), . . . , fn(x), 其中對於 i = 0, . . . , n, fi(x) 是次數為 i 的多項式. 利用對 standard ordered basisε = (1,x,...,xⁿ) 坐標化, 我們可得 f₀(x), . . . , f_n(x) 為 P_n(R) 的一組 basis.

(B) 假設 V 為 vector space overR, 且 v1, v₂, v₃, v₄∈ V 為 linearly independent. 令 w₁= v₁ −v2 +2v₃ +v₄

w₂= 2v1 −2v2 +4v3 +2v4

w₃= v₁ +v3 +v4

w₄= v₂ +v₄

w₅= −v1 +v₂ −v3

.

我們要找出 W = Span(w1, w2, w3, w4, w5) 的一組 basis.

考慮 U = Span(v1, v2, v3, v4),因為 v₁, v2, v3, v4為 linearly independent, 我們知 v₁, v2, v3, v4

為 U 的一組 basis. 由於 w₁, . . . , w₅∈ U, 我們知 W 為 U 的 subspace. 我們的想法是利用 β = (v1, v₂, v₃, v₄)這組 U 的 ordered basis 將 U 的元素坐標化. 由於 w₁, . . . , w₅∈ U, 我們可 以將 w₁, . . . , w₅ 坐標化, 得 [w₁]_β, . . . , [w₅]_β 這 5 個 R⁴ 中的向量. 利用過去我們知道求R⁴ 中 Span([w₁]_β, . . . , [w₅]_β) 的 basis 的方法求出一組 basis. 再將它們還原成 U 中的元素, 就 得到 W 的一組 basis.

現由於

[w1]_β=





 1

−1 2 1





,[w²]_β =





 2

−2 4 2





,[w³]_β=





 1 0 1 1





,[w⁴]_β =





 0 1 0 1





,[w⁵]_β=







−1 1

−1 0







我們考慮以它們為 column 的 4× 5 matrix 並利用 elementary row operations 將之化為 echelon form 得 





1 2 1 0 −1

−1 −2 0 1 1

2 4 1 0 −1 1 2 1 1 0













1 2 0 0 0 0 0 1 0 −1 0 0 0 1 1 0 0 0 0 0





.

(10)

由於 echelon form 的 1-st, 3-rd, 4-th column 為 pivot 所在位置, 故知 [w₁]_β, [w₃]_β, [w₄]_β 為 Span([w1]_β, . . . , [w₅]_β) 的一組 basis (參見 Proposition 3.6.8). 由於 T_β 為 isomprphism 保持 spanning set 以及 linearly independent 的性質, 我們得 w1, w3, w4 為 W 的一組 basis.

Question 4.13. 考慮 Example 4.3.11 (B) 中的 v₁, v₂, v₃, v₄ 以及 w₁, w₂, w₃, w₄, w₅. 試問 dim(Span(w1, w₂, w₃, w₄, w₅))為何? 並將 w₂, w₅ 寫成 w₁, w₃, w₄ 的 linear combination.

4.3.3. Matrix Representation of general linear transformation. 當 V,W 分別為 dimension 為 n, m 的 vector space over F. 我們可以透過 V,W 的 ordered basis, 將 V,W 的 元素轉換成Fⁿ 和 F^m 的 vector. 因此我們可以將 V 到 W 的 linear transformation T 視為 Fⁿ 到 F^m 的 linear transformation, 而談論 T 的 matrix representation.

分別給定 V,W 的一組 ordered basisβ = (v1, . . . , v_n)以及γ = (w1, . . . , w_m). 令 T_β: V→ Fⁿ 與 T_γ: W → F^m 分別為利用β 以及 γ 將 V, W 的元素坐標化的 linear transformation. 回顧 一下, 這裡 T_β, T_γ 皆為 isomorphism. 由於 isomorphism 是 one-to-one 且 onto, 故其反函數是存在的, 且將來我們會證明此反函數仍為 linear transformation (參見 Theorem 4.4.3). 現 對於任意 V 到 W 的 linear transformation T , 我們考慮合成函數 T_γ◦ T ◦ T_β⁻¹:Fⁿ→ F^m. 由 於 T_γ, T 以及 T_β⁻¹ 皆為 linear transformation, 所以 T_γ◦ T ◦ T_β⁻¹ 是一個 Fⁿ 到 F^m 的 linear transformation (Proposition 4.1.7). 因此 T_γ◦T ◦T_β⁻¹有一個 standard matrix representation, 我們定義這個 standard matrix representation 為 T 相對於β, γ 這兩組 ordered basis 所得 的 matrix representation, 並用 [T ]^γ_β 來表示. 到底 [T ]^γ_β 是怎樣的矩陣呢? 依定義它是一個 m× n matrix, 且對於 i = 1,...,n, [T]^γ_β 的 i-th column 應為 T_γ◦ T ◦ T_β⁻¹(ei). 由於 T_β(vi) = ei, 所以 T_β⁻¹(e_i) = v_i. 因此得

T_γ◦ T ◦ T_β⁻¹(ei) = T_γ(T (T_β⁻¹(ei))) = T_γ(T (vi)) = [T (vi)]_γ.

也就是說 [T ]^γ_β 的 i-th column 就是將 ordered basisβ = (v1, . . . , v_n) 的第 i 個元素 v_i 代入 T 中所得的 T (v_i)∈ W, 再利用γ 將其坐標化所得的 R^m 中的向量. 我們大致上有以下的表示法

[T ]^γ_β=





[T (v₁)]_γ [T (v₂)]_γ ··· [T(vn)]_γ



.

Example 4.3.12. 考慮假設 V 為 finite dimensional vector space over F. 考慮 V 上的 identity map id : V → V, 亦即對任意 v ∈ V, 我們定義 id(v) = v. 很容易看出 id 是一個 linear transformation. 現對任意 V 的 ordered basisβ = (v1, . . . , vn),我們想知道 id : V→ V 對定義 域和對應域都用β 這個 ordered basis 所得的 matrix representation [id]^β_β 為何? 依照前面的討論, 我們知道 [id]^β_β 的 1-st column 就是 id(v1) 利用β 坐標化所得的 Fⁿ 中的向量. 由於 id(v1) = v1, 而 v1 又是 β 中第一個向量, 故知 [id(v1)]_β = [v1]_β= e1, 也就是說 [id]^β_β 的 1-st column 就是 e₁. 同理 [id]^β_β 的 i-th column 就是 e_i. 也就是說 [id]^β_β 就是 n× n 的 identity matrix In.

Example 4.3.13. 考慮 P2(R) 上的 standard ordered basis ε2 = (1, x, x²) 以及 P₃(R) 上的 standard ordered basis ε3= (1, x, x², x³). 考慮函數 T : P₂(R) → P3(R) 定義為, 對任意

(11)

p(x)∈ P2(R), T(p(x)) = (x + 1)p(x − 1). 我們先驗證 T 為 linear transformation. 對任意 p(x), q(x)∈ P2(R) 以及 r ∈ R, 我們有

T (p(x) + rq(x)) =

(x + 1)(p(x− 1) + rq(x − 1)) = (x + 1)p(x − 1) + r(x + 1)q(x − 1) = T(p(x)) + rT(q(x)).

得證 T 為 linear transformation. 接下來我們要求 T 對於 ε2,ε3 的 matrix representation [T ]^ε_ε³₂. 依照前面的探討, 我們知 [T ]^ε_ε³₂ 的 1-st column 應該就是將 1 代入 T , 得 T (1) = (x+1)·1 再利用 ε3 將 x + 1 坐標化寫成R⁴ 的向量. 由於 x + 1 = 1 + x + 0x²+ 0x³, 所以得 [T ]^ε_ε³₂ 的 1-st column 為

[T (1)]_ε₃ = [x + 1]_ε₃ =





 1 1 0 0





.

同理我們有 [T ]^ε_ε³₂ 的 2-nd, 3-rd column 分別為

[T (x)]_ε₃ = [(x + 1)(x− 1)]ε3 = [x²− 1] =







−1 0 1 0





,

[T (x²)]_ε₃= [(x + 1)(x− 1)²]_ε₃ = [x³− x²− x + 1]ε3 =





 1

−1

−1 1





.

因此得

[T ]^ε_ε³₂ =







1 −1 1 1 0 −1 0 1 −1

0 0 1





.

我們更換 P₂(R) 以及 P3(R) 的 ordered basis. 回顧在 Example 2.6.12 中利用 La- grange interpolation polynomial 在 −1,0,1 的情形, 我們可以考慮 P2(R) 的一組 basis p₁(x), p₂(x), p₃(x), 其中

p1(−1) = 1 p1(0) = 0 p1(1) = 0 p2(−1) = 0 p2(0) = 1 p2(1) = 0 p3(−1) = 0 p3(0) = 0 p3(1) = 1

令 β = (p1(x), p₂(x), p₃(x)) 為 P₂(R) 的 ordered basis. 同樣的利用 Lagrange interpolation polynomial 在−1,0,1,2 的情形我們考慮 P3(R) 的一組 basis q1(x), q₂(x), q₃(x), q₄(x), 其中

q₁(−1) = 1 q1(0) = 0 q₁(1) = 0 q₁(2) = 0 q₂(−1) = 0 q2(0) = 1 q₂(1) = 0 q₂(2) = 0 q₃(−1) = 0 q3(0) = 0 q₃(1) = 1 q₃(2) = 0 q4(−1) = 0 q4(0) = 0 q4(1) = 0 q4(2) = 1.

令γ = (q1(x), q₂(x), q₃(x), q₄(x)) 為 P₃(R) 的 ordered basis. 我們要得到 T 對於β,γ 的 matrix representation [T ]^γ_β. 首先 [T ]^γ_β 的 1-st column 為 T (p1(x)) = (x + 1)p₁(x− 1) 利用γ 坐標化

(12)

所得 R⁴ 的向量. 現若 (x + 1)p₁(x− 1) = c1q₁(x) + c₂q₂(x) + c₃q₃(x) + c₄q₄(x). 將 x 分別代

−1,0,1,2, 我們得到

c1= (−1 + 1)p1(−2) = 0,c2= (0 + 1)p1(−1) = 1,c3= (1 + 1)p1(0) = 0, c4= (2 + 1)p1(1) = 0.

也就是說 [T ]^γ_β 的 1-st column 為

[T (p₁(x))]_γ = [(x + 1)p₁(x− 1)]γ=





 0 1 0 0





.

同樣的方法我們可以得到 [T ]^γ_β 的 2-nd, 3-rd column 分別為

[T (p₂(x))]_γ = [(x + 1)p₂(x− 1)]γ =





 0 0 2 0





, [T(p³(x))]_γ = [(x + 1)p₃(x− 1)]γ=





 0 0 0 3





.

因此得

[T ]^γ_β=







0 0 0 1 0 0 0 2 0 0 0 3





.

由 Example 4.3.13 我們知道同樣的 linear transformation 用不同的 ordered basis 會有不同的 matrix representation. 也因此要注意當要寫下 matrix representation 時一定要表明定義域和對應域的 ordered basis 為何.

到底 matrix representation 有何用處呢? 就如同在 Fⁿ 上的 standard matrix representation, 利用 matrix representation 可以很快的幫我們求出 linear transformation 在定義域 的每個元素的取值. 通常我們會利用圖示來幫助我們了解較複雜的函數合成問題. 給定 V,W 的 ordered basisβ,γ, 以及一個 V 到 W 的 linear transformation T, 我們可以圖示如下:

V T ^- W

Fⁿ - F^m

?6 6?

T_β T_β⁻¹ T_γ⁻¹ T_γ

這樣的圖示一般稱為 commutative diagram. 它表示底下 Fⁿ 到 F^m 的函數為 T_γ◦ T ◦ T_β⁻¹, 亦即先利用 T_β⁻¹ 將 Fⁿ 映射到 V , 再利用 T 將 V 映射到 W , 最後利用 T_γ 將 W 映射到 F^m. Commutative diagram 的好處是幫助我們看出這些函數合成後如何取值. 事實上 commutative diagram 指的就是圖形上任一點到另一點若有不同的可行路徑, 經由這兩種 路徑所得的結果會相同. 例如在上圖中, 從 V 到 W 有兩個路徑: 一個是直接利用 T ; 另一 個是從 V 先經由 T_β 到 Fⁿ, 接著藉由 T_γ◦ T ◦ T_β⁻¹ 從 Fⁿ 到 F^m, 最後從 F^m 藉由 T_β⁻¹ 到達 W . 也就是說對任意 v∈ V, 我們可以由 T 得到 T(v). 也可先由 T_β 得到 T_β(v), 接著利用 T_γ◦ T ◦ T_β⁻¹ 將 T_β(v) 送至 T_γ◦ T ◦ T_β⁻¹(T_β(v)) = T_γ(T (v)), 最後再利用 T_γ⁻¹ 將 T_γ(T (v)) 送至 T_γ⁻¹(T_γ(T (v))) = T (v).

(13)

利用 V→ Fⁿ 接Fⁿ→ F^m再接F^m→ W 這樣的路徑來表示原本 T 從 V 到 W 這樣的路徑到底有何好處呢? 主要的原因是Fⁿ→ F^m這一段的路徑, 有 standard matrix representation, 即 [T ]^γ_β. 也就是說對於任意Fⁿ 的向量, 我們只要左邊乘上 [T ]^γ_β 就可以知道會被映射到哪一個 F^m 的向量. 所以對任意 v∈ V, 我們可以先利用 β 將 v 坐標化得 Tβ(v) = [v]_β. 接著由於 [v]_β ∈ Fⁿ, 故將之代入 T_γ◦ T ◦ T_β⁻¹ 就是將 [v]_β 左邊乘上 [T ]^γ_β 這一個 matrix. 也就是說 T_γ◦ T ◦ T_β⁻¹([v]_β)就是 [T ]^γ_β[v]_β. 最後再利用 W 的 ordered basisγ 將 [T]^γ_β[v]_β 這個F^m 中的 向量還原回 W 的元素 T_γ⁻¹([T ]^γ_β[v]_β), 就是 T (v) 之值. 因此我們有以下之結果.

Proposition 4.3.14. 假設 V,W 為 vector space overF 且 β = (v1, . . . , v_n), γ = (w1, . . . , w_m) 分別為 V,W 的 ordered basis. 設 T : V → W 為 linear transformation 且 [T]^γ_β ∈ Mm×n(F) 為 T 相對於 β,γ 的 matrix representation. 對於任意 v ∈ V, 若 v = c1v₁+··· + cnv_n 且

[T ]^γ_β



 c1

... cn



 =



 d1

... dm



,

則 T (v) = d₁w₁+··· + dmw_m.亦即

[T ]^γ_β[v]_β = [T (v)]_γ.

Proof. 因 v = c₁v₁+··· + cnv_n, 依定義 v 利用 β 坐標化所得 Fⁿ 的向量 T_β(v) 為



 c1

... c_n



. 故

由前面所述 T_γ◦ T ◦ T_β⁻¹(T_β(v)) = T_γ(T (v)) 就是將



 c₁

... cn



 左邊乘上 [T]^γ_β 所得的 F^m 中向量



 d1

... dm



. 故由 Tγ(T (v)) =



 d1

... dm



 可得 T(v) = d1w₁+··· + dmw_m.

Example 4.3.15. 我們考慮 Example 4.3.13 的例子, 即考慮 T : P2(R) → P3(R), 其中對 於任意 p(x)∈ P2(R), T(p(x)) = (x + 1)p(x − 1). 考慮 p(x) = x²− 1 的情形. 因 p(x − 1) = (x− 1)²− 1, 依 T 的定義得

T (p(x)) = (x + 1)p(x− 1) = (x + 1)((x − 1)²− 1) = x³− x²− 2x.

當考慮 P₂(R) 的 ordered basis ε2= (1, x, x²) 以及 P₃(R) 的 ordered basis ε3= (1, x, x², x³),

我們知道 T 對於ε2,ε3 的 matrix representation 為 [T ]^ε_ε³₂ =







1 −1 1 1 0 −1 0 1 −1 0 0 1





 故由 [p(x)]^ε² =

(14)

[x²− 1]_ε2=



−1 0 1



 得

[T (p(x))]_ε₃ =







1 −1 1 1 0 −1 0 1 −1 0 0 1









−1 0 1



 =





 0

−2−1 1





,

即 T (p(x)) = x³− x²− 2x.

當然我們也可以利用 Example 4.3.13 中 V 的 ordered basisβ = (p1(x), p₂(x), p₃(x)) 以 及 W 的 ordered basis γ = (q1(x), q2(x), q3(x), q4(x)) 求出 T (x²− 1). 此時若 p(x) = x²− 1 = c1p1(x) + c2p2(x) + c3p3(x), 則代 x =−1,0,1 得 c1= 0, c2=−1, c3= 0, 亦即 [p(x)]_β=



 0

−1 0



.

故將 [p(x)]_β 左邊乘上 T 對於β,γ 的 representation matrix [T]^γ_β 得

[T (p(x))]_γ =







0 0 0 1 0 0 0 2 0 0 0 3









 0

−1 0



 =





 0 0

−2 0





.

得知 T (p(x)) =−2q3(x). 由於 q₃(−1) = q3(0) = q₃(2) = 0 以及 q₃(1) = 1, 我們有 q₃(x) = (x + 1)x(x− 2)/(−2), 故得 T(p(x)) = (x + 1)x(x − 2) = x³− x²− 2x.

———————————– 13 December, 2018