事實上, 當我們定義域和對應域都選同一組 ordered basisβ = {v1

(1)

162 6. Eigenvalues and Eigenvectors

6.3. Change of Basis

在這一節中, 我們介紹 change of basis 的概念, 了解到一個 linear operator 換了 ordered basis 後其表現矩陣的關係. 這個概念能幫助我們以後處理矩陣對角化的問題.

我們知道一個 linear transformation, 當我們用不同的 ordered bases 所得的 matrix representation 會不同. 假設β,β^′ 為 V 的兩組 ordered bases, 而γ,γ^′ 為 W 的兩組 ordered basis. 對於 linear transformation T : V → W, 其對應於這兩對 ordered bases 的 matrix representations [T ]^γ_β 和 [T ]^γ_β^′_′ 之間會有甚麼關係呢? 首先我們考慮 identity map id : V → V.

注意雖然是 identity map, 但其 matrix representation 未必會是 identity matrix. 事實上, 當我們定義域和對應域都選同一組 ordered basisβ = {v1, . . . , vn}, 則由於 id(vi) = vi, 故其 matrix representation 是 identity matrix. 但若定義域是使用 β 這一組 ordered basis, 而對應域選的是 β^′={v^′₁, . . . , v^′_n} 這一組 ordered basis, identity map 對應於 β,β^′ 的 matrix representation [id]^β_β^′ 其 i-th column 雖然仍和 id(v_i) = v_i 有關, 不過卻是要將 v_i 寫成以 {v^′₁, . . . , v^′_n} 為 ordered basis 的坐標表示法 [vi]_β′. 所以當β 和 β^′ 相異時, [id]^β_β^′ 不是 identity matrix. 現對任意 v∈ V, 因 v 對於β 的坐標表示法為 [v]β, 依 matrix representation 的性質 (Proposition 4.3.14) 可得

[id]^β_β^′[v]_β= [id(v)]_β′ = [v]_β′.

也就是說, 矩陣 [id]^β_β^′ 可以將 V 中元素對於 β 的坐標表示轉換成對於 β^′ 的坐標表示, 也因此我們稱 [id]^β_β^′ 為 change-of-basis matrix.

要注意 id : V→ V 是 isomorphism, 所以由 Theorem 4.3.19 (3), 我們得 [id]^β_β^′ 為 invertible 且

([id]^β_β^′)⁻¹= [id⁻¹]^β_β_′ = [id]^β_β_′ (6.1) 也就是說將 β 的坐標表示轉換成對於 β^′ 的坐標表示的 change-of-basis matrix 的 inverse 就是β^′ 的坐標表示轉換成對於 β 的坐標表示的 change-of-basis matrix.

我們回到原先的問題, 假設 T : V → W 為 linear transformation 且 β,β^′ 為 V 的兩組 ordered bases, 而γ,γ^′ 為 W 的兩組 ordered basis. 我們要探討 [T ]^γ_β 和 [T ]^γ_β^′_′ 之間的關係. 由於 id_V : V → V, T : V → W 和 idW : W → W 之合成 idW◦ T ◦ idV : V → W 仍為 T : V → W, 所 以由 Theorem 4.3.19 (2) 得

[id_W]^γ_β^′[T ]^γ_β[id_V]^β_β_′ = [T ]^γ_β^′_′. 這就是所謂的 change-of basis formula, 我們將之完整敘述如下.

Theorem 6.3.1 (Change-of-basis Formula). 假設 T : V → W 為 linear transformation 且 β,β^′ 為 V 的兩組 ordered bases, 而γ,γ^′為 W 的兩組 ordered basis, 則存在 invertible matrix P, Q 使得 [T ]^γ_β^′_′ = Q ([T ]^γ_β) P, 其中 P 為將 β^′ 的坐標表示轉換成 β 的坐標表示的 change-of- basis matrix [idV]^β_β_′, 而 Q 為將γ 的坐標表示轉換成 γ^′ 的坐標表示的 change-of-basis matrix [id_W]^γ_γ^′.

(2)

6.3. Change of Basis 163

Example 6.3.2. 在 Example 4.3.13 中我們考慮 linear transformation T : P₂(R) → P3(R), 其中 T (p(x)) = (x + 1)p(x− 1), ∀ p(x) ∈ P2(R). 另外我們考慮 P2(R) 的兩組 ordered bases ε = (x², x, 1),β = (p1(x), p2(x), p3(x)) 其中

p₁(x) = 1

2(x²− x), p2(x) =−x²+ 1, p₃(x) = 1

2(x²+ x)

以及 P₃(R) 的兩組 ordered basesε^′= (x³, x², x, 1),β^′= (q₁(x), q₂(x), q₃(x), q₄(x)) 其中 q1(x) = −x³+ 3x²− 2x

6 , q₂(x) = x³− 2x²− x + 2

2 , q₃(x) = −x³+ x²+ 2x

2 , q₄(x) = x³− x 6 . 在 Example 4.3.13 中我們得到

[T ]^ε_ε^′=







1 0 0

−1 1 0

−1 0 1 1 −1 1





, [T]^ββ^′ =







0 0 0 1 0 0 0 2 0 0 0 3





.

因 [p₁(x)]_ε=



 1/2

−1/2 0



, [p₂(x)]_ε =



−1 0 1



, [p₃(x)]_ε =



1/2 1/2 0



 依定義 β 到 ε 的 change-of-basis

matrix 為 [id_P₂₍_R)]^ε_β=



 1/2 −1 1/2

−1/2 0 1/2

0 1 0



. 另外若 x³= c1q1(x) + c2q2(x) + c3q3(x) + c4q4(x), 則因 q₁(−1) = 1,q2(−1) = q3(−1) = q4(−1) = 0, 將 x = −1 代入前式得 c1=−1, 同理我們

可得 c₂= 0, c3= 1, c4= 8, 亦即 [x³]_β′=







−1 0 1 8





. 用同樣方法求 x², x, 1 對於 β^′ 的坐標表示法,

我們得ε^′ 到 β^′ 的 change-of-basis matrix 為 [id_P₃₍_R)]^β_ε_′^′ =







−1 1 −1 1 0 0 0 1 1 1 1 1 8 4 2 1





. 我們也可以

先寫下 β^′ 到 ε^′ 的 change-of-basis matrix [id_P₃₍_R)]^ε_β^′_′ =







−1/6 1/2 −1/2 1/6 1/2 −1 1/2 0

−1/3 −1/2 1 −1/6

0 1 0 0





 再

取 inverse 得 [id_P₃₍_R)]^β_ε_′^′. 最後我們驗算

[id_P₃_(R)]^β_ε_′^′[T ]^ε_ε^′[id_P₂_(R)]^ε_β=







−1 1 −1 1 0 0 0 1 1 1 1 1 8 4 2 1













1 0 0

−1 1 0

−1 0 1 1 −1 1











1

2 −1 ¹₂

−12 0 ¹₂ 0 1 0



 = [T]^β_β^′.

回顧一下, 我們經常談論的一種 linear transformation 是其定義域及對應域為相同的 vector space. 這樣的 linear transformation 我們特別稱之為 linear operator. 關於 linear operator 我們通常對於定義域及對應域會選同樣的一組 ordered basis. 此時利用 Theorem 6.3.1, 我們得以下之結果.

(3)

164 6. Eigenvalues and Eigenvectors

Corollary 6.3.3. 假設 T : V → V 為 linear transformation 且 β,β^′ 為 V 的兩組 ordered bases. 則存在 invertible matrix P 使得 [T ]^β_β^′_′ = P⁻¹([T ]^β_β) P, 其中 P 為將 β^′ 的坐標表示轉換成 β 的坐標表示的 change-of-basis matrix [idV]^β_β_′.

Proof. 考慮 Theorem 6.3.1 其中 W = V ,γ = β 以及 γ^′=β^′ 的情形. 此時 Q = [idV]^β_β^′ 由式 子 (6.1), 知 Q = ([id_V]^β_β_′)⁻¹= P⁻¹, 得證本定理. 給定一個 n× n matrix A 我們知道它可以代表某一個 dimension 為 n 的 vector space V 上的 linear operator T : V → V, 對於 V 的某一組 ordered basis 的 matrix representation.

若 P 為 n× n invertible matrix, 則我們稱 B = P⁻¹AP 和 A 為 similar. 意味著我們也可將 B 視為 T : V → V 的一個 matrix representation 只是選取 V 不同的 ordered basis 而已.

有時一個 linear operator, 若選取夠好的一組 ordered basis, 我們可以得到更好的 matrix representation 以至於更容易了解這個 linear transformation. 有關於這個課題, 等以後談到對角化時我們再進一步探討. 我們先看一個簡單的例子.

Example 6.3.4. 考慮 linear operator T :R²→ R² 定義為 T ( [x

y ]

) = ₂₅¹

[9x + 12y 12x + 16y

] . 若利用標準基底 ε = (

[1 0 ]

, [0

1 ]

) 我們得 [T ]^ε_ε = ₂₅¹

[ 9 12 12 16

]

. 然而若用 β = ( [3

4 ]

, [−4

3 ]

) 這組 ordered basis 可由 T (

[3 4 ]

) = [3

4 ]

, T ( [−4

3 ]

) = [0

0 ]

, 得 [T ]^β_β=

[ 1 0 0 0

]

. 我們很容易由

[T◦ T]^β_β = ([T ]^β_β)([T ]^β_β) =

[ 1 0 0 0

]2

=

[ 1 0 0 0

]

= [T ]^β_β

推得 T◦ T = T. 事實上從 β 這組 ordered basis 我們很容易看出 T 就是將 R² 上的向量對 [3

4 ]

的投影. 另外令 P = [id]^ε_β=

[ 3 −4 4 3

]

, 我們得 [ 1 0

0 0 ]

= [T ]^β_β= ([id]^β_ε)([T ]^ε_ε)([id]^ε_β) = P⁻¹( 1 25

[ 9 12 12 16

] )P, 所以

[ 1 0 0 0

] 和 ₂₅¹

[ 9 12 12 16

]

為 similar.

———————————– 11 April, 2019