162 6. Eigenvalues and Eigenvectors
6.3. Change of Basis
在這一節中, 我們介紹 change of basis 的概念, 了解到一個 linear operator 換了 ordered basis 後其表現矩陣的關係. 這個概念能幫助我們以後處理矩陣對角化的問題.
我們知道一個 linear transformation, 當我們用不同的 ordered bases 所得的 matrix representation 會不同. 假設β,β′ 為 V 的兩組 ordered bases, 而γ,γ′ 為 W 的兩組 ordered basis. 對於 linear transformation T : V → W, 其對應於這兩對 ordered bases 的 matrix representations [T ]γβ 和 [T ]γβ′′ 之間會有甚麼關係呢? 首先我們考慮 identity map id : V → V.
注意雖然是 identity map, 但其 matrix representation 未必會是 identity matrix. 事實上, 當我們定義域和對應域都選同一組 ordered basisβ = {v1, . . . , vn}, 則由於 id(vi) = vi, 故其 matrix representation 是 identity matrix. 但若定義域是使用 β 這一組 ordered basis, 而 對應域選的是 β′={v′1, . . . , v′n} 這一組 ordered basis, identity map 對應於 β,β′ 的 matrix representation [id]ββ′ 其 i-th column 雖然仍和 id(vi) = vi 有關, 不過卻是要將 vi 寫成以 {v′1, . . . , v′n} 為 ordered basis 的坐標表示法 [vi]β′. 所以當β 和 β′ 相異時, [id]ββ′ 不是 identity matrix. 現對任意 v∈ V, 因 v 對於β 的坐標表示法為 [v]β, 依 matrix representation 的性 質 (Proposition 4.3.14) 可得
[id]ββ′[v]β= [id(v)]β′ = [v]β′.
也就是說, 矩陣 [id]ββ′ 可以將 V 中元素對於 β 的坐標表示轉換成對於 β′ 的坐標表示, 也因 此我們稱 [id]ββ′ 為 change-of-basis matrix.
要注意 id : V→ V 是 isomorphism, 所以由 Theorem 4.3.19 (3), 我們得 [id]ββ′ 為 invertible 且
([id]ββ′)−1= [id−1]ββ′ = [id]ββ′ (6.1) 也就是說將 β 的坐標表示轉換成對於 β′ 的坐標表示的 change-of-basis matrix 的 inverse 就是β′ 的坐標表示轉換成對於 β 的坐標表示的 change-of-basis matrix.
我們回到原先的問題, 假設 T : V → W 為 linear transformation 且 β,β′ 為 V 的兩組 ordered bases, 而γ,γ′ 為 W 的兩組 ordered basis. 我們要探討 [T ]γβ 和 [T ]γβ′′ 之間的關係. 由 於 idV : V → V, T : V → W 和 idW : W → W 之合成 idW◦ T ◦ idV : V → W 仍為 T : V → W, 所 以由 Theorem 4.3.19 (2) 得
[idW]γβ′[T ]γβ[idV]ββ′ = [T ]γβ′′. 這就是所謂的 change-of basis formula, 我們將之完整敘述如下.
Theorem 6.3.1 (Change-of-basis Formula). 假設 T : V → W 為 linear transformation 且 β,β′ 為 V 的兩組 ordered bases, 而γ,γ′為 W 的兩組 ordered basis, 則存在 invertible matrix P, Q 使得 [T ]γβ′′ = Q ([T ]γβ) P, 其中 P 為將 β′ 的坐標表示轉換成 β 的坐標表示的 change-of- basis matrix [idV]ββ′, 而 Q 為將γ 的坐標表示轉換成 γ′ 的坐標表示的 change-of-basis matrix [idW]γγ′.
6.3. Change of Basis 163
Example 6.3.2. 在 Example 4.3.13 中我們考慮 linear transformation T : P2(R) → P3(R), 其中 T (p(x)) = (x + 1)p(x− 1), ∀ p(x) ∈ P2(R). 另外我們考慮 P2(R) 的兩組 ordered bases ε = (x2, x, 1),β = (p1(x), p2(x), p3(x)) 其中
p1(x) = 1
2(x2− x), p2(x) =−x2+ 1, p3(x) = 1
2(x2+ x)
以及 P3(R) 的兩組 ordered basesε′= (x3, x2, x, 1),β′= (q1(x), q2(x), q3(x), q4(x)) 其中 q1(x) = −x3+ 3x2− 2x
6 , q2(x) = x3− 2x2− x + 2
2 , q3(x) = −x3+ x2+ 2x
2 , q4(x) = x3− x 6 . 在 Example 4.3.13 中我們得到
[T ]εε′=
1 0 0
−1 1 0
−1 0 1 1 −1 1
, [T]ββ′ =
0 0 0 1 0 0 0 2 0 0 0 3
.
因 [p1(x)]ε=
1/2
−1/2 0
, [p2(x)]ε =
−1 0 1
, [p3(x)]ε =
1/2 1/2 0
依定義 β 到 ε 的 change-of-basis
matrix 為 [idP2(R)]εβ=
1/2 −1 1/2
−1/2 0 1/2
0 1 0
. 另外若 x3= c1q1(x) + c2q2(x) + c3q3(x) + c4q4(x), 則因 q1(−1) = 1,q2(−1) = q3(−1) = q4(−1) = 0, 將 x = −1 代入前式得 c1=−1, 同理我們
可得 c2= 0, c3= 1, c4= 8, 亦即 [x3]β′=
−1 0 1 8
. 用同樣方法求 x2, x, 1 對於 β′ 的坐標表示法,
我們得ε′ 到 β′ 的 change-of-basis matrix 為 [idP3(R)]βε′′ =
−1 1 −1 1 0 0 0 1 1 1 1 1 8 4 2 1
. 我們也可以
先寫下 β′ 到 ε′ 的 change-of-basis matrix [idP3(R)]εβ′′ =
−1/6 1/2 −1/2 1/6 1/2 −1 1/2 0
−1/3 −1/2 1 −1/6
0 1 0 0
再
取 inverse 得 [idP3(R)]βε′′. 最後我們驗算
[idP3(R)]βε′′[T ]εε′[idP2(R)]εβ=
−1 1 −1 1 0 0 0 1 1 1 1 1 8 4 2 1
1 0 0
−1 1 0
−1 0 1 1 −1 1
1
2 −1 12
−12 0 12 0 1 0
= [T]ββ′.
回顧一下, 我們經常談論的一種 linear transformation 是其定義域及對應域為相同的 vector space. 這樣的 linear transformation 我們特別稱之為 linear operator. 關於 linear operator 我們通常對於定義域及對應域會選同樣的一組 ordered basis. 此時利用 Theorem 6.3.1, 我們得以下之結果.
164 6. Eigenvalues and Eigenvectors
Corollary 6.3.3. 假設 T : V → V 為 linear transformation 且 β,β′ 為 V 的兩組 ordered bases. 則存在 invertible matrix P 使得 [T ]ββ′′ = P−1([T ]ββ) P, 其中 P 為將 β′ 的坐標表示轉換 成 β 的坐標表示的 change-of-basis matrix [idV]ββ′.
Proof. 考慮 Theorem 6.3.1 其中 W = V ,γ = β 以及 γ′=β′ 的情形. 此時 Q = [idV]ββ′ 由式 子 (6.1), 知 Q = ([idV]ββ′)−1= P−1, 得證本定理. 給定一個 n× n matrix A 我們知道它可以代表某一個 dimension 為 n 的 vector space V 上的 linear operator T : V → V, 對於 V 的某一組 ordered basis 的 matrix representation.
若 P 為 n× n invertible matrix, 則我們稱 B = P−1AP 和 A 為 similar. 意味著我們也可將 B 視為 T : V → V 的一個 matrix representation 只是選取 V 不同的 ordered basis 而已.
有時一個 linear operator, 若選取夠好的一組 ordered basis, 我們可以得到更好的 matrix representation 以至於更容易了解這個 linear transformation. 有關於這個課題, 等以後談到 對角化時我們再進一步探討. 我們先看一個簡單的例子.
Example 6.3.4. 考慮 linear operator T :R2→ R2 定義為 T ( [x
y ]
) = 251
[9x + 12y 12x + 16y
] . 若利 用標準基底 ε = (
[1 0 ]
, [0
1 ]
) 我們得 [T ]εε = 251
[ 9 12 12 16
]
. 然而若用 β = ( [3
4 ]
, [−4
3 ]
) 這組 ordered basis 可由 T (
[3 4 ]
) = [3
4 ]
, T ( [−4
3 ]
) = [0
0 ]
, 得 [T ]ββ=
[ 1 0 0 0
]
. 我們很容易由
[T◦ T]ββ = ([T ]ββ)([T ]ββ) =
[ 1 0 0 0
]2
=
[ 1 0 0 0
]
= [T ]ββ
推得 T◦ T = T. 事實上從 β 這組 ordered basis 我們很容易看出 T 就是將 R2 上的向量對 [3
4 ]
的投影. 另外令 P = [id]εβ=
[ 3 −4 4 3
]
, 我們得 [ 1 0
0 0 ]
= [T ]ββ= ([id]βε)([T ]εε)([id]εβ) = P−1( 1 25
[ 9 12 12 16
] )P, 所以
[ 1 0 0 0
] 和 251
[ 9 12 12 16
]
為 similar.
———————————– 11 April, 2019