• 沒有找到結果。

2.1. 矩陣的運算

N/A
N/A
Protected

Academic year: 2022

Share "2.1. 矩陣的運算"

Copied!
19
0
0

加載中.... (立即查看全文)

全文

(1)

Matrix

在第一章我們利用矩陣來表示一個聯立方程組, 這種表示法不只有其方便性其實是有另一層 的意義. 在這一章中我們將介紹有關矩陣的運算, 利用矩陣的運算我們對聯立方程組將有另 一種看法. 利用這新的看法, 我們對聯立方程組的解可以有更進一步的了解.

2.1. 矩陣的運算

在本節中我們將簡單地回顧有關於矩陣的定義. 一般來說一個矩陣是由數個 (橫) 列 (row) 以及 (直) 行 (column) 的數組成. 若一矩陣由 m 個 row 和 n 個 column 的數所組成, 我們 便稱該矩陣為一個 m× n matrix. 特別的, 一個 n × n matrix (即 row 的個數等於 column 的 個數), 我們稱之為 square matrix. 在本講義中, 我們用 Mm×n 來表示所有係數在 R 的 m × n 矩陣所成的集合. 通常我們會用大寫的英文字母來表示一個矩陣. 例如考慮

A =

 1 0 2 3 0 1 5 8 2 1 1 0

, (2.1)

則 A 為一個 3× 4 matrix, 即 A ∈ M3×4. 當我們要抽象地描述一個矩陣時, 我們也常用 A = [ai j]這樣的方法來描述. 這種表示法意指 A 中在第 i 個 row 和 j 個 column 的位置我 們用 ai j 來表示, 並稱之為此矩陣的 (i, j)-th entry. 因此當我們說 A = [ai j] 為 m× n 矩陣, 這表示 1≤ i ≤ m 且 1 ≤ j ≤ n. 例如對於式子 (2.1) 中的矩陣 A, 若 A = [ai j],則

a1 1= 1, a1 2= 0, a1 3= 2, a1 4= 3, a2 1= 0, a2 2= 1, a2 3= 5, a2 4= 8, a3 1= 2, a3 2= 1, a3 3= 1, a3 4= 0.

另外為了方便起見, 我們也會將矩陣 A 的每一個 row 和 column 用向量的方法來表示, 這些稱為 A 的 row vectors 和 column vectors. 在本講義我們會將矩陣 A = [ai j]第 i 個 row 所成的 row vector 用 ia 來表示, 而第 j 個 column 所成的 column vector 用 aj 來表示. 例 如對於式子 (2.1) 中的矩陣 A, 我們有

1a =[

1 0 2 3]

, 2a =[

0 1 5 8]

, 3a =[

2 1 1 0]

23

(2)

以及

a1=

 1 0 2

, a2=

 0 1 1

, a3=

 2 5 1

, a4=

 3 8 0

.

注意由於我們也想將向量看成是一個矩陣, 這裡的 row vectors 和 column vectors 都用矩陣 的形式呈現.

我們想給矩陣一個運算, 既然要談運算就會牽涉相等的概念. 所以我們要先定義何謂矩 陣的相等.

Definition 2.1.1. 假設 A = [ai j] 為一個 m× n matrix 且 A= [ai j] 為一個 m× n matrix.

我們定義 A = A 若且唯若 m = m, n = n 且對所有的 1≤ i ≤ m 以及 1 ≤ j ≤ n 皆有 ai j= ai j. 很容易看出矩陣的相等的定義是向量相等的延伸. 在向量中只有同在Rn 的向量我們才 談是否相等, 且兩個 Rn 中的向量相等表示這兩個向量在每一個相同位置的數皆相等. 同樣 的只有同在 Mm×n 的矩陣才談是否相等, 且兩個 Mm×n 中的矩陣相等表示這兩個矩陣在每一 個相同位置的數皆相等.

我們也延伸向量加法與係數積的定義來定義矩陣的加法與係數積. 也就是說只有同為 Mm×n 的矩陣我們才定義它們之間的加法, 且兩矩陣相加表示將這兩個矩陣在相同位置的數 加起來. 而一個實數乘上一個矩陣即為將該矩陣每一個位置上的數乘上該實數. 具體來說我 們有以下的定義.

Definition 2.1.2. 假設 A = [ai j], B = [bi j]皆為 m× n matrix. 定義 A + B = [ci j],其中對所 有的 1≤ i ≤ m 以及 1 ≤ j ≤ n 皆有 ci j= ai j+ bi j. 對任意實數 r, 我們定義 rA = [di j] 其中 對所有的 1≤ i ≤ m 以及 1 ≤ j ≤ n 皆有 di j= rai j.

Definition 2.1.2 告訴我們若

A =





a1 1 a1 2 ··· a1 n

a2 1 a2 2 ··· a2 n

... ... . .. ... am 1 am 2 ··· am n



, B =





b1 1 b1 2 ··· b1 n

b2 1 b2 2 ··· b2 n

... ... . .. ... bm 1 bm 2 ··· bm n





A + B =





a1 1+ b1 1 a1 2+ b1 2 ··· a1 n+ b1 n

a2 1+ b2 1 a2 2+ b2 2 ··· a2 n+ b2 n ... ... . .. ... am 1+ bm 1 am 2+ bm 2 ··· am n+ bm n





rA =





ra1 1 ra1 2 ··· ra1 n

ra2 1 ra2 2 ··· ra2 n

... ... . .. ... ram 1 ram 2 ··· ram n





矩陣的加法與係數積的定義可以說是由大家熟悉的R2,R3 的向量(甚至Rn)的加法與 係數積延伸而來, 我們有以下這些性質.

(3)

Proposition 2.1.3. 對於 Mm×n 上的矩陣, 我們有以下的性質:

(1) 對任意 A, B∈ Mm×n, 皆有 A + B = B + A.

(2) 對任意 A, B,C∈ Mm×n, 皆有 (A + B) +C = A + (B +C).

(3) 存在一矩陣 O∈ Mm×n 滿足對任意 A∈ Mm×n 皆有 O + A = A.

(4) 對任意 A∈ Mm×n 皆可找到 A∈ Mm×n 滿足 A + A= O.

(5) 對任意 r, s∈ R 以及 A ∈ Mm×n, 皆有 r(sA) = (rs)A.

(6) 對任意 r, s∈ R 以及 A ∈ Mm×n, 皆有 (r + s)A = rA + sA.

(7) 對任意 r∈ R 以及 A,B ∈ Mm×n 皆有 r(A + B) = rA + rB.

(8) 對任意 A∈ Mm×n, 皆有 1A = A.

Proposition 2.1.3 的證明用到實數 R 相對應的性質. 例如 (1) 談的是矩陣加法的交換性 質, 用到的是R 的加法交換性. 事實上若令 A = [ai j], B = [bi j]以及 A + B = [ci j], B + A = [di j].

依定義, 我們有 ci j= ai j+ bi j以及 di j= bi j+ ai j. 由於實數的加法交換性 ai j+ bi j= bi j+ ai j, 因此得 ci j= di j, 故依矩陣相等的定義,得證 A + B = B + A. 其他各項都可用一樣的方法 證明, 這裡就不證明了. 不過 (3), (4) 談的是存在性的問題. 這類問題就必須說明存在的是 什麼. 例如 O 就是零矩陣,也就是說 O = [ci j] 其中 ci j= 0, ∀i j. 而 (4) 的 A 稱為 A 的 加法反元素, 它是跟著 A 而變的. 如果 A = [ai j]則令 A= [ai j]其中 ai j=−ai j, 就會滿足 A + A= O 了. 一般來說, 給定 A 我們會將 A 的加法反元素用−A 來表示.

接著我們定義矩陣間的乘法. 首先回顧當我們要解聯立方程組 x1 +2x2 = 1

−x1 +1x2 = 2 2x1 −2x2 = 3 我們會把它寫成

 1 2

−1 1 2 −2

[ x1 x2

]

=

1 2 3

.

所以若我們定義矩陣

 1 2

−1 1 2 −2

 和[ x1 x2 ]

的乘法為

 1 2

−1 1 2 −2

[ x1 x2

]

= x1

 1

−1 2

 + x2

 2 1

−2

那麼聯立方程組與矩陣的關係就不只是為了列式方便而已, 聯立方程組和矩陣的運算產生了 緊密的關係.

從這個角度出發, 我們有以下定義.

(4)

Definition 2.1.4. 設 A = [ai j] 為 m× n matrix 以及 b = [bj] 為 n× 1 matrix (即 Rn 中的 column vector). 若 ai 表示 A 的 i-th column 則定義

Ab =





a1 1 a1 2 ··· a1 n

a2 1 a2 2 ··· a2 n

... ... . .. ... am 1 am 2 ··· am n







 b1

b2

... bn



=

 a 1 a2 ··· a n



 b1

b2

... bn



= b1a1+ b2a2+··· + bnan.

注意依此定義, 必需 A∈ Mm×n 的 column 的個數 n 等於 b∈ Mn×1的 row 的個數 n, 才能 定義 Ab 且此時 Ab 會是 m× 1 matrix (即 Rm中的 column vector). 觀察此 column vector, 我們有

Ab = b1



 a11 a21

... am1



+ b2



 a12 a22

... am2



+··· + bn



 a1n a2n

... amn



=





b1a11+ b2a12+··· + bna1n b1a21+ b2a22+··· + bna2n

...

b1am1+ b2am2+··· + bnamn



. (2.2)

特別的, 當 a =[

a1 a2 ··· an

]為 1×n matrix 而 b =



 b1 b2

... bn



為 n×1 matrix, 依 Definition

2.1.4 的矩陣乘法定義

a b =[

a1 a2 ··· an

]



 b1 b2

... bn



= b1a1+ b2a2+··· + bnan. (2.3)

(注意, 若 a, b 是Rn 中的向量, 則 ab 就是我們熟悉 a, b 的內積 ⟨a,b⟩.) 依此看法, 由式子 (2.2), 我們可將 Ab 寫成

Ab =





1a b

2a b ...

ma b



. (2.4)

也就是說 Ab 這一個 m×1 matrix 的 i-th entry 為ia b 也就是 A 的 i-th rowia 和 b 的內積.

我們來看一個 m×n matrix 以及 Rn 的 column vector 在此乘法的定義之下的基本性質.

Lemma 2.1.5. 假設 A = [ai j], A= [ai j]為 m× n matrices 以及 b = [bj], b= [bj]為 Rn的 column vectors (即 n× 1 matrices) 以及 c ∈ R. 我們有以下的性質.

(1) A(b + b) = Ab + Ab. (2) A(cb) = c(Ab) = (cA)b.

(3) (A + A)b = Ab + Ab.

Proof. 令 A 的 column vectors 依次為 a1, . . . , an 且 A 的 column vectors 依次為 a1, . . . , an.

(5)

(1) 依定義

A(b + b) =

 a 1 ··· a n

 b1+ b1

... bn+ bn

 = (b1+ b1)a1+··· + (bn+ bn)an. (2.5)

而 Ab + Ab

 a 1 ··· a n

 b1

... bn

 +

 a 1 ··· a n

 b1

... bn

 = (b1a1+··· + bnan) + (b1a1+··· + bnan). (2.6)

由矩陣加法和係數積的分配律 (Proposition 2.1.3 的性質 (7),(8)), 我們得證式子 (2.5) 和式 子 (2.6) 相等.

(2) 依定義 c(Ab) 為

c (

 a1 ··· an

 b1

... bn

)

= c(b1a1+ b2a2+··· + bnan). (2.7)

而 cA 的 column vectors 依次為 ca1, . . . , can. 故 (cA)b 為

ca 1 ··· ca n

 b1

... bn

 = b1(ca1) +··· + bn(can). (2.8)

最後依定義 cb 為

 cb1

... cbn

, 故 A(cb) 為

 a 1 ··· a n

 cb1

... cbn

 = (cb1)a1+··· + (cbn)an. (2.9)

由矩陣加法和係數積的結合律 (Proposition 2.1.3 的性質 (6)), 我們得證 (2.7), (2.8), (2.9) 三個式子皆相等.

(3) 依定義 A + A 的 column vectors 依次為 a1+ a1, . . . , an+ an, 所以

(A + A)b =

a1+ a1 ··· an+ an

 b1

... bn

 = b1(a1+ a1) +··· + bn(an+ an). (2.10)

另一方面, Ab + Ab 為

 a 1 ··· a n

 b1

... bn

 +

 a 1 ··· a n

 b1

... bn

 = (b1a1+··· + bnan) + (b1a1+··· + bnan). (2.11)

再次由矩陣加法和係數積的分配律, 我們得證式子 (2.10) 和式子 (2.11) 相等.  Lemma 2.1.5 (1),(2) 告訴我們矩陣對向量的乘法有類似分配律的性質, 這個性質很重要 (以後我們會再提到並稱之為 linear 的性質), 我們特別用以下定理表示.

(6)

Proposition 2.1.6. 假設 A∈ Mm×n, 且 b, b 為 Rn 中的 column vectors, 以及 c, c∈ R. 則 A(cb + cb) = c(Ab) + c(Ab).

Proof. 因 cb, cb 皆 為 Rn 中 的 column vectors, 由 Lemma 2.1.5 (1) 知 A(cb + cb) = A(cb) + A(cb). 再 由 Lemma 2.1.5 (2) 知 A(cb) = c(Ab), A(cb) = c(Ab), 故 得 證 本 定

理. 

Question 2.1. 假設 A∈ Mm×n, 且 b1, . . . , bk 為 Rn 中的 column vectors, c1, . . . , ck∈ R. 試 利用數學歸納法證明

A( k

i=1

cibi)

=

k i=1

ci(Abi).

Question 2.2. 假設 A, A∈ Mm×n, 且 b 為 Rn 中的 column vectors, 以及 c, c∈ R. 是否 (cA + cA)b = c(Ab) + c(Ab) ?

現在我們將矩陣乘法推廣到更一般的情況, 當 A = [ai j] 是一個 m× n matrix, B = [bj k] 是一個 n× l matrix. 由於對 B 的每一個 column vector bk∈ Mn×1, 1≤ k ≤ l, 我們已定義了 Abk 為何, 現在我們定義 AB 為 m× l matrix, 其中 AB 的 k-th column vector 為 Abk. 我們 大致上有以下的圖示.

A

 b 1 b2 ··· b l

 =

Ab 1 Ab 2 ··· Ab l

由於 Abk 為 m× 1 matrix, 依此定義確實 AB 為 m × l matrix. 現在我們來看正式的定義.

Definition 2.1.7. 設 A = [ai j] 為 m× n matrix 以及 B = [bjk] 為 n× l matrix, 則定義 AB = C = [cik]為 m× l matrix, 其中對於 1 ≤ k ≤ l, C 的 k-th column ck

ck= Abk=





a1 1 a1 2 ··· a1 n

a2 1 a2 2 ··· a2 n

... ... . .. ... am 1 am 2 ··· am n







 b1 k b2 k

... bn k



= b1 ka1+ b2 ka2+··· + bn kan. (2.12)

由此定義, 我們知對於 1≤ i ≤ m, 1 ≤ k ≤ l, AB 的 (i,k)-th entry 應為其 k-th column (即 Abk) 從上往下算的第 i 個 entry. 由式子 (2.4) 我們知此即 A 的 i-th row ia 和 B 的 k-th column bk 看成向量後取內積. 換言之, 若 AB = [ci k], 則 AB 的 (i, k)-th entry ci k

ci k=ia bk= ai 1b1 k+ ai 2b2 k+··· + ai nbn k=

n j=1

ai jbj k. (2.13) 再次強調一次, 並不是任取兩個矩陣都可以定義乘法, 必須是左邊矩陣的 column 個數和 右邊矩陣的 row 個數相同才能相乘.

Example 2.1.8. 令

A =

−2 4 3 6 2 2

,B =[

4 −1 2 5 3 0 1 1 ]

(7)

考慮矩陣乘法 AB. 依定義矩陣 AB 的 3-rd column 為 Ab3=

−2 4 3 6 2 2

[ 2 1 ]

= 2a1+ 1a2= 2

−2 3 2

 + 1

4 6 2

 =

0 12

6

.

所以 AB 的 (2, 3) entry 為 12 等於 A 的 2-nd row 和 B 的 3-rd column 看成R2 中的向量所 得的內積, 即 (3, 6)· (2,1) = 12. 事實上我們有

AB =

−2 4 3 6 2 2

[

4 −1 2 5 3 0 1 1 ]

=

4 2 0 −6 30 −3 12 21 14 −2 6 12

.

Question 2.3. 設 a, b 為 Rn 上的向量, 若將 a 寫成 row vector 的形式, b 寫成 column vector 的形式, 且將 a, b 看成矩陣, 即 a∈ M1×n(R), b ∈ Mn×1(R). 試問依矩陣乘法定義 ba 應為何種矩陣? 它和 a, b 看成 Rn 上的向量後取內積 ⟨b,a⟩ 有關嗎?

大部分的書都會用式子 (2.13) 當成矩陣乘法的定義. 我們選用式子 (2.12) 的用意, 主要 是它較能描繪當初矩陣乘法定義的用意. 另外它是由 column 來描繪矩陣的乘法, 在證明或 推導有關矩陣乘法性質時, 有時比式子 (2.13) 利用 entry 來看方便多了. 例如我們有以下的 性質.

Proposition 2.1.9. 假設 A, A∈ Mm×n, B, B∈ Mn×l. 我們有以下的性質.

(1) A(B + B) = AB + AB. (2) (A + A)B = AB + AB.

Proof. 首先注意因 A + A 仍為 m× n 矩陣且 B + B 為 n× l 矩陣, 所以這些矩陣的階數 是符合矩陣乘法的規定. 我們假設 B 的 column vectors 依次為 b1, . . . , bl 且 B 的 column vectors 依次為 b1, . . . , bl.

(1) 我們證明當 1≤ k ≤ l 時, A(B + B) 的 k-th column 會等於 AB + AB 的 k-th column.

依定義 A(B + B) 的 k-th column 為 A 的右邊乘上 B + B 的 k-th column. 然而由矩陣加法 定義, B + B 的 k-th column 為 bk+ bk, 即 B 的 k-th column 加上 B 的 k-th column. 因此我 們有 A(B + B) 的 k-th column 為 A(bk+ bk). 另一方面, AB + AB 的 k-th column 為 AB 的 k-th column Abk 加上 AB 的 k-th column Abk, 因此 AB + AB 的 k-th column 為 Abk+ Abk. 由 Lemma 2.1.5 (1), 我們得證它們相等.

(2) 我們證明當 1≤ k ≤ l 時, (A + A)B 的 k-th column 會等於 AB + AB 的 k-th column.

依定義 (A + A)B 的 k-th column 為 A + A 的右邊乘上 B 的 k-th column, 即 (A + A)bk. 另一 方面, AB + AB 的 k-th column 為 AB 的 k-th column Abk 加上 AB 的 k-th column Abk, 因 此 AB + AB 的 k-th column 為 Abk+ Abk. 因此由 Lemma 2.1.5 (3), 我們得證它們相等. 

矩陣乘法和 scalar multiplication (係數積) 也有以下關係 Proposition 2.1.10. 設 c∈ R, A ∈ Mm×n, B∈ Mn×l. 則

c(AB) = (cA)B = A(cB).

(8)

Proof. 假設 B 的 column vectors 依次為 b1, . . . , bl. 首先注意 c(AB), (cA)B 和 A(cB) 皆為 m× l matrix, 我們僅要證明當 1 ≤ k ≤ l 時, c(AB), (cA)B 和 A(cB) 的 k-th column 皆相等.

c(AB) 的 k-th column 為 r 乘上 AB 的 k-th column, 故為 c(Abk). 而 (cA)B 的 k-th column 為 cA 右邊乘上 B 的 k-th column, 故為 (cA)bk. 最後由於 cB 的 k-th column 為 cbk, 故 A(cB) 的 k-th column 為 A(cbk). 因此由 Lemma 2.1.5 (2), 我們得證它們皆相等.  Question 2.4. 假設 A, A∈ Mm×n, B, B∈ Mn×l 以及 c, c∈ R. 可證明 (cA + cA)B = cAB + cAB 以及 A(cB + cB) = cAB + cAB 嗎?

由 Proposition 2.1.9 和 Proposition 2.1.10 的證明我們可以看出, 有些矩陣乘法性質的 推導可以簡化成右邊的矩陣是一個 column 的情形處理. 其實利用 row 來看矩陣的乘法也 很很有用, 不過這個留待下一節介紹矩陣的 transpose (轉置) 後會更清楚.

利用矩陣乘法定義, 也可推得乘法具有結合律的性質 (即 (AB)C = A(BC)). 這裡要注意 A, B, C 的階數必須要有限制 (AB)C 和 A(BC) 才會有意義.

Proposition 2.1.11. 假設 A∈ Mm×n, B∈ Mn×l,C∈ Ml×k, 則 (AB)C = A(BC).

Proof. 依定義 AB∈ Mm×l, 故 (AB)C∈ Mm×k. 而 BC∈ Mn×k, 故 A(BC)∈ Mm×k 與 (AB)C 同 階.

對於 1≤ j ≤ k, 我們要證明 (AB)C 和 A(BC) 的 j-th column 相等. 令 cj 為 C 的 j-th column 依定義 (AB)C 的 j-th column 為 (AB)cj. 至於 A(BC) 的 j-th column, 依定義為 A 右邊乘上 (BC) 的 j-th column (即 Bcj). 所以我們僅要說明 (AB)cj= A(Bcj), 就可證得結合 律.

由於 cj 只有一個 column, 為了方便考量, 我們將 cj 用單一足碼表達, 即令 cj=

 c1

... cl

.

現對任意 i = 1, . . . , l, 令 AB 的 i−th column 為 pi, 則

(AB)cj=

 p 1 ··· p l

 c1

... cl

 = c1p1+··· + clpl.

然而若 bi 為 B 的 i-th column, 依定義 pi 為 AB 的 i-th column 故得 pi= Abi. 因此我們得 (AB)cj= c1(Ab1) +··· + cl(Abl).

另一方面

A(Bcj) = A(

 b 1 ··· b l

 c1

... cl

) = A(c1b1+··· + clbl).

注意這裡我們將 bi 視為Rn 中的 column vector, 故套用 Proposition 2.1.6 (或 Question 2.1) 可得 A(c1b1+··· + clbl) = c1(Ab1) +··· + cl(Abl). 所以得證 (AB)cj= A(Bcj). 

(9)

有了矩陣乘法的結合律 (Proposition 2.1.11), 以後我們談多個矩陣相乘時, 為了方便起 見, 我們會捨去括號例如直接用 ABC 表示. 特別的, 當 A 為方陣時, 既然 (AA)A = A(AA), 我 們就用 A3 來表示. 同理, 當 n 個 A 相乘時, 我們就用 An 來表示.

最後我們要強調的是矩陣乘法雖具有許多和實數乘法類似的性質, 但它卻沒有交換律.

事實上有可能 A 乘以 B 有定義, 但 B 卻不能乘以 A, 例如 A∈ M2×3, B∈ M3×4 的情形. 也有 可能即使 A 乘以 B 和 B 乘以 A 都有定義, 但由於乘了以後階數不同, 仍會使得 AB̸= BA, 例 如 A∈ M2×3, B∈ M3×2 的情形. 僅有在 A, B 為同階方陣時, 才有可能使得 AB 和 BA 的階數 相同. 但此時仍有可能 AB̸= BA, 例如

A = [a b

c d ]

, B = [1 0

0 −1 ]

, AB =

[a −b c −d ]

, BA =

[ a b

−c −d ]

,

這種情形只有在 b = c = 0 時, 才會使得 AB = BA. 所以在處理矩陣乘法時要特別小心. 例 如當 A, B 為同階方陣時由 Proposition 2.1.9 和 Proposition 2.1.10 可推得 (A− B)(A + B) = A2− AB + BA − B2, 但由於可能 AB̸= BA, 我們不見得會有 (A − B)(A + B) = A2− B2.

當然了, 仍然有許多方陣會和所有的同階方陣相乘是可交換的. 一個常見的就是 zero matrix (零矩陣) O (即 O = [ai, j] 滿足每一個 entry ai, j= 0). 很容易驗證若 O 是一個 n× n square matrix, 則對任意 A∈ Mn×n, 皆有 OA = AO = O. 另一個常見的便是所謂的 identity matrix. 通常 n× n 階的 identity matrix, 我們會用 In 來表示. In 的 i-th column 為 ei, 即Rn 的 column vector, 其中 i-th entry 為 1, 其他 entry 為 0. 事實上 e1, e2, . . . , en 就是我們熟悉 的 Rn 的 standard basis (標準基底). 例如

I3=

1 0 0 0 1 0 0 0 1

,I4=



1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1



.

利用矩陣乘法的定義, 很容易知道對任意 A∈ Mm×n, B∈ Mn×l 我們皆有 AIn= A, InB = B. 特 別的, 當 A 為 n× n matrix, 我們有 AIn= InA = A.

Question 2.5. 假設 A∈ Mn×n, 是否 (A− 2In)2= A2− 4A + 4In 為對?

Question 2.6. 試證明 In 是唯一的 n× n 滿足對任意 A ∈ Mm×n 皆滿足 AIn= A.

一個 n× n 的 square matrix 其 (i,i)-th entry 稱為 diagonal entry. 若除了 diagonal entries 以外, 其他的 entry 皆為 0, 我們便稱之為 diagonal matrix. Identity matrix 就是一 個 diagonal matrix. 因為它的 diagonal entry 皆為 1, 其他的 entry 皆為 0. 另外, 對於任意 r∈ R, rIn 亦為 diagonal matrix. 因為它 diagonal entry 皆為 r, 其他 entry 皆為 0. 對於任 意 A∈ Mm×n, B∈ Mn×l 我們很容易驗證 rA = A(rIn), rB = (rIn)B.

Question 2.7. 試利用 Proposition 2.1.10 驗證對任意 n×n square matrix A, 皆有 (rIn)A = A(rIn).

要注意, 並不是所有 n× n 的 diagonal matrix 都會和 n × n 的 square matrix 相乘可交 換. 前面曾給過例子

[1 0 0 −1

]

就不能和所有的 2× 2 相乘可交換.

(10)

2.2. Transpose Operation

這一節中我們將介紹矩陣取 transpose (即轉置矩陣) 的概念, 即其相關性質. 最後利用它來 探討如何從 row 的角度來看矩陣相乘.

對於一個 m× n matrix, 簡單來說其轉置矩陣就是將此矩陣的 row 與 column 的腳色互 換, 也就是說將 row vectors 依序換成 column vectors. 我們有以下的定義.

Definition 2.2.1. 給定 A∈ Mm×n. 定義 At∈ Mn×m, 其中對於 1≤ i ≤ m, At 的 i-th column 就是將 A 的 i-th row 寫成 column vector. 我們稱 At 為 A 的 transpose.

Example 2.2.2. 令

A =

[ 1 2 3

−1 −2 −3 ]

,

依定義 At 應為 3× 2 matrix. 其中 At 的第一個 column 為 A 的第一個 row [

1 2 3] 寫成 column vector, 即

1 2 3

. 同理 At 的第二個 column 為 A 的第二個 row[

−1 −2 −3] 寫成

column vector, 即

−1

−2−3

. 故得

At=

1 −1 2 −2 3 −3

.

注意, At 的 1-st, 2-nd 和 3-rd row 也恰為 A 的 1-st, 2-nd 和 3-rd column 寫成 row 而得.

由上面的例子我們看到, 當 A∈ Mm×n, 對於 1≤ j ≤ n, At 的 j-th row 就是將 A 的 j-th column 寫成 row vector. 事實上若將 A 寫成 A = [ai j]. 對於 1≤ i ≤ m, At 的 i-th column 就 是將 A 的 i-th row [

ai 1 ··· ai n

] 寫成 column vector

 ai 1

... ai m

. 因此 At 的 (1, i)-th entry 就

是 A 的 (i, 1)-th entry ai 1, 而 At 的 (2, i)-th entry 就是 A 的 (i, 2)-th entry ai 1. 依此類推我 們可以得到對於 1≤ j ≤ n, At 的 ( j, i)-th entry 就是 A 的 (i, j)-th entry ai j. 也就是說若我 們將 At 寫成 At= [as k], 則 1≤ s ≤ n, 1 ≤ k ≤ m, 且 as k= ak s. 因此對於 1≤ j ≤ n, At 的 j-th row[

aj 1 ··· aj m]

即為[

a1 j ··· am j

], 恰為 A 的 j-th column 寫成 row vector. 我們將 以上的討論寫成以下的結論.

Lemma 2.2.3. 假設 A = [ai j]∈ Mm×n 且 At= [as k]∈ Mn×m. 則對於 1≤ s ≤ n, 1 ≤ k ≤ m, as k= ak s 且 At 的 s-th row 就是將 A 的 s-th column 寫成 row vector.

由 Lemma 2.2.3, 以後要談論 A 和 At 間的關係, 我們可以用 row 換成 column, column 換成 row 以及 (i, j)-th entry 換成 ( j, i)-th entry 三種看法處理. 現在我們來看矩陣取 transpose 的基本性質.

Proposition 2.2.4. 假設 A, B 為 m× n matrix, C 為 n × l matrix. 我們有以下之性質.

(11)

(1) (At)t= A.

(2) (A + B)t= At+ Bt. (3) (AC)t= CtAt.

Proof. 首先觀察 At 為 n× m matrix, 故 (At)t 為 m× n matrix, 與 A 階數相同. 同樣的, At+ Bt 為 n× m matrix 與 (A + B)t 的階數相同. 另一方面 Ct 為 l× n matrix, 故 CtAtl× m matrix. 而 AC 為 m × l matrix, 所以 (AC)t 為 l× m matrix 與 CtAt 階數相同.

(1) 因 (At)t 與 A 皆為 m× n matrix, 對於 1 ≤ i ≤ n, 我們只要檢查 (At)t 的 i-th column 就是 A 的 i-th column. 然而 (At)t 的 i-th column 依定義知就是 At 的 i-th row 寫成 column vector, 而 At 的 i-th row 依 Lemma 2.2.3 就是 A 的 i-th column. 故得證 (At)t= A.

(2) 因 At+ Bt 與 (A + B)t皆為 n×m matrix, 對於 1 ≤ i ≤ m, 我們只要檢查 At+ Bt 的 i-th column 就是 (A + B)t 的 i-th column. 依定義 At+ Bt 的 i-th column 就是 At 和 Bt 的 i-th column 之和. 依 transpose 定義知它就是 A 和 B 的 i-th row 之和. 另一方面, (A + B)ti-th column 就是 A + B 的 i-th row, 也就是 A 和 B 的 i-th row 之和. 得證 (A + B)t= At+ Bt. (3) 由於 (AC)t 的 column 是由 AC 的 row 所決定, 而我們尚未討論 A 和 C 相乘 row 之間的關係, 所以這裡我們利用 entry 相同來證明相等. 我們將這些矩陣分別用 A = [ai j], At= [aji], C = [csk], Ct= [cks]表示. 對於 1≤ t ≤ l, 1 ≤ i ≤ m, (AC)t 的 (k, i)-th entry 為 AC 的 (i, k)-th entry, 由式子 (2.13) 知應為

ai1c1k+ ai2c2k+··· + aincnk. 另一方面, CtAt 的 (k, i)-th entry 為

ck1a1i+ ck2a2i··· + cknani. 利用 Lemma 2.2.3 知此即為

c1kai1+ c2kai2··· + cnkain.

故得證 (AC)t= CtAt. 

Question 2.8. 假設 A 為 m× n matrix, r ∈ R. 試證明 (rA)t= rAt.

一個 n× n square matrix, 若滿足 At= A, 我們稱 A 為 symmetric matrix. 上一節介紹過 的 diagonal matrix 就是 symmetric matrix. 以後我們會學到 symmetric matrix 的重要性 質, 現在我們先看和 symmetric matrix 有關的幾個簡單情形.

Corollary 2.2.5. 假設 A 為 n× n square matrix, B 為 m × n matrix. 以下皆為 symmetric matrix.

A + At, BBt, BtB.

Proof. 由 Proposition 2.2.4, 我們有 (A + At)t= At+ (At)t= At+ A, 故知 A + At 為 symmetric matrix. 另一方面, (BBt)t= (Bt)tBt= BBt, 故得 BBt 為 symmetric matrix. 同理可得 BtB 亦

為 symmetric matrix. 

(12)

利用 Proposition 2.2.4, 我們可以從 row 的角度處理矩陣的乘法. 首先我們看一個 1× m matrix 乘上一個 m× n matrix 的情形. 假設 A ∈ M1×m, B∈ Mm×n, 令

A =[

a1 a2 ··· am

], B =





b1 1 b1 2 ··· b1 n

b2 1 b2 2 ··· b2 n

... ... ··· ... bm 1 bm 2 ··· bm n



.

則由 (AB)t= BtAt, 以及矩陣右邊乘 column vector 的定義得

(AB)t=





b1 1 b2 1 ··· bm 1

b1 2 b2 2 ··· bm 2

... ... ··· ... b1 n b2 n ··· bm n







 a1 a2

... am



= a1



 b1 1 b1 2

... b1 n



+ a2



 b2 1 b2 2

... b2 n



+··· + am



 bm 1 bm 2

... bm n



.

亦即 (AB)t= a1(1b)t+ a2(2b)t+··· + am(mb)t, 這裡 (ib)t 指的是將 B 的 i-th row 取轉置 (寫 成 column 的形式). 故利用 Proposition 2.2.4 將 (AB)t 再取轉置還原得

AB = a1(1b) + a2(2b) +··· + am(mb).

也就是說

[a1 ··· am

]



b1 1 ··· b1 n

... ··· ... bm 1 ··· bm n

 = a1

[b1 1 ··· b1 n

]+··· + am

[bm 1 ··· bm n

] (2.14)

現在我們來看一般的情形, 設 A = [ai j]為 m×n matrix 以及 B = [bjk]為 n×l matrix. 考 慮 (AB)t= BtAt. 依定義 BtAt 的 i-th column, 為 Bt 右邊乘上 At 的 i-th column. 然而 Ati-th column, 為 A 的 i-th row 取轉置, 即 (ia)t. 也就是說 (AB)t 的 i-th column 為 Bt(ia)t. 利 用 Proposition 2.2.4 再取轉置還原得, AB 的 i-th row 為

(Bt(ia)t)t= ((ia)t)t(Bt)t=iaB.

換言之, 我們有以下的圖示

AB =





1a —

2a — ...

ma —



B =





1a B

2a B — ...

ma B



. (2.15)

結合式子 (2.14), 我們有以下之結果.

Proposition 2.2.6. 設 A = [ai j] 為 m× n matrix 以及 B = [bjk] 為 n× l matrix, 則對於 1≤ i ≤ m, AB 的 i-th row 為

ia B =[

ai 1 ··· ai n

]



b1 1 ··· b1 l

... ··· ... bn 1 ··· bn l

 = ai 1[

b1 1 ··· b1 l

]+··· + ai n

[bn 1 ··· bn l

].

(13)

2.3. Elementary Matrix

前面提過, 我們將聯立方乘式用矩陣 Ax = b 來表示, 是想利用矩陣的乘法來處理聯立方程 式. 事實上 elementary row operation 已可以看成是矩陣的乘法運算. 首先考慮 n× n 的單 位矩陣 In (即 In 的對角線位置皆為 1, 其他位置為 0). 若用 i-th row 和 j-th row 交換的 type 1 elementary row operation 將 In 轉換成矩陣 E1, 可得

E1=











 1

. ..

0 1

. ..

1 0

. ..

1













. (2.16)

同樣的若使用 type 2 elementary row operation 將 In 的 i-th row 乘上非零實數 r 轉換成矩 陣 E2, 可得

E2=











 1

. ..

1 r

1 . ..

1











. (2.17)

最後若使用 type 3 elementary row operation 將 In 的 i-th row 乘上實數 r 加到 Im 的 j-th row 所得的矩陣為 E3, 可得

E3=











 1

. ..

1 . ..

r 1

. ..

1













. (2.18)

這樣的矩陣我們稱之為 elementary matrix. 而我們分別稱 E1, E2, E3 為 type 1, type 2 以及 type 3 的 elementary matrix.

我們知道矩陣 A 左邊乘上另一矩陣 E, 可以視為 E 的 row 對矩陣 A 的作用. 設 A = [ai j] 為 m× n matrix. 首先觀察 identity matrix Im對 A 的作用. 由於 Im 的 i-th row 為

[0 ··· 1 ··· 0] ˆi

即 i-th entry 為 1, 其他 entry 皆為 0. 所以依 Proposition 2.2.6, ImA 的 i-th row 為 [ 0 ··· 1 ··· 0 ]

A = 01a +··· + 1ia +··· + 0ma =ia,

(14)

(就是將 1 乘上 A 的 i-th row, 而將 0 乘上 A 的其他 row 再加起來, 故為 A 的 i-th row.) 換 言之, 將 Im 乘在 A 的左邊, 會將 A 的每一個 row 都固定不變, 所以知 ImA = A. 現若 j̸= i 且 E 為將 Im 的 i-th row 改為 j-th entry 為 1 其他 entry 為 0, 而 i-th row 以外的其他 row 不變. 從上面的看法知 EA 的 i-th row 會是 A 的 j-th row, 也就是說 EA 會是將 A 的 i-th row 換成 A 的 j-th row, 而其他的 row 不動的矩陣.

現若用 i-th row 和 j-th row 交換的 type 1 elementary row operation 將 Im 轉換成矩陣 E, 則利用前述的說法, EA 的 i-th row 是 A 的 j-th row, 而 EA 的 j-th row 是 A 的 i-th row, 而其他的 row 都不變. 換言之, EA 就是將 A 利用 i-th row 和 j-th row 交換這樣的 type 1 elementary row operation 變換所得的矩陣.

同樣的若將 Im的 i-th row 乘上非零實數 r 所得的 type 2 elementary matrix 為 E, 則很 容易看出 EA 的 i-th row 就是將 A 的 i-th row 乘上 r, 而其餘的 row 不變. 也就是說, EA 就是將 A 的 i-th row 乘上非零實數 r 這樣的 type 2 elementary row operation 變換所得的 矩陣.

最後若將 Im 的 i-th row 乘上實數 r 加到 Im 的 j-th row 所得的 type 3 elementary matrix 為 E, 則因 E 的 j-th row 的 i-th entry 為 r, j-th entry 為 1. 故由 Proposition 2.2.6, EA 的 j-th row 就是將 r 乘上 A 的 i-th row 後再加上 A 的 j-th row, 而其他的 row 都不變.

換言之, EA 就是將 A 的 i-th row 乘上實數 r 加到 A 的 j-th row 這樣的 type 3 elementary row operation 變換所得的矩陣.

從上面的說明我們知道, 對一個 m× n matrix 做一個 elementary row operation, 事實上 就是將此矩陣左邊乘上相對應的 elementary matrix. (2.16), (2.17), (2.18) 就是 elementary matrix 的三種形式.

當我們對一個 m× n matrix A, 進行多次的 elementary row operations, 就是將 A 左邊 逐次的乘上相對應的 elementary matrix. 比方說做兩次 elementary row operations, 就是 將 A 的左邊乘上第一次 elementary row operation 所對應的 elementary matrix E1. 做第二 次時就是將 E1A 左邊再乘上第二次 elementary row operation 所對應的 elementary matrix E2. 故所得的矩陣 E2(E1A) 就是將 A 做這兩次 elementary row operations 所得的矩陣. 又 由於矩陣乘法的結合律, 我們又可以將 E2(E1A) 寫成 (E2E1)A. 同理, 對一個矩陣 A 進行 一連串的 elementary row operations, 就是將 A 左邊乘上一個矩陣, 而這個矩陣就是這一 連串 elementary row operations 所對應的 elementary matrices 的乘積. 不過要注意, 這些 elementary matrices 乘在一起的順序很重要, 因為 elementary matrices 之間的乘法不一定 可以交換.

Question 2.9. 試找出那些同階的 elementary matrices 其相乘是不可以交換的.

Example 2.3.1. 考慮 Example 1.1.1 的情形. A 是 3×4 matrix 且 B 是將 A 的第一個 row 和第二個 row 交換所得. 考慮將 I3 的第一個 row 和第二個 row 交換所得的 elementary

(15)

matrix

E1=

0 1 0 1 0 0 0 0 1

.

可得

E1A =

0 1 0 1 0 0 0 0 1

1 2 3 4 2 1 −1 3 4 0 1 2

 =

2 1 −1 3 1 2 3 4 4 0 1 2

 = B.

同樣的 C 是由 B 的第二個 row 乘上 2 所得, 所以我們考慮將 I3 的第二個 row 乘上 2 所得 的 elementary matrix

E2=

1 0 0 0 2 0 0 0 1

.

可得

E2B =

1 0 0 0 2 0 0 0 1

2 1 −1 3 1 2 3 4 4 0 1 2

 =

2 1 −1 3 2 4 6 8 4 0 1 2

 = C.

最後 D 是將 C 的第三個 row 乘上 −3 加到第一個 row, 所以我們考慮將 I3 的第三個 row 乘上−3 加到第一個 row 所得的 elementary matrix

E3=

1 0 −3 0 1 0 0 0 1

.

可得

E3C =

1 0 −3 0 1 0 0 0 1

2 1 −1 3 2 4 6 8 4 0 1 2

 =

−10 1 −4 −3 2 4 6 8 4 0 1 2

 = D.

上面所提這種將一個矩陣做 elementary row operation 可視為將此矩陣左邊乘上其對應 的 elementary matrix 的看法, 將來對我們探討矩陣的性質是很有幫助的. 這種看法的互換, 也時能讓我們得到有趣的結果. 例如前面提過一個矩陣經由一個 elementary row operation 轉變成另一個矩陣後, 我們可以再用相同 type 的 elementary row operation 將其轉換回原 來的矩陣. 這個事實用 elementary matrices 的角度來看, 可以有以下的看法:

(1) 設 E1 是將 Im 的 i-th row 和 j-th row 互換的 type 1 elementary matrix. 我們 將 E1 的 i-th row 和 j-th row 再互換就可轉換回 identity matrix Im. 所以我們有 E1E1= Im.

(2) 設 E2 是將 Im的 i-th row 乘上非零實數 r 的 type 2 elementary matrix. 我們將 E2 的 i-th row 乘上 r−1 就可轉換回 Im. 所以若令 E2 為將 Im 的 i-th row 乘上 r−1type 2 elementary matrix, 我們有 E2E2= Im. 同理可得 E2E2 = Im.

(3) 設 E3是將 Im的 i-th row 乘上實數 r 加到 j-th row 所得的矩陣的 type 3 elementary matrix. 我們將 E3 的 i-th row 乘上 −r 再加到 j-th row 就可轉換回 Im. 所以若令 E3 為將 Im的 i-th row 乘上−r 的 type 3 elementary matrix, 我們有 E3E3= Im. 同 理可得 E3E3 = Im.

(16)

我們知道當一個 m× m 的矩陣 A 若可找到矩陣 B 使得 BA = AB = Im, 則稱 A 為一個 invertible matrix (可逆矩陣), 且 B 為 A 的 inverse (反矩陣). 從上面的探討我們有以下之結 論.

Proposition 2.3.2. 假設 E 是一個 elementary matrix, 則 E 為 invertible 且 E 的 inverse 是和 E 相同 type 的 elementary matrix.

既然有所謂的 elementary row operations 當然也會有 elementary column operations. 它 的概念只是將 row operation 對 row 的動作改為對 column 的動作. 我們將一個矩陣的 i-th column 和 j-th column 對調, 這一個動作及稱為 type 1 的 elementary column operation.

若將矩陣的 i-th column 上的數皆乘上非零實數 r, 則稱 type 2 的 elementary column operation. 至於 type 3 的 elementary column operation 就是把矩陣的 i-th column 乘上 r 後加到其 j-th column. 由於 column operations 並未用在解聯立方乘組的問題, 所以這裡 我們僅約略介紹其相關的概念, 不再像前面依樣詳述. 事實上 column operations 的概念和 row operations 是相呼應的, 大家可以用前面探討的方式檢驗.

將 identity matrix Im做 elementary column operation 後會得到甚麼樣的矩陣呢? 結果 也會是前面提到的 elementary matrix (這也是 elementary matrix 沒有區分 row 和 column 的原因). 例如將 Im 的 i-th column 和 j-th column 互換所得的矩陣就是將 Im 的 i-th row 和 j-th row 互換的 type 1 elementary matrix. 而將 Im 的 i-th column 乘上非零實數 r 的矩 陣, 就是將 Im 的 i-th row 乘上 r 的 type 2 elementary matrix. 不過要注意, 將 Im 的 i-th column 乘上實數 r 加到 j-column 所得的矩陣不是將 Im 的 i-th row 乘上實數 r 加到 j-th row 所得的 elementary matrix, 而是將 Im 的 j-th row 乘上實數 r 加到 i-th row 所得的矩 陣的 type 3 elementary matrix. 這一部分請務必檢驗, 就能了解其中原因.

既 然 一 個 elementary matrix 同 時 可 對 應 到 elementary row operation 也 可 對 應 到 elementary column operation, 那要如何區分呢? 別忘了, 矩陣的乘法是沒有交換性的. 前面 我們知道, 當一個 elementary matrix E 乘在一個矩陣 A 的左邊時, 所得的矩陣 EA 會是對 A 做 E 所對應的 elementary row operation. 而若將 E 乘在矩陣 B 的右邊, 則所得的矩陣 BE 會是對 B 做 E 所對應的 elementary column operation. 為了方便起見, 我們綜合成以下 的結論.

Theorem 2.3.3. 假設 A 是一個 m× n matrix. 若 E 是對 Im 做 elementary row operation 所得的 elementary matrix, 則 EA 就會是對 A 作相對應的 elementary row operation 所得 的矩陣. 若 E 是對 In 做 elementary column operation 所得的 elementary matrix, 則 AE 就會是對 A 作相對應的 elementary column operation 所得的矩陣.

Example 2.3.4. 考慮

E1=

 1 0 0 0 0 1 0 1 0

, E2=

 10 0 0 0 1 0 0 0 1

, E3=

 1 0 10 0 1 0 0 0 1

, A =

 1 2 3

−1 −2 −3 11 22 33

(17)

E1可視為將 I3 的 2-nd row 和 3-rd row 交換, 也可視為將 I3 的 2-nd column 和 3-rd column 交換. 事實上我們有

E1A =

 1 0 0 0 0 1 0 1 0

 1 2 3

−1 −2 −3 11 22 33

 =

 1 2 3 11 22 33

−1 −2 −3

,

AE1=

 1 2 3

−1 −2 −3 11 22 33

 1 0 0 0 0 1 0 1 0

 =

 1 3 2

−1 −3 −2 11 33 22

.

E2 可視為將 I3 的 1-st row 乘以 10, 也可視為將 I3 的 1-st column 乘以 10. 事實上我們有

E2A =

 10 0 0 0 1 0 0 0 1

 1 2 3

−1 −2 −3 11 22 33

 =

 10 20 30

−1 −2 −3 11 22 33

,

AE2=

 1 2 3

−1 −2 −3 11 22 33

 10 0 0 0 1 0 0 0 1

 =

 10 2 3

−10 −2 −3 110 22 33

.

E3 可視為將 I3 的 3-rd row 乘以 10 加到 1-st row, 也可視為將 I3 的 1-st column 乘以 10 加 到 3-rd column. 事實上我們有

E3A =

 1 0 10 0 1 0 0 0 1

 1 2 3

−1 −2 −3 11 22 33

 =

 111 222 333

−1 −2 −3 11 22 33

,

AE1=

 1 2 3

−1 −2 −3 11 22 33

 1 0 10 0 1 0 0 0 1

 =

 1 2 13

−1 −2 −13 11 22 143

.

這裡我們再說明一下, 當 A 是一個 m× n matrix, 因為 A 有 m 個 row, 所以乘在左邊 的 elementary matrix (對應到 elementary row operation) 必須是一個 m 階方陣. 同樣的, 因為 A 有 n 個 column, 所以乘在右邊的 elementary matrix (對應到 elementary column operation) 必須是一個 n 階方陣.

有時我們需知道一個矩陣經由一連串的 elementary row operations, 其左邊到底是乘 上哪一個矩陣. 當然我們可以如前述將所對應的 elementary matrices 乘在一起即可, 但 這樣做其實很麻煩費時. 接下來我們來看一個很 “clever” 的方法, 可以在做 elementary row operation 時便幫我們將這個矩陣記錄下來. 這個方法就是, 若要對一個 m× n matrix A 做 elementary row operations, 我們先寫下一個 augmented matrix [A|Im]. 也就是一個 m× (n + m) 的增廣矩陣, 其左邊 n 個 columns (即前 n 個 columns) 為矩陣 A, 而右邊 m 個 columns (即後 m 個 column) 為 Im. 現將 A 做第一次的 elementary row operation, 假設其 對應的 elementary matrix 為 E1, 則 A 被轉換為 E1A. 現若對 [A|Im] 做相同的 elementary row operation 的話, 所得的結果會是 E1[A|Im]. 然而此時原先 A 的部分會變成 E1A, 而 Im部分經同樣的 elementary row operation, 所以 Im這部分會是 E1Im. 因此我們知

E1[A|Im] = [E1A|E1Im] = [E1A|E1].

(18)

也 就 是 說, 當 我 們 對 [A|Im] 做 同 樣 的 elementary row operation, 所 得 的 增 廣 矩 陣 其 左 邊就是將 A 做此 elementary row operation 所得的矩陣, 而右邊就是此 elementary row operation 所對應的 elementary matrix. 接著當我們做下一個 elementary row operation, 假 設此 elementary row operation 所對應的 elementary matrix 為 E2, 則此 elementary row operation 對 [E1A|E1] 作用後所得的矩陣便是 E2[E1A|E1] = [E2(E1A)|E2E1]. 這樣繼續下去, 當我們對增廣矩陣 [A|Im]進行一連串的 elementary row operations 後, 所得的矩陣 [A|E], 其左邊 A 就是 A 經由這一連串的 elementary row operations 作用後所得的矩陣, 而右邊的 E 就是這些 elementary row operations 所對應的 elementary matrices 依序從右到左相乘所 得的結果, 因此 EA = A. 我們有以下的結論.

Lemma 2.3.5. 假設 A 為 m× n matrix. 若將 A 經由一連串的 elementary row operations 轉換成 A, 則存在一個 m× m matrix E 使得 EA = A, 其中 E 為這一連串 elementary row operations 所對應的 elementary matrix 由右而左依序相乘的乘積. 事實上若將 augmented matrix [A|Im] 經由同樣的 elementary row operations 作用後, 所得的 augmented matrix 就 是 [A|E].

Example 2.3.6. 將矩陣

A =

 2 −4 4 −6 1 −2 1 −1 4 −8 4 −4

化為 reduced echelon form, 並找到 elementary matrices 的乘積 E 使得 EA 為此 reduced echelon form.

首先寫下 augmented matrix [A|I3] =

 2 −4 4 −6 1 0 0 1 −2 1 −1 0 1 0 4 −8 4 −4 0 0 1

並將此 augmented matrix 的 1-st 和 2-nd row 交換, 得

 1 −2 1 −1 0 1 0 2 −4 4 −6 1 0 0 4 −8 4 −4 0 0 1

接著我們將 augmented matrix 的 1-st row 乘上−2 加到 2-nd row 上, 得

 1 −2 1 −1 0 1 0 0 0 2 −4 1 −2 0 4 −8 4 −4 0 0 1

.

然後將 augmented matrix 的 1-st row 乘上−4 加到 3-rd row 得

 1 −2 1 −1 0 1 0 0 0 2 −4 1 −2 0 0 0 0 0 0 −4 1

.

繼續將 augmented matrix 的 2-nd row 乘上 1/2 得

 1 −2 1 −1 0 1 0 0 0 1 −2 12 −1 0 0 0 0 0 0 −4 1

.

(19)

最後將 augmented matrix 的 2-nd row 乘上−1 加到 1-st row 得

 1 −2 0 1 12 2 0 0 0 1 −2 12 −1 0 0 0 0 0 0 −4 1

.

令最後所得的 augmented matrix 為 [A|E], 我們檢查是否 A 的 reduced echelon form A是 EA. 事實上, 我們確有

EA =

12 2 0

1

2 −1 0

0 −4 1

 2 −4 4 −6 1 −2 1 −1 4 −8 4 −4

 =

 1 −2 0 1 0 0 1 −2 0 0 0 0

.

另外我們想確認 E 確為這五個 elementary row operations 所對應的 elementary matrices 的 乘積. 因為 A 為 3× 4 matrix, 所以第一個 elementary row operation 所對應的 elementary matrix E1 就是將 3×3 的 identity matrix I3 的 1-st 和 2-nd row 交換, 而第二個 elementary matrix E2 為將 I3 的 1-st row 乘上 −2 加到 2-nd row 上. 第三個 elementary matrix E3 為 將 I3的 1-st row 乘上−4 加到 3-rd row 上. 接下來的 elementary matrix E4 為將 I3 的 2-nd row 乘上 1/2, 而最後一個 elementary matrix E5為將 I3 的 2-nd row 乘上−1 加到 1-st row 上. 也就是說, 我們有

E1=

 0 1 0 1 0 0 0 0 1

, E2=

 1 0 0

−2 1 0 0 0 1

, E3=

 1 0 0 0 1 0

−4 0 1

,

E4=

 1 0 0 0 12 0 0 0 1

, E5=

 1 −1 0 0 1 0 0 0 1

將這五個 elementary matrices 由右而左依序相乘, 確實得 E5E4E3E2E1=

12 2 0

1

2 −1 0

0 −4 1

 = E.

———————————– 15 October, 2021

參考文獻

相關文件

, A echelon form ( reduced echelon form) pivot column vectors.. elementary row operations column

若我們能知道有 k 個 row 的矩陣一 定能利用 elementary row operations 化為 echelon form 這個事實且利用這個事實證得有 k + 1 個 row 的矩陣一定能利用 elementary row

[r]

[r]

一般來說用 row operation 或 column operation 來求 determinant 較快, 不過若發現有的 row 或 column 僅有一個不是 0 的 entry, 則對該 row 或 column 降階, 也可幫助我們較快算 出

另外它是由 column 來描繪矩陣的乘法, 在證明或 推導有關矩陣乘法性質時, 有時比式子 (2.13) 利用 entry 來看方便多了..

由於 A 為方陣, 其 row 的個數和 column 的個數皆為 n, 此時很自然地可以將 Theorem 3.4.2 和 Theorem 3.4.6 相連結得到 invertible

的矩陣皆可利用 elementary row operations 化為 echelon form, 我們可以利用 elementary row operations 將此矩陣第一個 row 以下的部份化為 echelon form.. 但此時因各個 row 的 leading