2.1. 矩陣的運算

(1)

Matrix

在第一章我們利用矩陣來表示一個聯立方程組, 這種表示法不只有其方便性其實是有另一層的意義. 在這一章中我們將介紹有關矩陣的運算, 利用矩陣的運算我們對聯立方程組將有另一種看法. 利用這新的看法, 我們對聯立方程組的解可以有更進一步的了解.

2.1. 矩陣的運算

在本節中我們將簡單地回顧有關於矩陣的定義. 一般來說一個矩陣是由數個 (橫) 列 (row) 以及 (直) 行 (column) 的數組成. 若一矩陣由 m 個 row 和 n 個 column 的數所組成, 我們 便稱該矩陣為一個 m× n matrix. 特別的, 一個 n × n matrix (即 row 的個數等於 column 的 個數), 我們稱之為 square matrix. 在本講義中, 我們用 M_m_×n 來表示所有係數在 R 的 m × n 矩陣所成的集合. 通常我們會用大寫的英文字母來表示一個矩陣. 例如考慮

A =



 1 0 2 3 0 1 5 8 2 1 1 0



, (2.1)

則 A 為一個 3× 4 matrix, 即 A ∈ M3×4. 當我們要抽象地描述一個矩陣時, 我們也常用 A = [a_{i j}]這樣的方法來描述. 這種表示法意指 A 中在第 i 個 row 和 j 個 column 的位置我 們用 a_{i j} 來表示, 並稱之為此矩陣的 (i, j)-th entry. 因此當我們說 A = [a_{i j}] 為 m× n 矩陣, 這表示 1≤ i ≤ m 且 1 ≤ j ≤ n. 例如對於式子 (2.1) 中的矩陣 A, 若 A = [ai j],則

a_{1 1}= 1, a_{1 2}= 0, a_{1 3}= 2, a_{1 4}= 3, a_{2 1}= 0, a_{2 2}= 1, a_{2 3}= 5, a_{2 4}= 8, a3 1= 2, a3 2= 1, a3 3= 1, a3 4= 0.

另外為了方便起見, 我們也會將矩陣 A 的每一個 row 和 column 用向量的方法來表示, 這些稱為 A 的 row vectors 和 column vectors. 在本講義我們會將矩陣 A = [a_{i j}]第 i 個 row 所成的 row vector 用 _ia 來表示, 而第 j 個 column 所成的 column vector 用 a_j 來表示. 例 如對於式子 (2.1) 中的矩陣 A, 我們有

1a =[

1 0 2 3]

, ₂a =[

0 1 5 8]

, ₃a =[

2 1 1 0]

23

(2)

以及

a₁=



 1 0 2



, a₂=



 0 1 1



, a₃=



 2 5 1



, a₄=



 3 8 0



.

注意由於我們也想將向量看成是一個矩陣, 這裡的 row vectors 和 column vectors 都用矩陣的形式呈現.

我們想給矩陣一個運算, 既然要談運算就會牽涉相等的概念. 所以我們要先定義何謂矩陣的相等.

Definition 2.1.1. 假設 A = [a_{i j}] 為一個 m× n matrix 且 A^′= [a^′_{i j}] 為一個 m^′× n^′ matrix.

我們定義 A = A^′ 若且唯若 m = m^′, n = n^′ 且對所有的 1≤ i ≤ m 以及 1 ≤ j ≤ n 皆有 ai j= a^′_{i j}. 很容易看出矩陣的相等的定義是向量相等的延伸. 在向量中只有同在Rⁿ 的向量我們才談是否相等, 且兩個 Rⁿ 中的向量相等表示這兩個向量在每一個相同位置的數皆相等. 同樣 的只有同在 M_m×n 的矩陣才談是否相等, 且兩個 M_m×n 中的矩陣相等表示這兩個矩陣在每一個相同位置的數皆相等.

我們也延伸向量加法與係數積的定義來定義矩陣的加法與係數積. 也就是說只有同為 Mm×n 的矩陣我們才定義它們之間的加法, 且兩矩陣相加表示將這兩個矩陣在相同位置的數加起來. 而一個實數乘上一個矩陣即為將該矩陣每一個位置上的數乘上該實數. 具體來說我們有以下的定義.

Definition 2.1.2. 假設 A = [a_{i j}], B = [b_{i j}]皆為 m× n matrix. 定義 A + B = [ci j],其中對所有的 1≤ i ≤ m 以及 1 ≤ j ≤ n 皆有 ci j= ai j+ bi j. 對任意實數 r, 我們定義 rA = [di j] 其中對所有的 1≤ i ≤ m 以及 1 ≤ j ≤ n 皆有 di j= ra_{i j}.

Definition 2.1.2 告訴我們若

A =







a1 1 a1 2 ··· a1 n

a2 1 a2 2 ··· a2 n

... ... . .. ... am 1 am 2 ··· am n





, B =







b1 1 b1 2 ··· b1 n

b2 1 b2 2 ··· b2 n

... ... . .. ... bm 1 bm 2 ··· bm n







則

A + B =







a1 1+ b1 1 a1 2+ b1 2 ··· a1 n+ b1 n

a_{2 1}+ b_{2 1} a_{2 2}+ b_{2 2} ··· a2 n+ b_{2 n} ... ... . .. ... am 1+ bm 1 am 2+ bm 2 ··· am n+ bm n







且

rA =







ra_{1 1} ra_{1 2} ··· ra1 n

ra_{2 1} ra_{2 2} ··· ra2 n

... ... . .. ... ra_{m 1} ra_{m 2} ··· ram n







矩陣的加法與係數積的定義可以說是由大家熟悉的R²,R³ 的向量（甚至Rⁿ）的加法與係數積延伸而來, 我們有以下這些性質.

(3)

Proposition 2.1.3. 對於 M_m×n 上的矩陣, 我們有以下的性質:

(1) 對任意 A, B∈ Mm×n, 皆有 A + B = B + A.

(2) 對任意 A, B,C∈ Mm×n, 皆有 (A + B) +C = A + (B +C).

(3) 存在一矩陣 O∈ Mm×n 滿足對任意 A∈ Mm×n 皆有 O + A = A.

(4) 對任意 A∈ Mm×n 皆可找到 A^′∈ Mm×n 滿足 A + A^′= O.

(5) 對任意 r, s∈ R 以及 A ∈ Mm×n, 皆有 r(sA) = (rs)A.

(6) 對任意 r, s∈ R 以及 A ∈ Mm×n, 皆有 (r + s)A = rA + sA.

(7) 對任意 r∈ R 以及 A,B ∈ Mm×n 皆有 r(A + B) = rA + rB.

(8) 對任意 A∈ Mm×n, 皆有 1A = A.

Proposition 2.1.3 的證明用到實數 R 相對應的性質. 例如 (1) 談的是矩陣加法的交換性質, 用到的是R 的加法交換性. 事實上若令 A = [ai j], B = [bi j]以及 A + B = [c_{i j}], B + A = [di j].

依定義, 我們有 c_{i j}= a_{i j}+ b_{i j}以及 d_{i j}= b_{i j}+ a_{i j}. 由於實數的加法交換性 a_{i j}+ b_{i j}= b_{i j}+ a_{i j}, 因此得 c_{i j}= d_{i j}, 故依矩陣相等的定義，得證 A + B = B + A. 其他各項都可用一樣的方法 證明, 這裡就不證明了. 不過 (3), (4) 談的是存在性的問題. 這類問題就必須說明存在的是 什麼. 例如 O 就是零矩陣，也就是說 O = [c_{i j}] 其中 c_{i j}= 0, ∀i j. 而 (4) 的 A^′ 稱為 A 的 加法反元素, 它是跟著 A 而變的. 如果 A = [a_{i j}]則令 A^′= [a^′_{i j}]其中 a^′_{i j}=−ai j, 就會滿足 A + A^′= O 了. 一般來說, 給定 A 我們會將 A 的加法反元素用−A 來表示.

接著我們定義矩陣間的乘法. 首先回顧當我們要解聯立方程組 x1 +2x2 = 1

−x1 +1x₂ = 2 2x₁ −2x2 = 3 我們會把它寫成



 1 2

−1 1 2 −2



[ x₁ x2

]

=



1 2 3



.

所以若我們定義矩陣



 1 2

−1 1 2 −2



 和[ x₁ x₂ ]

的乘法為



 1 2

−1 1 2 −2



[ x₁ x2

]

= x₁



 1

−1 2



 + x₂



 2 1

−2





那麼聯立方程組與矩陣的關係就不只是為了列式方便而已, 聯立方程組和矩陣的運算產生了緊密的關係.

從這個角度出發, 我們有以下定義.

(4)

Definition 2.1.4. 設 A = [a_{i j}] 為 m× n matrix 以及 b = [bj] 為 n× 1 matrix (即 Rⁿ 中的 column vector). 若 ai 表示 A 的 i-th column 則定義

Ab =







a1 1 a1 2 ··· a1 n

a2 1 a2 2 ··· a2 n

... ... . .. ... am 1 am 2 ··· am n











 b1

b2

... bn





=



 a ₁ a₂ ··· an









 b1

b2

... bn





= b₁a₁+ b₂a₂+··· + bna_n.

注意依此定義, 必需 A∈ Mm×n 的 column 的個數 n 等於 b∈ Mn×1的 row 的個數 n, 才能 定義 Ab 且此時 Ab 會是 m× 1 matrix (即 R^m中的 column vector). 觀察此 column vector, 我們有

Ab = b1





 a₁₁ a21

... a_m1





+ b2





 a₁₂ a22

... a_m2





+··· + bn





 a_1n a2n

... a_mn





=







b₁a₁₁+ b₂a₁₂+··· + bna_1n b1a21+ b₂a22+··· + bna2n

...

b₁a_m1+ b₂a_m2+··· + bna_mn





. (2.2)

特別的, 當 a =[

a1 a2 ··· an

]為 1×n matrix 而 b =





 b₁ b2

... b_n





為 n×1 matrix, 依 Definition

2.1.4 的矩陣乘法定義

a b =[

a1 a2 ··· an

]





 b₁ b2

... b_n





= b1a1+ b2a2+··· + bnan. (2.3)

(注意, 若 a, b 是Rⁿ 中的向量, 則 ab 就是我們熟悉 a, b 的內積 ⟨a,b⟩.) 依此看法, 由式子 (2.2), 我們可將 Ab 寫成

Ab =







1a b

2a b ...

ma b





. (2.4)

也就是說 Ab 這一個 m×1 matrix 的 i-th entry 為ia b 也就是 A 的 i-th row_ia 和 b 的內積.

我們來看一個 m×n matrix 以及 Rⁿ 的 column vector 在此乘法的定義之下的基本性質.

Lemma 2.1.5. 假設 A = [a_{i j}], A^′= [a^′_{i j}]為 m× n matrices 以及 b = [bj], b^′= [b^′_j]為 Rⁿ 中 的 column vectors (即 n× 1 matrices) 以及 c ∈ R. 我們有以下的性質.

(1) A(b + b^′) = Ab + Ab^′. (2) A(cb) = c(Ab) = (cA)b.

(3) (A + A^′)b = Ab + A^′b.

Proof. 令 A 的 column vectors 依次為 a₁, . . . , a_n 且 A^′ 的 column vectors 依次為 a^′₁, . . . , a^′_n.

(5)

(1) 依定義

A(b + b^′) =



 a₁ ··· an







 b1+ b^′₁

... bn+ b^′_n



 = (b1+ b^′₁)a₁+··· + (bn+ b^′_n)a_n. (2.5)

而 Ab + Ab^′ 為



 a₁ ··· an







 b1

... bn



 +



 a₁ ··· an







 b^′₁

... b^′_n



 = (b1a₁+··· + bna_n) + (b^′₁a₁+··· + b^′na_n). (2.6)

由矩陣加法和係數積的分配律 (Proposition 2.1.3 的性質 (7),(8)), 我們得證式子 (2.5) 和式子 (2.6) 相等.

(2) 依定義 c(Ab) 為

c (

 a₁ ··· an







 b1

... b_n



)

= c(b1a₁+ b2a₂+··· + bna_n). (2.7)

而 cA 的 column vectors 依次為 ca₁, . . . , ca_n. 故 (cA)b 為



 ca₁ ··· can







 b1

... bn



 = b¹(ca₁) +··· + bn(ca_n). (2.8)

最後依定義 cb 為



 cb1

... cb_n



, 故 A(cb) 為



 a₁ ··· an







 cb₁

... cbn



 = (cb¹)a₁+··· + (cbn)a_n. (2.9)

由矩陣加法和係數積的結合律 (Proposition 2.1.3 的性質 (6)), 我們得證 (2.7), (2.8), (2.9) 三個式子皆相等.

(3) 依定義 A + A^′ 的 column vectors 依次為 a₁+ a^′₁, . . . , a_n+ a^′_n, 所以

(A + A^′)b =





a₁+ a^′₁ ··· an+ a^′_n







 b₁

... b_n



 = b¹(a1+ a^′₁) +··· + bn(an+ a^′_n). (2.10)

另一方面, Ab + A^′b 為



 a₁ ··· an







 b₁

... bn



 +



 a^′₁ ··· a^′_n







 b₁

... bn



 = (b¹a₁+··· + bna_n) + (b₁a^′₁+··· + bna^′_n). (2.11)

再次由矩陣加法和係數積的分配律, 我們得證式子 (2.10) 和式子 (2.11) 相等. Lemma 2.1.5 (1),(2) 告訴我們矩陣對向量的乘法有類似分配律的性質, 這個性質很重要 (以後我們會再提到並稱之為 linear 的性質), 我們特別用以下定理表示.

(6)

Proposition 2.1.6. 假設 A∈ Mm×n, 且 b, b^′ 為 Rⁿ 中的 column vectors, 以及 c, c^′∈ R. 則 A(cb + c^′b^′) = c(Ab) + c^′(Ab^′).

Proof. 因 cb, cb^′ 皆為 Rⁿ 中的 column vectors, 由 Lemma 2.1.5 (1) 知 A(cb + c^′b^′) = A(cb) + A(c^′b^′). 再由 Lemma 2.1.5 (2) 知 A(cb) = c(Ab), A(c^′b^′) = c^′(Ab^′), 故得證本定

理.

Question 2.1. 假設 A∈ Mm×n, 且 b₁, . . . , b_k 為 Rⁿ 中的 column vectors, c₁, . . . , c_k∈ R. 試 利用數學歸納法證明

A( ^k

i=1

∑

cib_i)

=

∑

k i=1

ci(Abi).

Question 2.2. 假設 A, A^′∈ Mm×n, 且 b 為 Rⁿ 中的 column vectors, 以及 c, c^′∈ R. 是否 (cA + c^′A^′)b = c(Ab) + c^′(A^′b) ?

現在我們將矩陣乘法推廣到更一般的情況, 當 A = [a_{i j}] 是一個 m× n matrix, B = [bj k] 是一個 n× l matrix. 由於對 B 的每一個 column vector bk∈ Mn×1, 1≤ k ≤ l, 我們已定義了 Abk 為何, 現在我們定義 AB 為 m× l matrix, 其中 AB 的 k-th column vector 為 Abk. 我們大致上有以下的圖示.

A



 b ₁ b₂ ··· bl



 =



 Ab₁ Ab₂ ··· Abl





由於 Ab_k 為 m× 1 matrix, 依此定義確實 AB 為 m × l matrix. 現在我們來看正式的定義.

Definition 2.1.7. 設 A = [ai j] 為 m× n matrix 以及 B = [bjk] 為 n× l matrix, 則定義 AB = C = [c_ik]為 m× l matrix, 其中對於 1 ≤ k ≤ l, C 的 k-th column ck 為

c_k= Ab_k=







a_{1 1} a_{1 2} ··· a1 n

a2 1 a2 2 ··· a2 n

... ... . .. ... am 1 am 2 ··· am n











 b_{1 k} b2 k

... bn k





= b_{1 k}a₁+ b_{2 k}a₂+··· + bn ka_n. (2.12)

由此定義, 我們知對於 1≤ i ≤ m, 1 ≤ k ≤ l, AB 的 (i,k)-th entry 應為其 k-th column (即 Abk) 從上往下算的第 i 個 entry. 由式子 (2.4) 我們知此即 A 的 i-th row ia 和 B 的 k-th column b_k 看成向量後取內積. 換言之, 若 AB = [c_{i k}], 則 AB 的 (i, k)-th entry c_{i k} 為

ci k=_ia b_k= a_{i 1}b1 k+ a_{i 2}b2 k+··· + ai nbn k=

∑

n j=1

ai jbj k. (2.13) 再次強調一次, 並不是任取兩個矩陣都可以定義乘法, 必須是左邊矩陣的 column 個數和右邊矩陣的 row 個數相同才能相乘.

Example 2.1.8. 令

A =



−2 4 3 6 2 2



,B =[

4 −1 2 5 3 0 1 1 ]

(7)

考慮矩陣乘法 AB. 依定義矩陣 AB 的 3-rd column 為 Ab3=



−2 4 3 6 2 2



[ 2 1 ]

= 2a1+ 1a2= 2



−2 3 2



 + 1



4 6 2



 =



0 12

6



.

所以 AB 的 (2, 3) entry 為 12 等於 A 的 2-nd row 和 B 的 3-rd column 看成R² 中的向量所 得的內積, 即 (3, 6)· (2,1) = 12. 事實上我們有

AB =



−2 4 3 6 2 2



[

4 −1 2 5 3 0 1 1 ]

=



4 2 0 −6 30 −3 12 21 14 −2 6 12



.

Question 2.3. 設 a, b 為 Rⁿ 上的向量, 若將 a 寫成 row vector 的形式, b 寫成 column vector 的形式, 且將 a, b 看成矩陣, 即 a∈ M1×n(R), b ∈ Mn×1(R). 試問依矩陣乘法定義 ba 應為何種矩陣? 它和 a, b 看成 Rⁿ 上的向量後取內積 ⟨b,a⟩ 有關嗎?

大部分的書都會用式子 (2.13) 當成矩陣乘法的定義. 我們選用式子 (2.12) 的用意, 主要是它較能描繪當初矩陣乘法定義的用意. 另外它是由 column 來描繪矩陣的乘法, 在證明或推導有關矩陣乘法性質時, 有時比式子 (2.13) 利用 entry 來看方便多了. 例如我們有以下的性質.

Proposition 2.1.9. 假設 A, A^′∈ Mm×n, B, B^′∈ Mn×l. 我們有以下的性質.

(1) A(B + B^′) = AB + AB^′. (2) (A + A^′)B = AB + A^′B.

Proof. 首先注意因 A + A^′ 仍為 m× n 矩陣且 B + B^′ 為 n× l 矩陣, 所以這些矩陣的階數 是符合矩陣乘法的規定. 我們假設 B 的 column vectors 依次為 b₁, . . . , b_l 且 B^′ 的 column vectors 依次為 b^′₁, . . . , b^′_l.

(1) 我們證明當 1≤ k ≤ l 時, A(B + B^′) 的 k-th column 會等於 AB + AB^′ 的 k-th column.

依定義 A(B + B^′) 的 k-th column 為 A 的右邊乘上 B + B^′ 的 k-th column. 然而由矩陣加法 定義, B + B^′ 的 k-th column 為 b_k+ b^′_k, 即 B 的 k-th column 加上 B^′ 的 k-th column. 因此我 們有 A(B + B^′) 的 k-th column 為 A(b_k+ b^′_k). 另一方面, AB + AB^′ 的 k-th column 為 AB 的 k-th column Ab_k 加上 AB^′ 的 k-th column Ab^′_k, 因此 AB + AB^′ 的 k-th column 為 Ab_k+ Ab^′_k. 由 Lemma 2.1.5 (1), 我們得證它們相等.

(2) 我們證明當 1≤ k ≤ l 時, (A + A^′)B 的 k-th column 會等於 AB + A^′B 的 k-th column.

依定義 (A + A^′)B 的 k-th column 為 A + A^′ 的右邊乘上 B 的 k-th column, 即 (A + A^′)b_k. 另一 方面, AB + A^′B 的 k-th column 為 AB 的 k-th column Abk 加上 A^′B 的 k-th column A^′b_k, 因 此 AB + A^′B 的 k-th column 為 Ab_k+ A^′b_k. 因此由 Lemma 2.1.5 (3), 我們得證它們相等.

矩陣乘法和 scalar multiplication (係數積) 也有以下關係 Proposition 2.1.10. 設 c∈ R, A ∈ Mm×n, B∈ Mn×l. 則

c(AB) = (cA)B = A(cB).

(8)

Proof. 假設 B 的 column vectors 依次為 b₁, . . . , b_l. 首先注意 c(AB), (cA)B 和 A(cB) 皆為 m× l matrix, 我們僅要證明當 1 ≤ k ≤ l 時, c(AB), (cA)B 和 A(cB) 的 k-th column 皆相等.

c(AB) 的 k-th column 為 r 乘上 AB 的 k-th column, 故為 c(Ab_k). 而 (cA)B 的 k-th column 為 cA 右邊乘上 B 的 k-th column, 故為 (cA)b_k. 最後由於 cB 的 k-th column 為 cb_k, 故 A(cB) 的 k-th column 為 A(cbk). 因此由 Lemma 2.1.5 (2), 我們得證它們皆相等. Question 2.4. 假設 A, A^′∈ Mm×n, B, B^′∈ Mn×l 以及 c, c^′∈ R. 可證明 (cA + c^′A)B = cAB + c^′A^′B 以及 A(cB + c^′B^′) = cAB + c^′AB^′ 嗎？

由 Proposition 2.1.9 和 Proposition 2.1.10 的證明我們可以看出, 有些矩陣乘法性質的推導可以簡化成右邊的矩陣是一個 column 的情形處理. 其實利用 row 來看矩陣的乘法也很很有用, 不過這個留待下一節介紹矩陣的 transpose (轉置) 後會更清楚.

利用矩陣乘法定義, 也可推得乘法具有結合律的性質 (即 (AB)C = A(BC)). 這裡要注意 A, B, C 的階數必須要有限制 (AB)C 和 A(BC) 才會有意義.

Proposition 2.1.11. 假設 A∈ Mm×n, B∈ Mn×l,C∈ Ml×k, 則 (AB)C = A(BC).

Proof. 依定義 AB∈ Mm×l, 故 (AB)C∈ Mm×k. 而 BC∈ Mn×k, 故 A(BC)∈ Mm×k 與 (AB)C 同 階.

對於 1≤ j ≤ k, 我們要證明 (AB)C 和 A(BC) 的 j-th column 相等. 令 cj 為 C 的 j-th column 依定義 (AB)C 的 j-th column 為 (AB)cj. 至於 A(BC) 的 j-th column, 依定義為 A 右邊乘上 (BC) 的 j-th column (即 Bc_j). 所以我們僅要說明 (AB)cj= A(Bcj), 就可證得結合律.

由於 c_j 只有一個 column, 為了方便考量, 我們將 c_j 用單一足碼表達, 即令 c_j=



 c₁

... c_l



.

現對任意 i = 1, . . . , l, 令 AB 的 i−th column 為 pi, 則

(AB)c_j=



 p₁ ··· pl







 c₁

... c_l



 = c¹p₁+··· + clp_l.

然而若 b_i 為 B 的 i-th column, 依定義 p_i 為 AB 的 i-th column 故得 p_i= Ab_i. 因此我們得 (AB)c_j= c₁(Ab₁) +··· + cl(Ab_l).

另一方面

A(Bc_j) = A(



 b₁ ··· bl







 c1

... cl



) = A(c1b₁+··· + clb_l).

注意這裡我們將 b_i 視為Rⁿ 中的 column vector, 故套用 Proposition 2.1.6 (或 Question 2.1) 可得 A(c₁b₁+··· + clb_l) = c₁(Ab₁) +··· + cl(Ab_l). 所以得證 (AB)c_j= A(Bc_j).

(9)

有了矩陣乘法的結合律 (Proposition 2.1.11), 以後我們談多個矩陣相乘時, 為了方便起 見, 我們會捨去括號例如直接用 ABC 表示. 特別的, 當 A 為方陣時, 既然 (AA)A = A(AA), 我 們就用 A³ 來表示. 同理, 當 n 個 A 相乘時, 我們就用 Aⁿ 來表示.

最後我們要強調的是矩陣乘法雖具有許多和實數乘法類似的性質, 但它卻沒有交換律.

事實上有可能 A 乘以 B 有定義, 但 B 卻不能乘以 A, 例如 A∈ M2×3, B∈ M3×4 的情形. 也有 可能即使 A 乘以 B 和 B 乘以 A 都有定義, 但由於乘了以後階數不同, 仍會使得 AB̸= BA, 例 如 A∈ M2×3, B∈ M3×2 的情形. 僅有在 A, B 為同階方陣時, 才有可能使得 AB 和 BA 的階數 相同. 但此時仍有可能 AB̸= BA, 例如

A = [a b

c d ]

, B = [1 0

0 −1 ]

, AB =

[a −b c −d ]

, BA =

[ a b

−c −d ]

,

這種情形只有在 b = c = 0 時, 才會使得 AB = BA. 所以在處理矩陣乘法時要特別小心. 例 如當 A, B 為同階方陣時由 Proposition 2.1.9 和 Proposition 2.1.10 可推得 (A− B)(A + B) = A²− AB + BA − B², 但由於可能 AB̸= BA, 我們不見得會有 (A − B)(A + B) = A²− B².

當然了, 仍然有許多方陣會和所有的同階方陣相乘是可交換的. 一個常見的就是 zero matrix (零矩陣) O (即 O = [ai, j] 滿足每一個 entry a_{i, j}= 0). 很容易驗證若 O 是一個 n× n square matrix, 則對任意 A∈ Mn×n, 皆有 OA = AO = O. 另一個常見的便是所謂的 identity matrix. 通常 n× n 階的 identity matrix, 我們會用 In 來表示. I_n 的 i-th column 為 e_i, 即Rⁿ 的 column vector, 其中 i-th entry 為 1, 其他 entry 為 0. 事實上 e1, e2, . . . , en 就是我們熟悉的 Rⁿ 的 standard basis (標準基底). 例如

I₃=



1 0 0 0 1 0 0 0 1



,I₄=







1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1





.

利用矩陣乘法的定義, 很容易知道對任意 A∈ Mm×n, B∈ Mn×l 我們皆有 AI_n= A, InB = B. 特 別的, 當 A 為 n× n matrix, 我們有 AIn= I_nA = A.

Question 2.5. 假設 A∈ Mn×n, 是否 (A− 2In)²= A²− 4A + 4In 為對?

Question 2.6. 試證明 In 是唯一的 n× n 滿足對任意 A ∈ Mm×n 皆滿足 AI_n= A.

一個 n× n 的 square matrix 其 (i,i)-th entry 稱為 diagonal entry. 若除了 diagonal entries 以外, 其他的 entry 皆為 0, 我們便稱之為 diagonal matrix. Identity matrix 就是一 個 diagonal matrix. 因為它的 diagonal entry 皆為 1, 其他的 entry 皆為 0. 另外, 對於任意 r∈ R, rIn 亦為 diagonal matrix. 因為它 diagonal entry 皆為 r, 其他 entry 皆為 0. 對於任 意 A∈ Mm×n, B∈ Mn×l 我們很容易驗證 rA = A(rI_n), rB = (rI_n)B.

Question 2.7. 試利用 Proposition 2.1.10 驗證對任意 n×n square matrix A, 皆有 (rIn)A = A(rIn).

要注意, 並不是所有 n× n 的 diagonal matrix 都會和 n × n 的 square matrix 相乘可交 換. 前面曾給過例子

[1 0 0 −1

]

就不能和所有的 2× 2 相乘可交換.

(10)

2.2. Transpose Operation

這一節中我們將介紹矩陣取 transpose (即轉置矩陣) 的概念, 即其相關性質. 最後利用它來探討如何從 row 的角度來看矩陣相乘.

對於一個 m× n matrix, 簡單來說其轉置矩陣就是將此矩陣的 row 與 column 的腳色互 換, 也就是說將 row vectors 依序換成 column vectors. 我們有以下的定義.

Definition 2.2.1. 給定 A∈ Mm×n. 定義 A^t∈ Mn×m, 其中對於 1≤ i ≤ m, A^t 的 i-th column 就是將 A 的 i-th row 寫成 column vector. 我們稱 A^t 為 A 的 transpose.

Example 2.2.2. 令

A =

[ 1 2 3

−1 −2 −3 ]

,

依定義 A^t 應為 3× 2 matrix. 其中 A^t 的第一個 column 為 A 的第一個 row [

1 2 3] 寫成 column vector, 即



1 2 3



. 同理 A^t 的第二個 column 為 A 的第二個 row[

−1 −2 −3] 寫成

column vector, 即



−1

−2−3



. 故得

A^t=



1 −1 2 −2 3 −3



.

注意, A^t 的 1-st, 2-nd 和 3-rd row 也恰為 A 的 1-st, 2-nd 和 3-rd column 寫成 row 而得.

由上面的例子我們看到, 當 A∈ Mm×n, 對於 1≤ j ≤ n, A^t 的 j-th row 就是將 A 的 j-th column 寫成 row vector. 事實上若將 A 寫成 A = [a_{i j}]. 對於 1≤ i ≤ m, A^t 的 i-th column 就 是將 A 的 i-th row [

a_{i 1} ··· ai n

] 寫成 column vector



 ai 1

... ai m



. 因此 A^t 的 (1, i)-th entry 就

是 A 的 (i, 1)-th entry a_{i 1}, 而 A^t 的 (2, i)-th entry 就是 A 的 (i, 2)-th entry a_{i 1}. 依此類推我們可以得到對於 1≤ j ≤ n, A^t 的 ( j, i)-th entry 就是 A 的 (i, j)-th entry a_{i j}. 也就是說若我 們將 A^t 寫成 A^t= [a^′_{s k}], 則 1≤ s ≤ n, 1 ≤ k ≤ m, 且 a^′_{s k}= a_{k s}. 因此對於 1≤ j ≤ n, A^t 的 j-th row[

a^′_{j 1} ··· a^′_{j m}]

即為[

a_{1 j} ··· am j

], 恰為 A 的 j-th column 寫成 row vector. 我們將 以上的討論寫成以下的結論.

Lemma 2.2.3. 假設 A = [a_{i j}]∈ Mm×n 且 A^t= [a^′_{s k}]∈ Mn×m. 則對於 1≤ s ≤ n, 1 ≤ k ≤ m, a^′_{s k}= ak s 且 A^t 的 s-th row 就是將 A 的 s-th column 寫成 row vector.

由 Lemma 2.2.3, 以後要談論 A 和 A^t 間的關係, 我們可以用 row 換成 column, column 換成 row 以及 (i, j)-th entry 換成 ( j, i)-th entry 三種看法處理. 現在我們來看矩陣取 transpose 的基本性質.

Proposition 2.2.4. 假設 A, B 為 m× n matrix, C 為 n × l matrix. 我們有以下之性質.

(11)

(1) (A^t)^t= A.

(2) (A + B)^t= A^t+ B^t. (3) (AC)^t= C^tA^t.

Proof. 首先觀察 A^t 為 n× m matrix, 故 (A^t)^t 為 m× n matrix, 與 A 階數相同. 同樣的, A^t+ B^t 為 n× m matrix 與 (A + B)^t 的階數相同. 另一方面 C^t 為 l× n matrix, 故 C^tA^t 為 l× m matrix. 而 AC 為 m × l matrix, 所以 (AC)^t 為 l× m matrix 與 C^tA^t 階數相同.

(1) 因 (A^t)^t 與 A 皆為 m× n matrix, 對於 1 ≤ i ≤ n, 我們只要檢查 (A^t)^t 的 i-th column 就是 A 的 i-th column. 然而 (A^t)^t 的 i-th column 依定義知就是 A^t 的 i-th row 寫成 column vector, 而 A^t 的 i-th row 依 Lemma 2.2.3 就是 A 的 i-th column. 故得證 (A^t)^t= A.

(2) 因 A^t+ B^t 與 (A + B)^t皆為 n×m matrix, 對於 1 ≤ i ≤ m, 我們只要檢查 A^t+ B^t 的 i-th column 就是 (A + B)^t 的 i-th column. 依定義 A^t+ B^t 的 i-th column 就是 A^t 和 B^t 的 i-th column 之和. 依 transpose 定義知它就是 A 和 B 的 i-th row 之和. 另一方面, (A + B)^t 的 i-th column 就是 A + B 的 i-th row, 也就是 A 和 B 的 i-th row 之和. 得證 (A + B)^t= A^t+ B^t. (3) 由於 (AC)^t 的 column 是由 AC 的 row 所決定, 而我們尚未討論 A 和 C 相乘 row 之間的關係, 所以這裡我們利用 entry 相同來證明相等. 我們將這些矩陣分別用 A = [a_{i j}], A^t= [a^′_ji], C = [c_sk], C^t= [c^′_ks]表示. 對於 1≤ t ≤ l, 1 ≤ i ≤ m, (AC)^t 的 (k, i)-th entry 為 AC 的 (i, k)-th entry, 由式子 (2.13) 知應為

ai1c1k+ a_i2c2k+··· + aincnk. 另一方面, C^tA^t 的 (k, i)-th entry 為

c^′_k1a^′_1i+ c^′_k2a^′_2i··· + c^′_kna^′_ni. 利用 Lemma 2.2.3 知此即為

c_1ka_i1+ c_2ka_i2··· + cnka_in.

故得證 (AC)^t= C^tA^t.

Question 2.8. 假設 A 為 m× n matrix, r ∈ R. 試證明 (rA)^t= rA^t.

一個 n× n square matrix, 若滿足 A^t= A, 我們稱 A 為 symmetric matrix. 上一節介紹過的 diagonal matrix 就是 symmetric matrix. 以後我們會學到 symmetric matrix 的重要性質, 現在我們先看和 symmetric matrix 有關的幾個簡單情形.

Corollary 2.2.5. 假設 A 為 n× n square matrix, B 為 m × n matrix. 以下皆為 symmetric matrix.

A + A^t, BB^t, B^tB.

Proof. 由 Proposition 2.2.4, 我們有 (A + A^t)^t= A^t+ (A^t)^t= A^t+ A, 故知 A + A^t 為 symmetric matrix. 另一方面, (BB^t)^t= (B^t)^tB^t= BB^t, 故得 BB^t 為 symmetric matrix. 同理可得 B^tB 亦

為 symmetric matrix.

(12)

利用 Proposition 2.2.4, 我們可以從 row 的角度處理矩陣的乘法. 首先我們看一個 1× m matrix 乘上一個 m× n matrix 的情形. 假設 A ∈ M1×m, B∈ Mm×n, 令

A =[

a₁ a₂ ··· am

], B =







b1 1 b1 2 ··· b1 n

b2 1 b2 2 ··· b2 n

... ... ··· ... bm 1 bm 2 ··· bm n





.

則由 (AB)^t= B^tA^t, 以及矩陣右邊乘 column vector 的定義得

(AB)^t=







b_{1 1} b_{2 1} ··· bm 1

b1 2 b2 2 ··· bm 2

... ... ··· ... b_{1 n} b_{2 n} ··· bm n











 a₁ a2

... a_m





= a1





 b_{1 1} b1 2

... b_{1 n}





+ a2





 b_{2 1} b2 2

... b_{2 n}





+··· + am





 b_{m 1} bm 2

... b_{m n}





.

亦即 (AB)^t= a₁(₁b)^t+ a₂(₂b)^t+··· + am(_mb)^t, 這裡 (_ib)^t 指的是將 B 的 i-th row 取轉置 (寫 成 column 的形式). 故利用 Proposition 2.2.4 將 (AB)^t 再取轉置還原得

AB = a₁(₁b) + a₂(₂b) +··· + am(_mb).

也就是說

[a1 ··· am

]





b1 1 ··· b1 n

... ··· ... b_{m 1} ··· bm n



 = a1

[b1 1 ··· b1 n

]+··· + am

[bm 1 ··· bm n

] (2.14)

現在我們來看一般的情形, 設 A = [a_{i j}]為 m×n matrix 以及 B = [bjk]為 n×l matrix. 考 慮 (AB)^t= B^tA^t. 依定義 B^tA^t 的 i-th column, 為 B^t 右邊乘上 A^t 的 i-th column. 然而 A^t 的 i-th column, 為 A 的 i-th row 取轉置, 即 (ia)^t. 也就是說 (AB)^t 的 i-th column 為 B^t(ia)^t. 利 用 Proposition 2.2.4 再取轉置還原得, AB 的 i-th row 為

(B^t(ia)^t)^t= ((ia)^t)^t(B^t)^t=iaB.

換言之, 我們有以下的圖示

AB =







— ₁a —

— ₂a — ...

— _ma —





B =







— ₁a B —

— ₂a B — ...

— _ma B —





. (2.15)

結合式子 (2.14), 我們有以下之結果.

Proposition 2.2.6. 設 A = [ai j] 為 m× n matrix 以及 B = [bjk] 為 n× l matrix, 則對於 1≤ i ≤ m, AB 的 i-th row 為

ia B =[

ai 1 ··· ai n

]





b_{1 1} ··· b1 l

... ··· ... b_{n 1} ··· bn l



 = a^{i 1}[

b1 1 ··· b1 l

]+··· + ai n

[bn 1 ··· bn l

].

(13)

2.3. Elementary Matrix

前面提過, 我們將聯立方乘式用矩陣 Ax = b 來表示, 是想利用矩陣的乘法來處理聯立方程 式. 事實上 elementary row operation 已可以看成是矩陣的乘法運算. 首先考慮 n× n 的單 位矩陣 I_n (即 I_n 的對角線位置皆為 1, 其他位置為 0). 若用 i-th row 和 j-th row 交換的 type 1 elementary row operation 將 In 轉換成矩陣 E₁, 可得

E1=





 1

. ..

0 1

. ..

1 0

. ..

1







. (2.16)

同樣的若使用 type 2 elementary row operation 將 I_n 的 i-th row 乘上非零實數 r 轉換成矩 陣 E₂, 可得

E2=





 1

. ..

1 r

1 . ..

1







. (2.17)

最後若使用 type 3 elementary row operation 將 I_n 的 i-th row 乘上實數 r 加到 I_m 的 j-th row 所得的矩陣為 E₃, 可得

E3=





 1

. ..

1 . ..

r 1

. ..

1







. (2.18)

這樣的矩陣我們稱之為 elementary matrix. 而我們分別稱 E₁, E2, E3 為 type 1, type 2 以及 type 3 的 elementary matrix.

我們知道矩陣 A 左邊乘上另一矩陣 E, 可以視為 E 的 row 對矩陣 A 的作用. 設 A = [a_{i j}] 為 m× n matrix. 首先觀察 identity matrix Im對 A 的作用. 由於 I_m 的 i-th row 為

[0 ··· 1 ··· 0] ˆi

即 i-th entry 為 1, 其他 entry 皆為 0. 所以依 Proposition 2.2.6, I_mA 的 i-th row 為 [ 0 ··· 1 ··· 0 ]

A = 0₁a +··· + 1ia +··· + 0ma =_ia,

(14)

(就是將 1 乘上 A 的 i-th row, 而將 0 乘上 A 的其他 row 再加起來, 故為 A 的 i-th row.) 換 言之, 將 I_m 乘在 A 的左邊, 會將 A 的每一個 row 都固定不變, 所以知 I_mA = A. 現若 j̸= i 且 E 為將 I_m 的 i-th row 改為 j-th entry 為 1 其他 entry 為 0, 而 i-th row 以外的其他 row 不變. 從上面的看法知 EA 的 i-th row 會是 A 的 j-th row, 也就是說 EA 會是將 A 的 i-th row 換成 A 的 j-th row, 而其他的 row 不動的矩陣.

現若用 i-th row 和 j-th row 交換的 type 1 elementary row operation 將 I_m 轉換成矩陣 E, 則利用前述的說法, EA 的 i-th row 是 A 的 j-th row, 而 EA 的 j-th row 是 A 的 i-th row, 而其他的 row 都不變. 換言之, EA 就是將 A 利用 i-th row 和 j-th row 交換這樣的 type 1 elementary row operation 變換所得的矩陣.

同樣的若將 I_m的 i-th row 乘上非零實數 r 所得的 type 2 elementary matrix 為 E, 則很 容易看出 EA 的 i-th row 就是將 A 的 i-th row 乘上 r, 而其餘的 row 不變. 也就是說, EA 就是將 A 的 i-th row 乘上非零實數 r 這樣的 type 2 elementary row operation 變換所得的 矩陣.

最後若將 I_m 的 i-th row 乘上實數 r 加到 I_m 的 j-th row 所得的 type 3 elementary matrix 為 E, 則因 E 的 j-th row 的 i-th entry 為 r, j-th entry 為 1. 故由 Proposition 2.2.6, EA 的 j-th row 就是將 r 乘上 A 的 i-th row 後再加上 A 的 j-th row, 而其他的 row 都不變.

換言之, EA 就是將 A 的 i-th row 乘上實數 r 加到 A 的 j-th row 這樣的 type 3 elementary row operation 變換所得的矩陣.

從上面的說明我們知道, 對一個 m× n matrix 做一個 elementary row operation, 事實上 就是將此矩陣左邊乘上相對應的 elementary matrix. (2.16), (2.17), (2.18) 就是 elementary matrix 的三種形式.

當我們對一個 m× n matrix A, 進行多次的 elementary row operations, 就是將 A 左邊 逐次的乘上相對應的 elementary matrix. 比方說做兩次 elementary row operations, 就是 將 A 的左邊乘上第一次 elementary row operation 所對應的 elementary matrix E₁. 做第二 次時就是將 E₁A 左邊再乘上第二次 elementary row operation 所對應的 elementary matrix E2. 故所得的矩陣 E2(E1A) 就是將 A 做這兩次 elementary row operations 所得的矩陣. 又 由於矩陣乘法的結合律, 我們又可以將 E₂(E₁A) 寫成 (E₂E₁)A. 同理, 對一個矩陣 A 進行 一連串的 elementary row operations, 就是將 A 左邊乘上一個矩陣, 而這個矩陣就是這一 連串 elementary row operations 所對應的 elementary matrices 的乘積. 不過要注意, 這些 elementary matrices 乘在一起的順序很重要, 因為 elementary matrices 之間的乘法不一定可以交換.

Question 2.9. 試找出那些同階的 elementary matrices 其相乘是不可以交換的.

Example 2.3.1. 考慮 Example 1.1.1 的情形. A 是 3×4 matrix 且 B 是將 A 的第一個 row 和第二個 row 交換所得. 考慮將 I₃ 的第一個 row 和第二個 row 交換所得的 elementary

(15)

matrix

E1=



0 1 0 1 0 0 0 0 1



.

可得

E₁A =



0 1 0 1 0 0 0 0 1







1 2 3 4 2 1 −1 3 4 0 1 2



 =



2 1 −1 3 1 2 3 4 4 0 1 2



 = B.

同樣的 C 是由 B 的第二個 row 乘上 2 所得, 所以我們考慮將 I₃ 的第二個 row 乘上 2 所得的 elementary matrix

E₂=



1 0 0 0 2 0 0 0 1



.

可得

E2B =



1 0 0 0 2 0 0 0 1







2 1 −1 3 1 2 3 4 4 0 1 2



 =



2 1 −1 3 2 4 6 8 4 0 1 2



 = C.

最後 D 是將 C 的第三個 row 乘上 −3 加到第一個 row, 所以我們考慮將 I3 的第三個 row 乘上−3 加到第一個 row 所得的 elementary matrix

E3=



1 0 −3 0 1 0 0 0 1



.

可得

E₃C =



1 0 −3 0 1 0 0 0 1







2 1 −1 3 2 4 6 8 4 0 1 2



 =



−10 1 −4 −3 2 4 6 8 4 0 1 2



 = D.

上面所提這種將一個矩陣做 elementary row operation 可視為將此矩陣左邊乘上其對應的 elementary matrix 的看法, 將來對我們探討矩陣的性質是很有幫助的. 這種看法的互換, 也時能讓我們得到有趣的結果. 例如前面提過一個矩陣經由一個 elementary row operation 轉變成另一個矩陣後, 我們可以再用相同 type 的 elementary row operation 將其轉換回原來的矩陣. 這個事實用 elementary matrices 的角度來看, 可以有以下的看法:

(1) 設 E1 是將 I_m 的 i-th row 和 j-th row 互換的 type 1 elementary matrix. 我們 將 E₁ 的 i-th row 和 j-th row 再互換就可轉換回 identity matrix I_m. 所以我們有 E₁E₁= I_m.

(2) 設 E2 是將 I_m的 i-th row 乘上非零實數 r 的 type 2 elementary matrix. 我們將 E₂ 的 i-th row 乘上 r⁻¹ 就可轉換回 I_m. 所以若令 E₂^′ 為將 I_m 的 i-th row 乘上 r⁻¹ 的 type 2 elementary matrix, 我們有 E₂^′E2= I_m. 同理可得 E2E₂^′ = I_m.

(3) 設 E₃是將 I_m的 i-th row 乘上實數 r 加到 j-th row 所得的矩陣的 type 3 elementary matrix. 我們將 E₃ 的 i-th row 乘上 −r 再加到 j-th row 就可轉換回 Im. 所以若令 E₃^′ 為將 I_m的 i-th row 乘上−r 的 type 3 elementary matrix, 我們有 E₃^′E3= Im. 同 理可得 E₃E₃^′ = I_m.

(16)

我們知道當一個 m× m 的矩陣 A 若可找到矩陣 B 使得 BA = AB = Im, 則稱 A 為一個 invertible matrix (可逆矩陣), 且 B 為 A 的 inverse (反矩陣). 從上面的探討我們有以下之結 論.

Proposition 2.3.2. 假設 E 是一個 elementary matrix, 則 E 為 invertible 且 E 的 inverse 是和 E 相同 type 的 elementary matrix.

既然有所謂的 elementary row operations 當然也會有 elementary column operations. 它 的概念只是將 row operation 對 row 的動作改為對 column 的動作. 我們將一個矩陣的 i-th column 和 j-th column 對調, 這一個動作及稱為 type 1 的 elementary column operation.

若將矩陣的 i-th column 上的數皆乘上非零實數 r, 則稱 type 2 的 elementary column operation. 至於 type 3 的 elementary column operation 就是把矩陣的 i-th column 乘上 r 後加到其 j-th column. 由於 column operations 並未用在解聯立方乘組的問題, 所以這裡 我們僅約略介紹其相關的概念, 不再像前面依樣詳述. 事實上 column operations 的概念和 row operations 是相呼應的, 大家可以用前面探討的方式檢驗.

將 identity matrix I_m做 elementary column operation 後會得到甚麼樣的矩陣呢? 結果也會是前面提到的 elementary matrix (這也是 elementary matrix 沒有區分 row 和 column 的原因). 例如將 I_m 的 i-th column 和 j-th column 互換所得的矩陣就是將 I_m 的 i-th row 和 j-th row 互換的 type 1 elementary matrix. 而將 I_m 的 i-th column 乘上非零實數 r 的矩 陣, 就是將 I_m 的 i-th row 乘上 r 的 type 2 elementary matrix. 不過要注意, 將 I_m 的 i-th column 乘上實數 r 加到 j-column 所得的矩陣不是將 I_m 的 i-th row 乘上實數 r 加到 j-th row 所得的 elementary matrix, 而是將 Im 的 j-th row 乘上實數 r 加到 i-th row 所得的矩 陣的 type 3 elementary matrix. 這一部分請務必檢驗, 就能了解其中原因.

既然一個 elementary matrix 同時可對應到 elementary row operation 也可對應到 elementary column operation, 那要如何區分呢? 別忘了, 矩陣的乘法是沒有交換性的. 前面 我們知道, 當一個 elementary matrix E 乘在一個矩陣 A 的左邊時, 所得的矩陣 EA 會是對 A 做 E 所對應的 elementary row operation. 而若將 E 乘在矩陣 B 的右邊, 則所得的矩陣 BE 會是對 B 做 E 所對應的 elementary column operation. 為了方便起見, 我們綜合成以下 的結論.

Theorem 2.3.3. 假設 A 是一個 m× n matrix. 若 E 是對 Im 做 elementary row operation 所得的 elementary matrix, 則 EA 就會是對 A 作相對應的 elementary row operation 所得 的矩陣. 若 E^′ 是對 I_n 做 elementary column operation 所得的 elementary matrix, 則 AE^′ 就會是對 A 作相對應的 elementary column operation 所得的矩陣.

Example 2.3.4. 考慮

E₁=



 1 0 0 0 0 1 0 1 0



, E₂=



 10 0 0 0 1 0 0 0 1



, E₃=



 1 0 10 0 1 0 0 0 1



, A =



 1 2 3

−1 −2 −3 11 22 33





(17)

E₁可視為將 I₃ 的 2-nd row 和 3-rd row 交換, 也可視為將 I₃ 的 2-nd column 和 3-rd column 交換. 事實上我們有

E1A =



 1 0 0 0 0 1 0 1 0







 1 2 3

−1 −2 −3 11 22 33



 =



 1 2 3 11 22 33

−1 −2 −3



,

AE₁=



 1 2 3

−1 −2 −3 11 22 33







 1 0 0 0 0 1 0 1 0



 =



 1 3 2

−1 −3 −2 11 33 22



.

E2 可視為將 I₃ 的 1-st row 乘以 10, 也可視為將 I3 的 1-st column 乘以 10. 事實上我們有

E₂A =



 10 0 0 0 1 0 0 0 1







 1 2 3

−1 −2 −3 11 22 33



 =



 10 20 30

−1 −2 −3 11 22 33



,

AE2=



 1 2 3

−1 −2 −3 11 22 33







 10 0 0 0 1 0 0 0 1



 =



 10 2 3

−10 −2 −3 110 22 33



.

E₃ 可視為將 I₃ 的 3-rd row 乘以 10 加到 1-st row, 也可視為將 I3 的 1-st column 乘以 10 加到 3-rd column. 事實上我們有

E3A =



 1 0 10 0 1 0 0 0 1







 1 2 3

−1 −2 −3 11 22 33



 =



 111 222 333

−1 −2 −3 11 22 33



,

AE₁=



 1 2 3

−1 −2 −3 11 22 33







 1 0 10 0 1 0 0 0 1



 =



 1 2 13

−1 −2 −13 11 22 143



.

這裡我們再說明一下, 當 A 是一個 m× n matrix, 因為 A 有 m 個 row, 所以乘在左邊 的 elementary matrix (對應到 elementary row operation) 必須是一個 m 階方陣. 同樣的, 因為 A 有 n 個 column, 所以乘在右邊的 elementary matrix (對應到 elementary column operation) 必須是一個 n 階方陣.

有時我們需知道一個矩陣經由一連串的 elementary row operations, 其左邊到底是乘上哪一個矩陣. 當然我們可以如前述將所對應的 elementary matrices 乘在一起即可, 但這樣做其實很麻煩費時. 接下來我們來看一個很 “clever” 的方法, 可以在做 elementary row operation 時便幫我們將這個矩陣記錄下來. 這個方法就是, 若要對一個 m× n matrix A 做 elementary row operations, 我們先寫下一個 augmented matrix [A|Im]. 也就是一個 m× (n + m) 的增廣矩陣, 其左邊 n 個 columns (即前 n 個 columns) 為矩陣 A, 而右邊 m 個 columns (即後 m 個 column) 為 I_m. 現將 A 做第一次的 elementary row operation, 假設其 對應的 elementary matrix 為 E₁, 則 A 被轉換為 E1A. 現若對 [A|Im] 做相同的 elementary row operation 的話, 所得的結果會是 E₁[A|Im]. 然而此時原先 A 的部分會變成 E₁A, 而 I_m的 部分經同樣的 elementary row operation, 所以 I_m這部分會是 E₁Im. 因此我們知

E₁[A|Im] = [E₁A|E1I_m] = [E₁A|E1].

(18)

也就是說, 當我們對 [A|Im] 做同樣的 elementary row operation, 所得的增廣矩陣其左 邊就是將 A 做此 elementary row operation 所得的矩陣, 而右邊就是此 elementary row operation 所對應的 elementary matrix. 接著當我們做下一個 elementary row operation, 假 設此 elementary row operation 所對應的 elementary matrix 為 E₂, 則此 elementary row operation 對 [E1A|E1] 作用後所得的矩陣便是 E₂[E1A|E1] = [E2(E1A)|E2E1]. 這樣繼續下去, 當我們對增廣矩陣 [A|Im]進行一連串的 elementary row operations 後, 所得的矩陣 [A^′|E], 其左邊 A^′ 就是 A 經由這一連串的 elementary row operations 作用後所得的矩陣, 而右邊的 E 就是這些 elementary row operations 所對應的 elementary matrices 依序從右到左相乘所 得的結果, 因此 EA = A^′. 我們有以下的結論.

Lemma 2.3.5. 假設 A 為 m× n matrix. 若將 A 經由一連串的 elementary row operations 轉換成 A^′, 則存在一個 m× m matrix E 使得 EA = A^′, 其中 E 為這一連串 elementary row operations 所對應的 elementary matrix 由右而左依序相乘的乘積. 事實上若將 augmented matrix [A|Im] 經由同樣的 elementary row operations 作用後, 所得的 augmented matrix 就 是 [A^′|E].

Example 2.3.6. 將矩陣

A =



 2 −4 4 −6 1 −2 1 −1 4 −8 4 −4





化為 reduced echelon form, 並找到 elementary matrices 的乘積 E 使得 EA 為此 reduced echelon form.

首先寫下 augmented matrix [A|I3] =



 2 −4 4 −6 1 0 0 1 −2 1 −1 0 1 0 4 −8 4 −4 0 0 1





並將此 augmented matrix 的 1-st 和 2-nd row 交換, 得



 1 −2 1 −1 0 1 0 2 −4 4 −6 1 0 0 4 −8 4 −4 0 0 1





接著我們將 augmented matrix 的 1-st row 乘上−2 加到 2-nd row 上, 得



 1 −2 1 −1 0 1 0 0 0 2 −4 1 −2 0 4 −8 4 −4 0 0 1



.

然後將 augmented matrix 的 1-st row 乘上−4 加到 3-rd row 得



 1 −2 1 −1 0 1 0 0 0 2 −4 1 −2 0 0 0 0 0 0 −4 1



.

繼續將 augmented matrix 的 2-nd row 乘上 1/2 得



 1 −2 1 −1 0 1 0 0 0 1 −2 ¹₂ −1 0 0 0 0 0 0 −4 1



.

(19)

最後將 augmented matrix 的 2-nd row 乘上−1 加到 1-st row 得



 1 −2 0 1 −¹₂ 2 0 0 0 1 −2 ¹₂ −1 0 0 0 0 0 0 −4 1



.

令最後所得的 augmented matrix 為 [A^′|E], 我們檢查是否 A 的 reduced echelon form A^′ 就 是 EA. 事實上, 我們確有

EA =



 −¹₂ 2 0

1

2 −1 0

0 −4 1







 2 −4 4 −6 1 −2 1 −1 4 −8 4 −4



 =



 1 −2 0 1 0 0 1 −2 0 0 0 0



.

另外我們想確認 E 確為這五個 elementary row operations 所對應的 elementary matrices 的 乘積. 因為 A 為 3× 4 matrix, 所以第一個 elementary row operation 所對應的 elementary matrix E₁ 就是將 3×3 的 identity matrix I3 的 1-st 和 2-nd row 交換, 而第二個 elementary matrix E₂ 為將 I₃ 的 1-st row 乘上 −2 加到 2-nd row 上. 第三個 elementary matrix E3 為 將 I₃的 1-st row 乘上−4 加到 3-rd row 上. 接下來的 elementary matrix E4 為將 I₃ 的 2-nd row 乘上 1/2, 而最後一個 elementary matrix E₅為將 I₃ 的 2-nd row 乘上−1 加到 1-st row 上. 也就是說, 我們有

E1=



 0 1 0 1 0 0 0 0 1



, E₂=



 1 0 0

−2 1 0 0 0 1



, E₃=



 1 0 0 0 1 0

−4 0 1



,

E4=



 1 0 0 0 ¹₂ 0 0 0 1



, E₅=



 1 −1 0 0 1 0 0 0 1





將這五個 elementary matrices 由右而左依序相乘, 確實得 E₅E₄E₃E₂E₁=



 −¹₂ 2 0

1

2 −1 0

0 −4 1



 = E.

———————————– 15 October, 2021