我們是對矩陣的 row 的個數作數學歸納法

(1)

1.3. Echelon Form 的性質

這一節中我們將說明前面提到有關 echelon form 的三個問題. 首先我們利用數學歸納法來說明為何一定可以將一個矩陣化為 echelon form. 我們是對矩陣的 row 的個數作數學歸納法. 先說明所有只有一個 row 的矩陣一定是 echelon form, 然後利用這件事實證明所有有兩個 row 的矩陣皆可利用 elementary row operations 化為 echelon form. 再利用兩個 row 的矩陣會成立的事實證明有 3 個 row 的矩陣也可利用 elementary row operations 化為 echelon form, 如此一直下去我們可證有 4, 5, 6, . . . 個 row 的矩陣會成立. 不過這樣的方法我 們可以證得有特定個數的 row 的矩陣會成立 (例如 10 個 row), 但無法證得一般的情形 (即 任意個數的 row). 此時數學歸納法是最好的論證工具了. 若我們能知道有 k 個 row 的矩陣 一定能利用 elementary row operations 化為 echelon form 這個事實且利用這個事實證得有 k + 1 個 row 的矩陣一定能利用 elementary row operations 化為 echelon form, 這就表示當 我們知道有一個 row 的矩陣能利用 elementary row operations 化為 echelon form 就能推得有兩個 row 的矩陣能利用 elementary row operations 化為 echelon form, 也進而推得有 3 個 row 的矩陣亦成立, 再進而推得有 4 個 row 的矩陣亦成立, 如此一直下去當然可知任意的矩陣皆能利用 elementary row operations 化為 echelon form.

我們先看只有一個 row 的矩陣. 此時由於沒有任何的 row 在其下方所以依定義自然是 echelon form. 接著看有兩個 row 的矩陣. 首先注意依定義一個 echelon form 的第一個 row 其 leading entry (若有的話) 必在所有其他 row 的 leading entry 所在位置的左方. 所以我們在此有兩個 row 的矩陣挑出 leading entry 在最左方的一個 row (若兩個 row 的 leading entry 所在位置相同就任取一個 row) 利用 row 交換的 row operation 將之置於第一個 row.

接下來注意依定義下一個 row 的 leading entry 所在位置需在第一個 row 的 leading entry 的右方. 現若第二個 row 的 leading entry 所在位置和第一個 row 不同, 則因已知第一個 row 的 leading entry 所在位置在最左方, 第二個 row 的 leading entry 所在位置一定在第一個 row 的 leading entry 的右方, 故依定義此時已為 echelon form. 而若第二個 row 的 leading entry b 所在位置和第一個 row 的 leading entry a 相同, 我們可將第一個 row 乘 以 −b/a, 再加到第二個 row 上. 如此一來第二個 row 原本的 leading entry 變為 0, 故其 leading entry 所在位置往右移了, 依定義此時為 echelon form.

接著我們使用數學歸納法的假設, 亦即任何有 k 個 row 的矩陣皆可利用 elementary row operation 化為 echelon form. 現在我們要處理有 k + 1 個 row 的矩陣. 如前面的方法, 首先 我們將 leading entry 的位置在最左邊的那個 row 利用兩 row 互換的 row operation 將之置 於第一個 row. 現假設此時第一個 row 的 leading entry 為 a. 接下來我們挑出其他 row 中 leading entry 的位置與第一個 row 的 leading entry 位置一樣的 row. 若該 row 的 leading entry 為 b, 我們便將第一個 row 乘上 −b/a 後加到該 row 上. 如此一來該 row 的 leading entry 所在位置便往右移了. 一直重複此步驟, 直到第一個 row 以外的 row 其 leading entry 所在位置皆與第一個 row 的 leading entry 所在位置相異. 注意, 此時第一個 row 以下的各 row 其 leading entry 所在位置皆在第一個 row 的 leading entry 所在位置的右方. 若 我們不看第一個 row, 所剩下的是一個有 k 個 row 的矩陣, 所以利用前面已知有 k 個 row

(2)

的矩陣皆可利用 elementary row operations 化為 echelon form, 我們可以利用 elementary row operations 將此矩陣第一個 row 以下的部份化為 echelon form. 但此時因各個 row 的 leading entry 所在位置皆在第一個 row 的 leading entry 所在位置的右方, 所以整個矩陣亦為 echelon form. 故得證所有矩陣皆可利用 elementary row operations 化為 echelon form.

大家或許注意到我們在化成 echelon form 的過程皆沒有用到將某個 row 乘上一非 0 實數這一個 type 2 的 elementary row operation. 事實上在化成 echelon form 的過程確實只需要用到 type 1,3 這兩種 elementary row operations, 至於 type 2 的 elementary row operation 會在以後我們會介紹化為 “reduced” echelon form 的過程是需要的, 留待以後再談.

接下來我們說明為何將 augmented matrix [A| b] 利用 elementary row operations 化成 echelon form [A^′| b^′], 則其對應的聯立方程組 A^′x = b^′ 會和原方程組 Ax = b 有相同的解集 合. 首先觀察若將一聯立方程組 Ax = b 的 augmented matrix [A| b] 利用三種 elementary row operation 的任一種變換成 [A^′| b^′] 表示將原方程組利用加減消去法的三個基本方法將 之變成方程組 A^′x = b^′. 然而方程組 Ax = b 若利用加減消去法的三種方法 (即將兩式子對調順序或將某一式乘上某個非 0 實數或將一個式子乘上某個實數加到另一個式子) 變換成 方程組 A^′x = b^′, 原來滿足 Ax = b 的一組解仍會滿足 A^′x = b^′. 也就是說 Ax = b 的解就會 是 A^′x = b^′ 的解. 不過這不表示它們會有相同的解集合, 我們還要說明 A^′x = b^′ 的解也會是 Ax = b 的解才行. 然而我們前面提及 elementary row operations 是可以還原的. 換句話說 [A^′| b^′]也可經由 elementary row operations 變換成 [A| b]. 所以套用剛才的理由, 我們也知 A^′x = b^′ 的解就會是 Ax = b 的解. 因此得證 Ax = b 和 A^′x = b^′ 會有相同的解集合.

Example 1.3.1. 考慮聯立方程組

{ a₁₁x₁+ a₁₂x₂= b₁

a21x1+ a₂₂x2= b₂ . 如果 x1= c₁, x₂= c₂ 是此方程組 的一組解，表示 a₁₁c₁+ a₁₂c₂= b₁ 以及 a₂₁c₁+ a₂₂c₂= b₂ 也因此 x₁= c₁, x₂= c₂ 會是聯立方程組

{ a21x1+ a22x2= b2

a₁₁x₁+ a₁₂x₂= b₁ 的一組解。反之亦然，這說明對此聯立方程組做一個 type 1 的 elementary row operation 並不會影響解集合。

另一方面若給定非 0 實數 r, 則 c1, c2 也會滿足 a₁₁c1+ a12c2= b1 以及 ra₂₁c1+ ra22c2= rb2. 也就是說 x1= c₁, x₂= c₂ 會是聯立方程組

{ a₁₁x₁+ a₁₂x₂= b₁

ra21x1+ ra₂₂x2= rb₂ 的一組解. 這說明了原方程組的解仍會是方程組在做了 type 2 的 elementary row operation 後所得的方程組 之解。特別的是，由於 r̸= 0, 將新方程組的第二個 row 乘上 1/r, 便會得到原方程組。所 以同理可知新方程組的解仍會是原方程組的解。這說明對此聯立方程組做一個 type 2 的 elementary row operation 並不會影響解集合。

最後我們看 type 3 的情況。若 r 為給定實數，由於 c₁, c₂ 也會滿足 (ra₁₁+ a₂₁)c₁+ (ra₁₂+ a₂₂)c₂= (ra₁₁c1+ ra₁₂c2) + (a₂₁c1+ a₂₂c2) = rb₁+ b₂. 故知 x1= c₁, x₂= c₂ 也會是聯立方程組

{ a₁₁x₁+ a₁₂x₂= b₁

(ra₁₁+ a₂₁)x₁+ (ra₁₂+ a₂₂)x₂= rb₁+ b₂ 的一組解。這說明了原方程組的解仍會是方程組在做了 type 3 的 elementary row operation 後所得的方程組之解。由於新方程組也可利用第一個 row 乘上−r 加到第二個 row 的方式得到原方程組。所以同理可知新方 程組的解仍會是原方程組的解。這說明對此聯立方程組做一個 type 3 的 elementary row

operation 並不會影響解集合。 ♯

(3)

當連立方程組 Ax = b 和 A^′x = b^′ 它們的解集合相同, 這表示兩組方程組是有很特別的關係的. 我們有以下的定義.

Definition 1.3.2. 假設 linear systems Ax = b 和 A^′x = b^′ 的解集合相同, 則稱 Ax = b 和 A^′x = b^′ 為 equivalent linear systems

從上面的探討我們知道 augmented matrix [A| b] 若利用 elementary row operations 化 成 [A^′| b^′], 則 Ax = b 和 A^′x = b^′ 為 equivalent linear systems.

我們已知要探討聯立方程組 Ax = b 的解, 僅要考慮 A 為 echelon form 的情形. 接下來 我們就是要討論當 A 為 echelon form 時, 聯立方程組 Ax = b 解的特性. 事實上我們很容 易理解利用 1.2 節中所提求解的方法所得的結果皆為方程組的一組解. 這裡要探討的是為何利用 1.2 節中所提求解的方法, 就可得所有的解. 接著我們將說明, 雖然一個矩陣利用 elementary row operations 化為 echelon form 的結果不唯一, 但是它們的 pivot variables 是唯一的.

如果我們得到 1.2 節 (2)(a) 的情形 (即 A 有一個 row 全為 0 但 b 在該 row 不為 0), 在該節已說明此時方程組無解. 所以我們只要探討有解的情形. 首先回顧一下在 1.2 節所 提求解的方法: 首先我們要找到 free variables, 也就是是方程組除了 pivot variable 以外的 variable. 接著給這些 free variable 任意的參數值, 然後再利用由下往上代回的方式找到聯立方程組所有的解. 若無 free variable, 就直接由下往上一步一步求值即可.

由於可以忽略 augmented matrix 全為 0 的 row, 所以我們可假設係數矩陣 A 沒有一 個 row 全為 0. 因為 A 為 echelon form, 這也表示 A 每一個 row 皆有 leading entry 且為 pivot. 現在我們回答當 A 是 echelon form 時, 1.2 節中所述解聯立方程組 Ax = b 的方法所 求得的解就是所有的解. 也就是說給定 x₁= c₁, . . . , x_n= c_n 為 Ax = b 的一組解, 我們要說明 這組解確實可由 1.2 節所提的方法得到. 為了方便起見我們令 1.2 節所提的方法所得的解 所成的集合為 S. 我們要說明 (x₁, . . . , xn) = (c1, . . . , cn) 確實為 S 中的元素. 現若 x_n 為 pivot variable, 則 x_n 的值是被唯一確定的. 所以 S 的所有解中 x_n 的取值一定也為 c_n. 若 x_n 為 free variable, 則因 S 的解中 xn 可為任意值, 故 S 中一定有一組解其 x_n 的取值為 c_n. 也就 是說不管 x_n 是否為 pivot variable, S 中必有一組解其 x_n 的取值為 c_n. 現若 x_n−1 為 pivot variable, 則由此 pivot 所在的 row 所對應的方程式可知 xn−1 的取值會被 x_n 的取值所決定.

今已知 S 中必有一組解其 x_n 的取值為 c_n, 故此組解必滿足 xn−1= cn−1, xn= cn; 而若 xn−1

為 free variable, 則因 S 的解中 x_n₋₁ 可為任意值且其取值不影響到 x_n 的取值, 故知 S 中必 有一組解其 x_n₋₁, xn 的取值為 x_n₋₁= cn−1, xn= cn. 如此一直下去我們知道 S 中必有一組解 其 x₁, . . . , x_n 的取值為 x₁= c₁, . . . , x_n= c_n.

我們可以利用上面的概念, 推導出當 A 為 echelon form 時, pivot variables 和 free variables 對聯立方程組 Ax = b 解的影響. 首先看 pivot variable 對聯立方程組的解之影響.

Lemma 1.3.3. 假設 A 為一有 n 個 column 的 echelon form 且 x₁= c₁, . . . , x_n= c_n 和 x1= d1, . . . , xn= dn 皆為方程組 Ax = b 的一組解.

(1) 假設 x_n 為 A 的一個 pivot variable. 則 c_n= d_n.

(4)

(2) 假設 x_k 為 A 的一個 pivot variable, 其中 1≤ k ≤ n − 1. 若 ck+1= d_k+1, . . . , c_n= d_n, 則 c_k= d_k.

Proof. 假設聯立方程組為

a11x1 + ··· + a1nxn = b1

a21x1 + ··· + a2nxn = b2

...

am1x1 + ··· + amnxn = bm

其中

A =







a₁₁ ··· a1n

a₂₁ ··· a2n

... . .. ... a_m1 ··· amn







為 echelon form, 且不失一般性我們假設 A 的每一個 row, a_{i 1}, . . . , a_{i n} 皆不全為 0.

(1) 若 x_n 為 A 的一個 pivot variable, 表示 A 的最後一個 row 的 leading entry 所在位 置為 x_n. 也就是說 am 1= a_{m 2}=··· = am n−1= 0 且 a_{m n}̸= 0. 這表示此聯立方程組中 最後一個式子為 a_mnxn= bm. 故由 x1= c1, . . . , xn= cn 及 x₁= d1, . . . , xn= dn 皆為此 聯立方程組的一組解知 x_n= c_n和 x_n= d_n皆需滿足 a_mnx_n= b_m, 亦即 a_mnc_n= b_m且 amndn= bm. 故由 amn̸= 0 得知 cn= dn.

(2) 若 x_k 為 A 的一個 pivot variable, 表示 A 有一個 row 的 leading entry 所在位置 為 x_k. 也就是說若此 row 為 A 的第 i 個 row, 則 ai1 = a_i2 =··· = ai k−1 = 0 且 a_ik̸= 0. 此 row 所對應的式子為 aikx_k+··· + ainxn= bi.故由 x₁= c1, . . . , xn= cn 及 x₁= d₁, . . . , x_n= d_n 皆為此聯立方程組的一組解知 x_k = c_k, x_k+1= c_k+1, . . . , x_n= c_n 和 x_k = dk, xk+1= dk+1, . . . , xn= dn 皆需滿足 a_ikxk+··· + ainxn= bi. 因此由 ck+1= d_k+1, . . . , c_n= d_n 的假設知

a_ikc_k= b_i− (ai k+1c_k+1+··· + ainc_n) = b_i− (ai k+1d_k+1+··· + aind_n) = a_ikd_k. 再由 a_ik̸= 0 得知 ck= d_k.

相對於 pivot variable 我們知道對於 free variable 我們可以隨意取任何的實數而得到一組解, 所以我們有以下 free variable 對解的影響.

Lemma 1.3.4. 假設 A 為一有 n 個 column 的 echelon form 且沒有一個 row 全為 0.

(1) 假設 xn 為 A 的一個 free variable. 則對任意的實數 r, 方程組 Ax = b 皆可找到一 組解其 x_n= r.

(2) 假設 x_k 為 A 的一個 free variable, 其中 1≤ k ≤ n − 1. 若 x1= c₁, . . . , x_n= c_n 為方 程組 Ax = b 的一組解, 則對任意實數 r 方程組 Ax = b 皆可找到一組解其 x_k= r 且 x_k+1= c_k+1, . . . , x_n= c_n.

(5)

Proof. 在前面所提的求解過程中我們知道可將 free variable 定為任意的實數, 再一步一步 由下往上代回得到一組解. 在這個過程中我們了解到若 x_i 是 free variable, 則它的取值可能 會影響到的僅有 x_j, 其中 j < i 這樣的變數, 而不會影響到其他變數 x_l, 其中 i < l 的取值.

現若 x_n 是 free variable, 這表示我們可以設定 x_n 為任意實數, 再一步一步往上代求得聯 立方程組的一組解, 所以對任意的實數 r, 方程組 Ax = b 皆可找到一組解其 x_n 為 r.

若 x_k 為 A 的一個 free variable, 其中 1≤ k ≤ n − 1 且已知 x1= c₁, . . . , x_n= c_n 為方程組 Ax = b 的一組解. 換言之, xk+1= c_k+1, . . . , x_n= c_n 皆滿足方程組 pivot 的位置在 x_k 右方的 那些 row 所對應的那些方程式. 由於 x_k 可取任意的實數且不會影響 x_k+1, . . . , xn 的取值, 所 以我們可令 x_k= r 且 x_k+1= c_k+1, . . . , x_n= c_n 一步一步代回求得聯立方程組的一組解.

接下來，我們用兩個前面討論過的例子說明一下 Lemma 1.3.3 和 Lemma 1.3.4.

Example 1.3.5. 在 Page 7, 我們知道聯立方程組

2x1 +x2 +3x3 +x4 = 4 3x₂ +3x₃ +x₄ = 2

−x4 = 1

的解為 x₁= 2−t,x2= 1−t,x3= t, x₄=−1, 其中 t 為任意實數. 我們可以看出，雖然這組 方程組有無窮多解，不過所有的解中 x₄ 的值一定是 −1. 這就是 Lemma 1.3.3 (1) 中說的 因為 x₄ 是最後一個 variable 且為 pivot, 所以任兩組解的 x₄ 的值都相同。又讓我們隨便 選一組解，例如 x₁= 2, x₂= 1, x₃= 0, x₄=−1 (即 t 代 0 的情況). 由於 x3 是 free variable, Lemma 1.3.4 (2) 告訴我們若選定 x4=−1, 我們都可將 x3 隨便代一個值來得到一組解。要 注意的是, x₂ 雖為 pivot variable, 不過 Lemma 1.3.3 (2) 並不是告訴我們任選兩組解其 x₂ 的值都會一樣。它是說若這兩組解的 x₃, x4 的值是一致的則它們 x₂ 的值也會一樣。例如 x₁= 1, x₂= 0, x₃= 1, x₄=−1 也是一組解，它的 x2 的值 0 就和前面那組解的 x₂ 的值 1 就 不同。不過若兩組解它們有一致的 x₃ 和 x₄, 那麼它們 x2 的值也一致。這可從前面所給的解集合看出。

在 Page 10, 我們知道聯立方程組

x1 −2x2 +x3 −x4 = 4 x2 +2x3 −x4 = −9

的解為 x₁=−14 + 3r − 5s,x2=−9 + r − 2s,x3= s, x4= r, 其中 s, r 為任意實數. 由於最後一 個 variables x₄ 是 free variable, Lemma 1.3.4 (1) 告訴我們任意給一個實數 r 都可以找到一 組解其 x₄ 的值為 r. 然而 x₃ 也是 free variable, 所以 Lemma 1.3.4 (2) 告訴我們再任意選一 個實數 s, 我們都可以找到一組解其 x₄ 和 x₃ 的值分別為 r 和 s. 這都可以由解集合看出來。

又 x₂ 是 pivot variable, 而 Lemma 1.3.3 (2) 告訴我們若有兩組解其 x₃ 的值是一樣的且 x₄ 的值也一樣，則這兩組解的 x₂ 的值也會一樣，因而再由 x₁ 是 pivot variable 可知它們 x₁ 的值也相同。這也和解集合若 x₄= r, x₃= s, 則可確定 x₂ 和 x₁ 的值分別為 −9 + r − 2s 和

−14 + 3r − 5s 相吻合。 ♯

Lemma 1.3.3 和 Lemma 1.3.4 有許多應用. 例如當 A 是 echelon form 時若聯立方程 組 Ax = b 已知有一個解 x₁= c₁, . . . , x_n= c_n 且 x₁, . . . , x_n 每一個都是 pivot variable, 則由

(6)

Lemma 1.3.3 知聯立方程組 Ax = b 的解僅能是 x₁= c₁, . . . , x_n= c_n. 換句話說此方程組的解 唯一. 另一方面, 若聯立方程組 Ax = b 已知有解且 x₁, . . . , x_n中有 free variable, 則由 Lemma 1.3.4 知聯立方程組 Ax = b 會有無窮多解 (除非我們討論的數系僅有有限多個元素).

當我們給一個矩陣時, 有許多種方法將之化為 echelon form, 而且化成的 echelon form 很可能不一樣. 不過利用 Lemma 1.3.3 和 Lemma 1.3.4 我們可以得到這些 echelon form 雖然可能不一樣, 但他們 pivot 的所在位置都會一致. 由於我們只關心係數矩陣 A 化為 echelon form 後的情形, 所以我們可以考慮 Ax = 0 這一種特殊形式的聯立方程組. 要注意這 樣的聯立方程組都會有解, 因為 x₁= 0, . . . , x_n= 0 就是一組解. 我們特別稱這樣的聯立方程 組為 homogeneous system.

Proposition 1.3.6. 給定一矩陣 A, 若 A1, A₂ 均為 A 利用 elementary row operations 化成 的 echelon forms. 則 A₁ 和 A₂ 的 pivot 個數相同, 事實上他們的 pivot variables 是一致的.

Proof. 我們考慮 Ax = 0 這一組聯立方程組, 其中 A 有 n 個 column (即此方程組有 n 個 變數). 因為 A 可利用 elementary row operation 化為 A₁ 及 A₂, 這表示 augmented matrix [A| 0] 可以利用 elementary row operation 化為 [A1| 0] 及 [A2| 0]. 換句話說聯立方程組 A1x = 0 和 A₂x = 0 皆與聯立方程組 Ax = 0 有同樣的解. 再次強調這些聯立方程組都會有 x₁= 0, . . . , x_n= 0 這樣的一組解.

我們要用反證法處理. 假設 A₁ 和 A₂ 有 pivot variable 不一致, 不失一般性我們就假設 對 A₁ 來說 x_i 是 pivot variable 但對 A₂ 來說 x_i 不是 pivot variable (即 free variable). 假 設 i = n, 這表示方程組 A₁x = 0 的解中 x_n 的取值是唯一的 (Lemma 1.3.3), 事實上 x_n 一定 為 0; 但 A₂x = 0 的解中 x_n 的取值卻可以是任意的實數 (Lemma 1.3.4). 這和此二方程組有相同的解相矛盾. 現若 1≤ i ≤ n − 1. 利用 x1= 0, . . . , xn= 0 已是這兩聯立方程組的解, 我們知道方程組 A₁x = 0 的解中一定找不到一組解其 x_i+1, . . . , x_n 的取值皆為 0 但 x_i 的取 值不是 0 (Lemma 1.3.3); 另一方面 Lemma 1.3.4 告訴我們 A2x = 0 的解中一定可找到一 組解其 x_i+1, . . . , xn 的取值皆為 0 但 xi 的取值不是 0 (事實上 xi 可以是任意實數). 這又和 A₁x = 0, A₂x = 0 此二方程組有相同的解相矛盾. 故由反證法知 A₁ 和 A₂ 的 pivot variables

是一致的.

在解聯立方程組的過程中還可以進一步將 echelon form 化為所謂的 reduced echelon form. Reduced echelon form 事實上仍為 echelon form, 不過再加上兩個限制. 第一個限 制是每一個 pivot entry 需為 1. 另一個限制為 pivot 的位置上方全為 0. 要注意, 依定義 echelon form 的 pivot 位置下方已全為 0 所以 reduced echelon form 每一個 pivot 所在的 column, 除了自己需為 1 外其他部分皆為 0. 例如

A =



 1 2 0 0 0 0 3 6 0 0 0 0



, B =



 1 1 3 0 0 1 1 2 0 0 1 −1





(7)

都不是 reduced echelon form 但是

A^′=



 1 2 0 0 0 0 1 2 0 0 0 0



, B^′=



 1 0 0 0 0 1 0 3 0 0 1 −1





就是 reduced echelon form. 每一個 echelon form 皆可利用 elementary row operations 換 為 reduced echelon form. 這是因為, 若有一個 row 的 pivot entry 為 a (注意依定義 a̸= 0), 我們只要將該 row 乘上 1/a, 則該 row 的 pivot entry 便是 1 了 (這就是需要 type 2 的 elementary row operation 的地方). 例如上面 A 這一個 echelon form 若將第二個 row 乘上 1/3, 就可得 A^′ 這一個 reduced echelon form. 當我們將每個 pivot 都變為 1 後, 就可利用將該 row 乘上某一實數加到另一個 row 的方法將 pivot 所在的 column 的其他部分化為 0.

例如上面 B 這一個 echelon form 若將第三個 row 分別乘上 −3, −1 加到第一個 row 和第 二個 row, 得



 1 1 0 3 0 1 0 3 0 0 1 −1



. 再將第二個 row 乘上 −1 加到第一個 row, 就可得 B^′ 這一個 reduced echelon form. 注意一般我們都是從上而下將矩陣換成 echelon form, 不過得到 echelon form 後是從下而上將 echelon form 換成 reduced echelon form 較為方便.

化為 reduced echelon form 後, 我們就可以利用前面由 echelon form 求解的方法求出聯立方程組的解. 由於 reduced echelon form 每一個 row 除了該 row 的 pivot 外, 只剩 free variables (其他的 pivot variable 所在的 entry 皆為 0), 所以可以很快地看出解的形式. 例如 方程組 B^′x = 0 為

x₁ = 0

x₂ +3x₄ = 0 x3 −x4 = 0

因僅 x₄ 為 free variable, 令 x₄= t, 代入第三 row 得 x3= t. 代入第二 row 得 x2=−3t. 最後 由第一 row 得 x₁= 0. 故知解為 (x₁, x₂, x₃, x₄) = (0,−3t,t,t) = t(0,−3,1,1),t ∈ R.

我們知道每個矩陣皆可經由 elementary row operations 化為 echelon form. 而我們又知每個 echelon form 也可利用 elementary row operations 化為 reduced echelon form. 因此每個矩陣皆可利用 elementary row operations 化為 reduced echelon form. 另外我們也知道將聯立方程組的 augmented matrix 做 elementary row operations 後所對應的聯立方程組會是 equivalent, 所以化為 reduced echelon form 所得的解集合也會和原方程組的解集合相同.

化成 reduced echelon form 雖然在最後可以很快地看出解的形式, 但一般來說化為 reduced echelon form 比僅化為 echelon form 所需的步驟多了許多, 所以利用 echelon form 來求解還是會比較快. 利用 echelon form 求解的方法一般稱為 Gauss method 或 Gaussian elimination, 而用 reduced echelon form 求解一般稱為 Gauss-Jordan method.

Example 1.3.7. Example 1.2.2 的 linear system, 化成 echelon form 後為



 2 3 −1 7 0 1 −3 −5 0 0 −3 −9



.

(8)

將第三 row 乘以−1/3 得 

 2 3 −1 7 0 1 −3 −5 0 0 1 3



.

再將第三 row 分別乘以 3, 1 加到第二, 第一 row 得



 2 3 0 10 0 1 0 4 0 0 1 3



.

接著將第二 row 乘以 −3 加到第一 row 得



 2 0 0 −2 0 1 0 4 0 0 1 3



.

最後將第一 row 乘以 1/2 得 reduced echelon form



 1 0 0 −1 0 1 0 4 0 0 1 3



,

且馬上看出解為 (x₁, x2, x3) = (−1,4,3).

Example 1.2.4 的 linear system, 化成 echelon form 後為







1 −2 1 −1 4

0 1 2 −1 −9

0 0 0 0 0 0 0 0 0 0





.

將第二 row 乘以 2 加到第一 row 得 reduced echelon form







1 0 5 −3 −14 0 1 2 −1 −9 0 0 0 0 0 0 0 0 0 0





.

因 x₄, x₃ 為 free variables, 令 x₄= r, x₃= s, 代入第二 row 得 x₂=−9 + r − 2s. 再代入第一

row 得 x1=−14 + 3r − 5s. ♯

我們可以套用 Proposition 1.3.6 的證明方法, 證明一個矩陣利用 elementary row operations 化為 reduced echelon form 其結果是唯一的.

Theorem 1.3.8. 給定一矩陣 A, 若 A1, A₂ 均為 A 利用 elementary row operations 化成的 reduced echelon forms, 則 A1= A2.

Proof. 我們考慮 Ax = 0 這一組聯立方程組, 依假設聯立方程組 A₁x = 0 和 A₂x = 0 皆與聯 立方程組 Ax = 0 有同樣的解.

利用反證法. 假設 A₁̸= A2 且假設從下往上, A₁, A₂ 第一個發生相異的 row 其 pivot variable 為 xk (注意由 Proposition 1.3.6, 我們知道 A1, A2 的 pivot variables 是一致的). 現 假設 A₁, A₂ 在此 row 所對應的方程式分別為

(9)

xk+ a_k+1xk+1+··· + anxn= 0 與 x_k+ b_k+1xk+1+··· + bnxn= 0 (1.2) 其中存在 l 滿足 k + 1≤ l ≤ n 且 al ̸= bl. 若 xl 為 pivot variable, 由於 A₁, A₂ 皆為 reduced echelon form, 在這個 row 中, 其他的 pivot variable 對應的係數應為 0, 而導致 a_l = b_l = 0 之矛盾, 故知 x_l 應為 free variable. 我們已知給定一組 free variables 的值, 可以用由下往 上代回的方式得到聯立方程組的解. 現考慮除了 x_l 這一個 free variable 代 1, 其他 free variables 代 0 所得的解. 設依此所得 A₁x = 0 與 A₂x = 0 的解分別為 (x₁, . . . , x_n) = (c₁, . . . , c_n) 與 (x₁, . . . , x_n) = (d₁, . . . , d_n). 注意, 若 x_j 為 pivot variable, 其中 j > k, 則 a_j= b_j= 0, 所以此 時 x_j 的取值不會影響到 x_k 的取值, 也就是說式子 (1.2) 帶入這兩組解後分別為

c_k+ a_l= 0 與 d_k+ b_l= 0.

又由於依假設 A₁, A2 在 x_k 為 pivot 這一個 row 以下的每一個 row 都一致, 我們知對所 有 k + 1≤ i ≤ n 皆有 ci= d_i. 然而這兩組解皆為 Ax = 0 的解且 x_k 為 pivot variable, 故 由 Lemma 1.3.3 知 c_k= dk. 可得 al =−ck=−dk= bl. 此與 al ̸= bl 的假設相矛盾, 故知

A₁= A₂.

利用化成 reduced echelon form 來解 linear system, 雖然步驟較多, 不過仍然有它的好處. 例如因為化成 echelon form 並不唯一, 所以有可能同一組 linear system 因化成 echelon form 求解, 寫下來的解集合的元素的表現 “形式” 會不同 (只是形式不同, 解集合是一樣的). 若化成 reduced echelon form 就不會這樣了, 因為它是唯一的, 所以大家寫下來的解集合的元素表示的 “形式” 是一致的. 另外若要判斷兩個矩陣是否可以用一些 elementary row operations 將其中一個換成另一個, 將這兩個矩陣化成 reduced echelon form 就可以了. 若它們化成 reduced echelon form 是一致的, 那當然表示它們是可以用一些 elementary row operations 將其中一個換成另一個, 而若不一致, 則由唯一性可知它們不可能用一些 elementary row operations 將其中一個換成另一個.

Question 1.6. 假設矩陣 A, B 分別可利用 elementary row operations 化成 reduced echelon form A^′, B^′ 試說明 A 可利用 elementary row operations 化成 B 若且唯若 A^′= B^′.

在本章中我們學習解聯立方程組的技巧. 利用 elementary row operations 將 augmented matrix 中的係數矩陣化為 echelon form 後, 我們很快的可以知道此聯立方程組是否有解, 而有解時也可利用此 echelon form 完整的得到此聯立方程組所有的解. 由 echelon form 的解法我們了解到 pivot variables 和 free variables 對聯立方程組是否有解以及解是否唯一有著重要的關連. 本章中有關聯立方程組的理論對後面線性代數理論的建立影響深遠, 千萬不要以為會解具體的聯立方程組就可以了, 而忽視這些理論.

———————————– 23 September, 2022

我們是對矩陣的 row 的個數作數學 歸納法

我們是對矩陣的 row 的個數作數學歸納法