談加減消去法
林琦焜
『如果我們想要預見數學的將來, 適當的途徑是研究這門學問的歷史與現狀。』
— H. Poincar´e (1854-1912) —
『 人一代一代過去, 但他們的心靈依舊。 我們若夠聰明, 也應該從這些詩章中獲得 無限的安慰。 我們今天所受的苦, 在我們之前的人早已受過, 我們後來的人仍舊要 受。 曾教已死去千年的人獲得新希望的事物, 有一天也能給今天尚未出生的人新的 勇氣。』
— 聖經的故事, 房龍 (1882-1944) —
1. 矩陣與座 標變換
從歷史上來說, 線性代數的第一個工作就是解聯立方程組, 首先讓我們從一熟悉的例子著 手:
例題1.1. (二元一次聯立方程組)
2x + 3y = 1 x+ 2y = 4
在國中階段, 我們已學到關於解這題目的方法有 “代入消去法” 與 “加減消去法”, 各位記 憶猶新, 當然知道如何求得 “答案”, 但我的重點並不在於 “答案” 是多少, 許多時候我們為求
“答案” 不擇手段, 因此將努力的過程疏忽了。 但常常記得在生命的成長中, 有時候 “過程” 遠 比 “答案” 來得有價值且更有意義。 過一會我們將從 “加減消去法” 談起, 並在這當中引入 “矩 陣 (matrix)” 的概念, 將我們思考的過程以矩陣這新的語言表達出來。
38
首先例題 1.1 可以改寫成向量的形式
2x + 3y x+ 2y
=
1 4
或藉由內積 (inner product) 表示為
(2, 3) · (x, y) (1, 2) · (x, y)
=
2 3 1 2
x y
=
1 4
這相當於說矩陣乘法的內在本質是內積, 另外我們將它寫成一般式 AX = C
因此將問題轉化為矩陣形式之一元一次方程式的問題, 如果 A
− 1
存在, 則其解為 X = A− 1
C。所以現在當務之急是關於一個矩陣 A 如何定義它的 反矩陣 A
− 1
。 在此我們並不打算給諸位一 個抽象的定義, 就讓我們從實際求解過程中去體會個中滋味。 其實整個求解的過程, 其目的就是“反元素” 的問題。
(1)
2x + 3y = 1
x+ 2y = 4 ←→
2 3 1 21 4
(2)
2x + 3y = 1
2x + 4y = 8 ←→
2 3 2 41 8
(3)
2x + 3y = 1
−y = −7 ←→
2 3 0 −11
−7
(4)
2x + 3y = 1
y= 7 ←→
2 3 0 11 7
(5)
2x = −20
y = 7 ←→
2 0 0 1−20 7
(6)
x= −10
y= 7 ←→
1 0 0 1−10 7
容我在此解釋一二, 第一與第二個聯立方程組之間的關係如下:
1 0 0 2
2 3 1 21 4
===
2 3 2 41 8
(1) (2)
依此類推:
(1) (2)
1 0 0 2
2 3 1 21 4
===
2 3 2 41 8
E
1
(2) (3)
1 0 1 −1
2 3 2 41 8
===
2 3 0 −11
−7
E
2
(3) (4)
1 0 0 −1
2 3 0 −11 7
===
2 3 0 11 7
E
3
(4) (5)
1 −3 0 1
2 3 2 41 8
===
2 0 0 11
−7
E
4
(5) (6)
1 2
0 0 1
2 0 0 1−20 7
===
1 0 0 1−10 7
E
5
1 2
0 0 1
1 −3 0 1
1 0 0 −1
1 0 1 −1
1 0 0 2
2 3 1 21 4
=
1 0 0 1−10 7
E
5
E4
E3
E2
E1
| {z }
B
計算過程也告訴我們
B = E
5
E4
E3
E2
E1
=
2 3 1 2
− 1
其中矩陣 E
i
, i = 1, . . . , 5 的代數意義如下, 隨後我將解釋它的幾何意義。E
1
=
1 0 0 2
←→
1 × 第一列 + 0 × 第二列 0 × 第一列 + 2 × 第二列
E
2
=
1 0 1 −1
←→
1 × 第一列 + 0 × 第二列 1 × 第一列 − 1 × 第二列 E
3
=
1 0 0 −1
←→
1 × 第一列 + 0 × 第二列 0 × 第一列 − 1 × 第二列 E
4
=
1 −3 0 1
←→
1 × 第一列 − 3 × 第二列 0 × 第一列 + 1 × 第二列 E
5
=
1
2
00 1
←→
1
2
× 第一列 + 0 × 第二列 0 × 第一列 + 1 × 第二列 引理1.2. 所有 2 × 2 矩陣的基本矩陣如下:H
12
=
0 1 1 0
M1
=
c 0 0 1
M2
=
1 0 0 c
F
12
=
1 0 d 1
F21
=
1 d 0 1
其中 c, d 為實數。
我們可以實際代入平面上任何一點 (x, y) 看看這些基本矩陣的幾何意義。
H
12
:
0 1 1 0
x y
=
y x
H
12
將平面上任一點 (x, y) 變換為 (y, x), 因此實際上是一個對 45◦
角的 “鏡射”。 (如圖)M
1
:
c 0 0 1
x y
=
cx y
M
1
是以 y 軸為基準線的 c 倍橫向伸縮, 同理 M2
則是以 x 軸為基準線的 c 倍縱向伸縮。F
21
:
1 d 0 1
x y
=
x+ dy y
F
21
是依 x 軸方向的 d 倍 y 分量 (數值) 之推移 (shear), 同理 F12
則是依 y 軸方向的 d 倍 x 分量 (數值) 之推移。若讀者有興趣的話, 可以驗證以上這些矩陣有兩大特性:
(1) T (a~v) = aT (~v) (保持直線)
(2) T (~v + ~w) = T (~v) + T ( ~w) (保持平行四邊形) 此二者合而為一得
(3) T (a~v + b ~w) = aT (~v) + bT ( ~w)
我們將具有這些性質的 T 稱為 “線性變換 (linear transformation)”, 意思是: 先加減之後再 作用等於先作用之後再加減, 就是物理學的疊加(重疊) 原理(principle of superposition)。
線性變換是線性代數的主角, 在數學的領域也佔一席 (極重要) 之地。 我想線性變換就簡 介至此, 若讀者有興趣, 等上大學後再好好修這門學問 — 線性代數。
現在還是讓我們回到我們的主航道 — 求解的問題上面來。
我們已經介紹了 “基本矩陣” 的概念及其本身所代表的列運算, 與幾何的意義。 它同時可 以幫我們求反矩陣, 試以一例題來說明:
例題1.3. 計算矩陣 A =
2 −1 1 3
之反矩陣
2 −1 1 3y
1
y2
E1
=
0 1 1 0
1 3 2 −1y
2
y1
−−−−−−−−−−−−→
E
2
=
1 0−2 1
1 3 0 −7y
2
y1
− 2y2
−−−−−−−−−−−−→
E
3
=
1 0 0 −1 7
1 3 0 1y
2
−
1 7
(y1
− 2y2
)
−−−−−−−−−−−−→
E
4
=
1 −3 0 1
1 0 0 11
7
(y2
+ 3y1
)1
7
(2y2
− y1
)
−−−−−−−−−−−−→
其中第四行最後一項可改寫為
1
7
(y2
+ 3y1
)1
7
(2y2
− y1
)
==
3 7
1 7
−
1 7 2 7
y
1
y2
,因此 A
− 1
=
3 7
1 7
−
1 7 2 7
=1 7
3 1−1 2
。 另外直接計算可得A
− 1
= E4
· E3
· E2
· E1
各位若眼尖的話, 在反矩陣 A
− 1
中有一特色, 即在 A− 1
的諸項其分母都是7, 其實這個數 是有意義的。 容我以一般的矩陣來看看這件事實。例題1.4. 給定 A =
a b c d
是任意 2 × 2 矩陣, 若 ad − bc 6= 0 則其反矩陣 A− 1
為A
− 1
=
d
∆
−∆ b
−
∆ c ∆ a
= 1∆
d −b
−c a
其中 ∆ =
a b c d
= ad − bc, 稱為 A 的行列式 (determinant), 記為 det A = |A|。
行列式在解聯立方程組, 反矩陣,. . . 等皆扮演著重要的角色。 其重要性質如下:
引理1.5.
(I) det(AB) = |AB| = |A||B| = (det A)(det B), (II) det I = |I| = 1, I : 單位矩陣,
(III) det A = |A| 6= 0 若且唯若 A
− 1
存在, 由 (I), (II) 可導出(IV) det(A
− 1
) = |A− 1
| = |A|− 1
=det A 1
。例題 1.4 所給反矩陣之形式也透露了, 解二元一次方程組的秘密:
d −b
−c a
←→
d× 第一列 − b × 第二列 (消去第一列之 y 項)
−c × 第一列 + a × 第二列 (消去第二列之 x 項) 定理1.6. (克拉瑪公式)
若 ∆ =
a b c d
= ad − bc 6= 0, 則二元一次聯立方程組
ax+ by = f cx+ dy = g 恰有一組解
x= ∆
x
∆ =
f b g d
a b c d
, y = ∆
y
∆ =
a f c g
a b c d
當然由克拉瑪公式也可以得出反矩陣 A
− 1
x y
= 1∆
f b g d
a f c g
= 1
∆
f d− bg ag− f c
= 1
∆
(d, −b) · (f, g) (−c, a) · (f, g)
= 1∆
d −b
−c a
f g
所以 A
− 1
=∆ 1
d −b
−c a
。矩陣另一個應用是與二次型之關係, 藉由內積可表示如下:
(1) x
2
+ y2
= (x, y) · (x, y) = [x, y]1×2
x y
2×1
= [x, y]
1 0 0 1
x y
←→
1 0 0 1
同理
(2) ax
2
+ by2
= (x, y) · (ax, by) = [x, y]
ax by
= [x, y]
a 0 0 b
x y
←→
a 0 0 b
(3) ax
2
+ 2bxy + cy2
= (x, y) · (ax + by, bx + cy) = [x, y]
ax+ by bx+ cy
= [x, y]
a b b c
x y
←→
a b b c
若我們所碰到的是非齊次的 (包含一次項與常數項), 一樣可利用矩陣來表達
(4) ax
2
+ cy2
+ 2dx + 2ey + f = [x, y, 1]
a 0 d 0 c e d e f
x y 1
(5) ax
2
+ 2bxy + cy2
+ 2dx + 2ey + f = [x, y, 1]
a b d b c e d e f
x y 1
談到二次多項式, 當然要提一提配方法。
ax
2
+ cy2
+ 2dx + 2ey + f= a(x + d
a)
2
+ c(y +ec)
2
+ 1ac(acf − cd
2
− ae2
) (⋆)= a(x + d
a)
2
+ac a (y +ec)
2
+ 1ac(acf − cd
2
− ae2
) 令∆
1
= a, ∆2
=a 0 0 c
= ac,
∆
3
=a 0 d 0 c e d e f
= acf − cd
2
− ae2
因此 (⋆) 可寫成
ax
2
+ cy2
+ 2dx + 2ey + f = ∆1
(x +da)
2
+∆2
∆
1
(y +e
c)
2
+ ∆3
∆
2
a 0 d 0 c e d e f
a b d b c e d e f
同理對 (5) 亦有相似的結果
ax
2
+ 2bxy + cy2
+ 2dx + 2ey + f= a(x + b
ay)
2
+ ac− b2
a y
2
+ 2d(x + bay) + 2(ae − bd) a y+ f
= a(x + b ay+ d
a)
2
+ac− b2
a (y + ae− bd
ac− b
2
)2
+ (f − d2
a − (ae − bd)
2
a(ac − b2
))= ∆
1
(x + b ay+da)
2
+ ∆2
∆
1
(y + ae− bd
ac− b
2
)2
+ ∆3
∆
2
其中
∆
1
= a, ∆2
=a b b c
= ac − b
2
,∆
3
=a b d b c e d e f
= acf + 2bed − cd
2
− ae2
− b2
f2. 加 減消去法之幾何意義
在中學所學關於二元一次聯立方程組的解法基本上有代入消去法與加減消去法, 我們在此 討論加減消去法並探討其幾何意義: 給定 x − y 平面上任意兩條直線
L
1
: a11
x+ a12
y= b1
, a11
, a12
, b1
∈R
(2.1) L2
: a21
x+ a22
y= b2
, a21
, a22
, b2
∈R
(2.2) 則加減消去法告訴我們由這兩條直線可得第三條直線 L3
:L
3
: ℓ1
(a11
x+ a12
y− b1
) + ℓ2
(a21
x+ a22
y− b2
) = 0, (2.3) 其中 ℓ1
, ℓ2
∈R
。 L3
代表什麼呢? 首先假設直線 L
1
, L2
有共同交點 (x0
, y0
), 因 為 ℓ1
, ℓ2
為任意實數, 因此直線 L3
表示通 過 (x0
, y0
) 之任意直線, 在此任意的意思是 指斜率為任意的 (如圖所表示)。 而加減消去 法的目的主要是將 x 項或 y 項的係數消去, 意思是在所有這些通過 (x0
, y0
) 之直線中找 出一條水平的直線 y = y0
, 而另一條是垂直 的直線 x = x0
, 換句話說, 就是找出其 y 軸 與 x 軸之投影。.
...
. .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. . .. .. . ... .. . .. .. . .. .. .. .
.
... . .. . .. .. .. . .. .. .. .. .. .. . .. .. .. . .. .. .. .. .. . .. .. .. .. .. . .. .. .. . .. .. .. .. .. .. . .. .. .. . .. .. .. .. .. .. . .. .. .. .. . .. .. .. . .. .. .. .. .. .. . .. .. .. . .. .. .. .. .. .. . .. .. .. .. . .. .. .. .. . .. .. .. .. .. . .. .. .. . .. .. .. .. .. .. . .. .. .. .. . .. .. .. .. .. . .. .. .. .. . .. .. .. .. . .. .. .. .. .. . .. .. .. .. . .. .. .. .. .. . .. .. .. .. . .. .. .. .. .. . .. .. .. .. . .. .. .. .. . .. .. .. .. .. . .. .. .. .. . .. .. .. .. .. .. . .. .. .. . .. .. .. .. .
...
x y
x 0
y 0 (x
0, y
0)
L 1
L 2
L 3
... .. .. . .. .. . .. . .. .. .. . .. .. . . .. .. .. . .. .. . . .. .. .. . .. .. .. . ..
.
... .
.. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. . .. ... .. .. . .. . .. .. .. .
x y
. .. .. .. . .. .. . .. .. .. . .. .. .. . .. .. . .. .. .. .. . .. .. . .. .. .. . .. .. . .. .. .. .. . .. .. . .. .. .. . .. .. .. . .. .. .. . .. .. .. . .. .. . .. .. .. .. . .. . .. .. .. .. . .. .. . .. .. .. . .. .. .. . .. .. .. . .. .. .. . .. .. . .. .. .. .. . .. .. . .. .. .. . .. .. . .. .. .. .. . .. .. . .. .. .. . .. .. . .. .. .. . .. .. .. . .. .. .. . .. .. .. . .. .. . .. .. .. .. . .. .. . .. .. .. . .. .. . .. .. .. .. . .. .. . .. .. .. . .. .. .. . .. .. . .. .. .. .. . .. .. . .. .. .. . .. .
.. . . .. . .. . . .. . . .. . . .. . . .. . .. . . .. . . .. . . .. . .. . . .. . . .. . . .. . . .. . .. . . .. . .. . . .. . . .. . . .. . . .. . .. . . .. . .. . . . .. . .. . . .. . .. . . .. . . .. . . .. . . .. . .. . . .. . . .. . . .. . .. . . .. . . .. . .. . . .. . . .. . . .. . .. . . .. . . .. . . .. . . .. . .. . . .. . .. . . .. . . .. . . .. . .. . . .. . . .. . . .. . . .. . .. . . .. . .. . . .. . . .. . . .. . . .. . .. . . .. . . .. . . .. . .. . . .. . .. . . .. . . . .. . .. . . .. . .. . . .. . . .. . . .. . .. . . .. . . .. . .. . . . .. . .. . . .. . .. . . .. . . .. . . .. . . .. . .. . . .. . . .. . . .
(1, 1)
x+2y = 3
x+y = 2
.
... .
.. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. . . .. .. .. . .. ... . .. .. .. . .. .. . ..
x y
...
. .. . . .. . .. . . .. . . .. . .. . . . .. . .. . . .. . .. . . .. . . .. . . .. . . .. . .. . . .. . . .. . . .. . .. . . .. . .. . . .. . . .. . . .. . . .. . .. . . .. . . .. . . .. . .. . . .. . . .. . .. . . .. . . .. . . .. . .. . . .. . . .. . . .. . . .. . .. . . .. . .. . . .. . . .. . . .. . .. . . .. . . .. . . .. . . .. . .. . . .. . .. . . .. . . .. . . .. . . .. . .. . . .. . . .. . . .. . .. . . .. . .. . . . .. . . .. . .. . . .. . .. . . .. . . .. . . .. . .. . . .. . . .. . . .. . . .. . .. . . .. . .. . . .. . . .. . . .. . . .. . .. . . .. . . .. . . .. . .. . . .. . .. . . .. . . .. . . .. . . .. . .. . . .
x+2y = 3 y = 1
...
.. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. .. .. . .. ... .. .. .. . .. .. . .. .
x y
...
. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. . .. .. . .. .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. ..
x = 1
y = 1
我們可以說得更具體, 舉個例子:
x+ 2y = 3 x+ y = 2
這個聯立方程組代表 x + 2y = 3 與 x + y = 2 兩條直線, 聯立方程組的解 (1, 1) 正是其 交點, 經由加減消去法化為
x+ 2y = 3 y= 1
這相當於將直線x + y = 2以交點 (1, 1) 為 定點 (或圓心) 旋轉至 y = 1, 因此得到 y 軸 之投影, 此時第一個方程式固定不動 (就是第 一列不動), 再一次加減消去法
(將 y = 1 固定) 得
x = 1 y= 1
同樣的步驟是將直線 y = 1 固定, 而將 x + 2y = 3 旋轉至 x = 1 這條直線 (x 軸之投
影), 直線之交點始終是固定不動, 最後之投影當然是交點之 x 軸, y 軸座標。
3. 固有值之來源
由加減消去法也可以自然而然引進固有值 (eigenvalue) 這個觀念
a
11
x1
+ a12
x2
= c1
(3.1) a21
x1
+ a22
x2
= c2
(3.2)
k× (3.1) + (3.2) 得
kc
1
+ c2
= (ka12
+ a22
)ka
11
+ a21
ka
12
+ a22
x
1
+ x2
(3.3)↑ ↑
(3.1), (3.2) 這個聯立方程組可視為平面坐標之變換 (transformation), 將 (x
1
, x2
) 變換到 (c1
, c2
), 在我們腦海中思索的是: 將 kx1
+ x2
變換為 kc1
+ c2
, 然而新舊兩者成固定之比例, 即兩者成等比數列。 如果要求加減消去法中所乘之常數 k 滿足 (由 (3.3) 式)k= ka
11
+ a21
ka
12
+ a22
. (3.4)
為此, 令
λ= ka
12
+ a22
, (3.5) 則 (3.3) 告訴我們左右兩式成比例且比例常數等於 λ, 這個 λ 值就是固有值 (eigenvalue)。 為 何會稱固有值? 顧名思義就是不變 (invariant) 的意思, 實際上因為 λ 是一個固定的比例常數, 所以是一個不變量。 由 (3.5) 得k = λ− a
22
a
12
; (3.6)代回 (3.4)
λ− a
22
a
12
=λ−a
22a
12 a11
+ a21
λ .
整理得
λ(λ − a
22
) = (λ − a22
)a11
+ a21
a12
, (λ − a11
)(λ − a22
) − a21
a12
= 0.再刻意寫成行列式的形式
λ
2
− (a11
+ a22
)λ + (a11
a22
− a21
a12
) =λ− a
11
a12
a21
λ− a22
= 0 (3.7)
我們稱這個二次多項式方程式為特徵方程式。 若考慮更一般的情形 (N 元一次方程組), 則是 N 次多項式方程式
det(λI − A) = 0, (3.8)
其中 I 是 N × N 單位矩陣而 A 是任意 N × N 矩陣。 在線性代數我們就稱滿足這個特徵方 程式的根 λ 為矩陣 A 之固有值。
假設二次方程式 (3.7) 有兩個相異實根 λ
1
, λ2
, 則對應的 k1
, k2
為 k1
= λ1
− a22
a
12
, k2
= λ2
− a22
a
12
. (3.9)所以聯立方程組 (3.1) (3.2) 轉換為
λ
1
(k1
x1
+ x2
) = k1
c1
+ c2
, (3.10) λ2
(k2
x1
+ x2
) = k2
c1
+ c2
. (3.11) 這是一個完全分離形式的聯立方程組λ
1
y1
= d1
, λ2
y2
= d2
(3.12) 其中y
1
= k1
x1
+ x2
, d1
= k1
c1
+ c2
y
2
= k2
x1
+ x2
, d2
= k2
c1
+ c2
(3.13) 整個解聯立方程組的問題可利用固有值為之:(λ
1
, λ2
) =⇒ (k1
, k2
) =⇒ (y1
, y2
) =⇒ (x1
, x2
) 因為假設 λ1
, λ2
為特徵方程式 (3.7) 的兩個根, 則由根與係數之關係得λ
1
+ λ2
= a11
+ a22
= tr A,λ
1
λ2
= a11
a22
− a12
a21
= det A, (3.14) 其中 trA = tr
a11
a12
a21
a22
= a11
+ a22
是矩陣 A 之跡 (trace), 即對角線各項元素的和, 所 以特徵方程式 (3.7) 可改寫為λ
2
− (trA)λ + detA = 0 (3.15) 因為對於給定的矩陣 A 其固有值 λ 是不變量, 所以 tr A, det A 也是不變量。這個過程就是對角化, 我們將 (3.1), (3.2) 與 (3.12) 一起作比較
a
11
x1
+ a12
x2
= c1
a
21
x1
+ a22
x2
= c2
←→
λ
1
y1
= d1
λ
2
y2
= d2
AX = C ←→ ΛY = D 我們想問的是矩陣 A 與對角矩陣 Λ 之間的關係
A=
a
11
a12
a21
a22
←→ Λ =
λ
1
0 0 λ2
由 (3.13) 得
Y = QX, D= QC.
令 Q =
k
1
1 k2
1
, 則X = P Y, C = P D, 其中 P = Q
− 1
=
1 k
1− k
2− 1 k
1− k
2− k
2k
1− k
2k
1k
1− k
2
代回聯立方程組可得
AP Y = P D =⇒ P
− 1
AP Y = D =⇒ P− 1
AP = Λ A可以化為對角矩陣Λ, 這就是之前所聲稱的對角化。 事實上直接計算可得AP = 1 k
1
− k2
a
11
a12
a21
a22
1 −1−k
2
k1
= 1 k
1
− k2
a
11
− k2
a12
−a11
+ k1
a12
a21
− k2
a22
−a21
+ k1
a22
a
22
= λ1
− k1
a12
= λ
2
− k2
a12
= 1 k
1
− k2
a
11
− (λ2
− a22
) −a11
+ λ1
− a22
a
21
− k2
(λ1
− k1
a12
) −a21
+ k1
(λ2
− k2
a12
)
(a11
+a22
= λ1
+λ2
)= 1 k
1
− k2
λ
1
−λ2
−k
2
λ1
k1
λ2
∵
a12
k2
+ (a22
− a11
)k − a21
= 0 k1
k2
= −a a
2112
= P
λ
1
0 0 λ2
令
X
1
=
1 k
1− k
2− k
2k
1− k
2
, X2
=
− 1 k
1− k
2k
1k
1− k
2
則
AX
1
= λ1
X1
, AX2
= λ2
X2
X
1
, X2
就是固有值 λ1
, λ2
所對應的固有向量 (eigenvector), 由於 det (A−λ1
I) = det(A−λ
2
I) = 0 所以 X1
, X2
並不是唯一解 (實際上是無窮多解!), 有了固有值、 固有向量, 對角化 可以看得更清楚;AP = A[X
1
, X2
] = [AX1
, AX2
]= [λ
1
X1
, λ2
X2
] = [X1
, X2
]
λ
1
0 0 λ2
= P Λ4. 微分 方程
我們也可以運用加減消去法的觀念來解微分方程
x
′ 1
= 5x1
+ 3x2
x
′ 2
= −6x1
− 4x2
經由加減消去法上式可化為
x
′ 1
+ kx′ 2
= (5 − 6k)x
1
+3 − 4k5 − 6kx
2
(4.1)↑ ↑
隱藏在加減消去法之背後是等比數列之概念, 所謂成比例就是等號左右兩邊是線性關係。 我們 希望這個新的方程式 (4.1) 兩邊成比例, 因此必須
k = 3 − 4k
5 − 6k =⇒ 2k
2
− 3k + 1 = 0 解此方程式得 k = 1,1 2
。 代回 (4.1) 得
x
′ 1
+ x′ 2
= (x1
+ x2
)′
= −(x1
+ x2
) x′ 1
+1 2
x′ 2
= (x1
+1 2
x2
)′
= 2(x1
+1 2
x2
) 令 y1
= x1
+ x2
, y2
= x1
+1 2
x2
, 則
y
′ 1
= −y1
y
2 ′
= 2y2
=⇒
y
1
= c1
e− t
y2
= c2
e2t
右邊兩個常數 −1, 2 正是固有值, 也就是說 (4.1) 中的 (5 − 6k) 是固有值。 藉由加減消去法, 可以將原先 x
1
, x2
彼此互相糾纏在一起的方程式, 化為 y1
, y2
彼此沒有影響的方程式, 這個 動作在線性代數稱為對角化 (diagonalization) 。仿第三節, 得關係式
X
′
= AX ←→ Y′
= ΛY 其中A =
5 3−6 −4
, Λ =
−1 0 0 2
, X =
x1
x2
, Y =
y1
y2
而且 P
− 1
AP = Λ, 其中X = P Y, P =
1 1 11 2
− 1
=
−1 2 2 −2
−1, 2 正是矩陣 A 之固有值, 矩陣 P 的兩個行向量
−1 2
,
2−2
則是分別對應固有值 −1, 2 的固有向量。加減消去法也可以應用到聯立偏微分方程組, 特別是氣體動力學, 從而引介出著名的 Rie- mann invariant 這個重要的工具, 這是德國數學家 B. Riemann (1826-1866) 對數學的貢獻 之一, 有興趣的讀者可參閱與偏微分方程相關的書藉。
—本文作者任教於國立成功大學數學系—