• 沒有找到結果。

定性線性系統導論

N/A
N/A
Protected

Academic year: 2022

Share "定性線性系統導論"

Copied!
14
0
0

加載中.... (立即查看全文)

全文

(1)

定性線性系統導論

譚必信

1. 前言

經濟學家 Paul Samuelson 於 1947 年在他的經典名著 Foundations of Eco- nomic Analysis[19]建議研究線性系統的定 性。 自那時候開始, 不少經濟學家、 數學家、

計算機科學家、 環境學家及化學家投入這方 面的研究。 特別的, 他們是注重符號可解性及 符號穩定性這兩方面的問題。 本文的目的是 介紹前者的問題。

簡單來說, 所謂一個線性系統 (即線性 方程組) Ax = b 為符號可解是指它的可解 性及它的解向量的符號型是由矩陣 A 及向 量 b 的符號型來決定。 為了能說得明確, 讓 我們先引入一些符號。 實數 a 的符號是記作 sgn(a) ; sgn(a) 是等於 −, 0 或 +, 視 乎 a 為負、 零或正。 (為了方便, 有時候我們 用 −1 及 1 來代替 − 及 + 。) 對任一實 m × n 矩陣 A, 我們以 Q(A) 表示由所有 俱有 A 的符號型的實 m × n 矩陣構成的 集合; 換言之, B ∈ Q(A) 若且唯若對所有 i, j, sgn(bij) = sgn(aij) 。 我們稱線性系統 Ax = b 為符號可解 (sign-solvable) 若這系

統為可解, 且對任意 B ∈ Q(A), c ∈ Q(b), 系統 By = c 亦為可解且 y ∈ Q(x) 。

線性系統符號可解性的第一個基本問題 自然為找出符號可解的等價條件。 第一個問 題解決以後, 值得研究的題目包括找出有效 的判別算則及找出產生符號可解線性系統的 方法。 第一個問題目前已獲得完全解決, 在本 文我們將作比較詳細的介紹。 後面的兩個問 題是相當困難, 且目前尚未完全獲得解決, 限 於篇幅及筆者的學識, 在本文只是點到即止。

這裡我們需用到的工具主要是圖論 (在 研究判別算則時, 凸集合理論及命題邏輯都 是重要的工具, 但本文將不會接觸到這些)。

藉著這個機會, 在本文的第三節, 我們將介紹 行列式的圖論表示法。 Brualdi在論文 [2]曾 指出, 矩陣理論及組合學有一個共生的關係, 而產生這關係的緣由最少一部份可歸諸為矩 陣理論有很大部份與行列式有關 (因為重要 的概念如秩、 特徵值等都可利用行列式來定 義), 但行列式卻有一個圖論表示法。 這個表 示法是很有用處且並不難學習。 可惜的是, 在 大學部的線性代數課程通常都不會教到。

在下一節我們將舉一例子以說明定性分 析如何在實際問題上可派上用場。

1

(2)

2. 一個比較靜態分析的實例

考慮一個單一商品的市場。 假設該商品 的需求量 Qd 為價格 p 及入息 y 的函數。 另 一方面, 我們假設商品的供應量 Qs 只是價 格的函數。 此時市場的剩餘需求函數 E 滿足 方程:

E(p, y) = Qd(p, y) − Qs(p)。

譬如 p = p0, y = y0 為市場的平衡點; 即 E(p0, y0) = 0 。 假設入息參數 y 在 y = y0

附近作微少變動時, 市場可以保持平衡。 經濟 學家所希望知道的為價格 p 應如何隨著 y 的變化而作調整才能夠保持市場的平衡。 像 這樣子的, 就是比較靜態分析 (comparative statics) 的一個基本問題。

這裡我們需用到的數學工具為隱函數存 在定理。 是很合理假設需求量 Qd 是入息 y 的增函數及價格 p 的減函數。 另一方面, 我 們又假設供應量 Qs 是價格 p 的增函數。 換 言之, 我們有:

∂Qd/∂p < 0, ∂Qd/∂y > 0, dQs/dp > 0。

所以, ∂E/∂p = ∂Qd/∂p − dQs/dp < 0

。 根據隱函數存在定理, 在 y = y0 的鄰 域, 存在函數 p(y) 使得 p(y0) = p0 且 E(p(y), y) = 0 。 函數 p(y) 的導數可利用 隱函數微分法求得:

∂E

∂p dp dy +∂E

∂y = 0, dp

dy = −∂E/∂y

∂E/∂p > 0。

這個不等式告訴我們價格 p 應該隨著入息 y 增加而增加纔可以保持市場的平衡!

以上的例子很難說服大家採用定性方法 的好處, 因為它的結論並不令人驚奇, 這只是 普通常識。 但當我們所考慮的經濟系統是涉 及多個商品及剩餘需求函數時, 普通常識或 直覺感就不那麼可靠。 在這裡不打算討論一 般的情形, 讀者不難想像方法及問題基本上 是一樣的, 祇是我們需要多變數的隱函數存 在定理及採用矩陣的表示法。

定性分析的方法對很多門應用科學都有 它的實用價值。 特別的, 當資料不能準確 (或 無法) 量化時, 能預測改變的方向總勝不能作 任何預測。

3. 行列式與迴路乘積

設 A = (aij) 為一 n 階方陣。 以 D(A) 表示 A 的有向圖; 換言之, D(A) 的頂點集合為 hni := {1, 2, · · · , n} 及存 在一弧從 i 至 j, 記之以 (i, j), 若且唯 若aij 6= 0 . 所謂D(A) 的 (簡單) 路徑 是指在 D(A) 中經過相異頂點的一序列相 接的邊; 即如 (i1, i2), (i2, i3), · · · , (il, il+1) (l ≥ 1) 為 D(A) 的弧, 且 i1, · · · , il+1 為相 異的頂點。 若 (i1, i2), (i2, i3), · · · , (il, il+1) 為 D(A) 的弧, i1, · · · , il 為相異, 且 il+1 = i1, 則我們得到 D(A) 的一迴路。 路徑或迴 路通常都記之以希臘字母 α, β, γ, · · · , 等。

若 α : (i1, i2), (i2, i3), · · · , (il, il+1) 為 D(A) 的一路徑, 則 A 相對 α 的路徑乘積 是指矩陣 A 中對應 α 的邊之元的乘積, 即

(3)

ai1i2ai2i3· · · ailil+1, 並記之為 Πα(A) 。 類似 的我們也可以定義迴路乘積, 並以相同的符 號表示。 例如, 若 α 為迴路 (1, 4), (4, 3), (3, 2), (2, 1), 則 Πα(A) = a14a43a32a21

茲談如何利用 A 之迴路乘積以表示 A 的行列式。 設 A 為一 n 階方陣, 則 det A = Pπsgn(π)a1π(1)a2π(2)· · · anπ(n), 其中總和是對 1, 2, · · · , n 的所有排列 π 來 算, 而 sgn(π) 是指排列 π 的符號 (是等 於 1 若 π 為偶排列, 等於 −1 若 π 為 奇排列)。 今考慮 det A 的任一非零通項 sgn(π)a1π(1)a2π(2)· · · anπ(n) 。 π 作為一排 列是可寫成一些循環排列的乘積, 如 π = τ1τ2· · · τk 。 請注意, 若用 |τ | 表示循環 排列 τ 移動的點的個數, 則 sgn(τ ) = (−1)|τ |+1 ; 因為若 τ = (i1i2· · · ik), 則 τ = (i1i2)(i1i3) · · · (i1ik), 即 τ 可由 k − 1 = |τ | − 1 個轉置的乘積表示。 另外, 乘 積 ai1i2ai2i3· · · aiki1 (設為非零) 可表示成 迴路乘積 Πτ(A), 其中 τ 是指 D(A) 由弧 (i1, i2), (i2, i3), · · · , (ik−1, ik) 及 (ik, i1) 所 構成的迴路。 (為了符號上的簡便, 這裡利用 τ 同時表示一循環排列及一迴路。) 現應不難 瞭解下面的計算:

sgn(π)a1π(1)a2π(2)· · · anπ(n)

= sgn(τ1· · · τkτ1(A)Πτ2(A) · · · Πτk(A)

=

k

Y

i=1

[sgn(τiτi(A)]

=

k

Y

i=1

[(−1)i|+1Πτi(A)]。

從以上的分析得知 det A 是等於所有形如

Qk

i=1[(−1)i|+1Πτi(A)] (即一些迴路乘積的

乘積再在前面冠上 ± 號) 的項之總和, 其中 τ1, · · · τk 為 D(A) 的一組 (頂點) 互不相交 的迴路, 其長度的總和 (即 Pki=1i|) 為 n

。 若不存在這樣子的一組 D(A) 的迴路, 則 det A 的值為零。

茲舉一些例子以說明上面所提計算行列 式的方法。

例1 :令

A =

a11 a12 0 0 a21 a22 a23 0 0 a32 0 a34

0 0 a43 a44

則 A 的有向圖 D(A) 為:

(這裡我們是假設 a11, a12, a21, a22, a23, a32, a34, a43 及 a44 為非零。 但若當中有些 是零, 則在以下計算 det A 的過程將產生一 些零項, 但計算公式本身仍是成立的。) 此時 D(A) 包含下列的迴路:

α1 : (1, 1) α2 : (2, 2) α3 : (4, 4) α4 : (1, 2), (2, 1) α5 : (2, 3), (3, 2) α6 : (3, 4), (4, 3) 。

很明顯, 迴路α1, α2及α6為互不相交, 且其長度的總和為4。 這組迴路對det A產生 項 [(−1)1|+1a11][(−1)2|+1a22][(−1)6|+1a34a43]

(4)

= −a11a22a34a43 。 同樣迴路 α1, α3

及 α5 也為互不相交, 且把 D(A) 的 所有頂點都含蓋, 它們對det A 的貢獻為 (a11)(a44)(−a23a32) = −a11a44a23a32 。 另外, 迴路 α4 及 α6 對 det A 的貢獻為 (−a12a21) (−a34a43) = a12a21a34a43 。 除 此以外, 就找不到別的互不相交的迴路, 把 D(A) 的所有頂點都含蓋。 因此, 我們得

detA = a12a21a34a43− a11a22a34a43

−a11a44a23a32

例 2: 設 A 為一 4 階方陣, 其有向圖為:

此時在 D(A) 找不到一組迴路互不相交, 且 把所有的頂點都含蓋。 因此, det A = 0 。 例3: 設 A 為一 4 階方陣, 其有向圖為:

答 案 為:det A = −a12a23a34a41 + a22a13a34a41 +a12a21a34a43 。 有興趣的讀 者不妨自己動手算算看。

茲考慮餘因子的圖論表示法。 先檢驗 4 階方陣 A = (aij) 的情形。 以 Aij 表示 A 在 (i, j) 位置的餘因子。 根據平常的定義, 我 們有

A12 = (−1)1+2det

a21 a23 a24

a31 a33 a34

a41 a43 a44

= a24a33a41+ a21a34a43+ a23a31a44

−a21a33a44− a23a34a41− a24a31a43

試想一下在表示A12的式子中, 是否每一項都 可以利用A的迴路乘積及 (或) 路徑乘積來表 示? 若把項a24a33a41 改寫成(a24a41)(a33), 則此項就等於 Πα1(A)Πα2(A), 其中α1為 路徑(2, 4), (4, 1), 一條從頂點2到頂點1的路 徑, 而α2則為迴路(3, 3) 。 可注意, 路徑α1及 迴路α2為互不相交的。 事實上, a24a33a41也 等於 (−1)1|Πα1(A) · (−1)2|+1Πα2(A)

。 [在 這 裡 我 們 是 假 設α1及α2在 有 向 圖 D(A)都有出現, 否則a24a33a41為零, 對A12 沒有貢獻。]同樣地, 我們發現 a21a34a43 = (−1)1|Πβ1(A) · (−1)2|+1Πβ2(A), 其 中β1 是 路 徑(2, 1) (也 是 從 頂 點2到 頂 點1) 及β2為迴路 (3, 4), (4, 3)。 另外, 又 有−a23a34a41 = (−1)γΠγ(A), 其中 γ 為 路徑(2, 3), (3, 4), (4, 1)。 事實上,A12 的表 示式子的每一項都可寫成以下的樣子:

(−1)|α|Πα(A) ·

k

Y

i=1

[(−1)i|+1Πτi(A)],

(5)

其中α為從頂點 2 到頂點 1 的某一路徑, k ≥ 0, τ1, · · · , τk為迴路, α, τ1, · · · , τk為互 不相交, 且把D(A)的所有頂點都含蓋。 (當 k = 0時, 應把 Qki=1[(−1)i|+1Πτi(A)] 看 作等於1。) 為何是這樣子?

若把a12乘上A12的表示式子的各項, 就 可以看出一些苗頭。 例如, a12(a24a33a41) = [(−1)1|a12Πα1(A)][(−1)2|+1Πα2(A)]。

這裡弧(1, 2)加上迴路 α1就構成一迴路。 讓 我們把這迴路記作 ˜α1, 則 a12(a24a33a41)便 可寫成 (−1)| ˜α1|+1Πα˜1(A)·(−1)2|+1Πα2(A), 即一些 (冠上±號的) 迴路乘積的乘積。 還 有, ˜α1, α2為互不相交, 且把D(A)的所有頂 點都含蓋 。 與前面提到 detA 的圖論表示 法比較, 得知我們獲得的是 detA 的其中 一項。 試換另一角度來看, 從公式detA = a11A11 + a12A12 + a13A13易見, 把a12乘 上A12的表示式子的各項將產生det A的一 些項, 且這些項的圖論表示法都涉及一含有 弧(1, 2)的迴路。

從以上的討論不難明白, 對任一n階方 陣A, 餘因子Ars, r 6= s, 是所有能寫成下面 樣子的項的總和:

(−1)|α|Πα(A)

k

Y

i=1

[(−1)i|+1Πτi(A)], 其中 α 為從頂點 s 至頂點 r 的某一路徑, τi 為迴路, k ≥ 0 (若 k = 0, 式子中涉及 Πτi(A) 的因子都不存在), α, τ1, · · · , τk 為 互不相交, 且把 D(A) 的頂點都含蓋。

另從行列式的圖論表示法, 得知餘因子 Arr 為下面樣子的項的總和

k

Y

i=1

[(−1)i|+1Πτi(A)],

其中 τ1, · · · , τk, k ≥ 1, 為互不相交的迴路, 且其含蓋的頂點為 hni\{r} 。

4. 符號非奇異方陣

符號非奇異方陣與線性系統的符號可解 性問題有密切的關連。 這節我們將介紹這類 矩陣。

我們稱 n 階實方陣 A 為符號非奇異 (sign-nonsingular) 若每一屬 Q(A) 的實方 陣皆為非奇異。 例如: 方陣

"

1 1

−1 2

#

為符 號非奇異, 因每一符號型為

"

+ +

− +

#

的實 方陣, 其行列式必取正值。 又每一主對角線元 全為非零的實三角方陣必為符號非奇異。

實方陣 A 為符號非奇異的充分而且必 要條件為 det A 的展開式含有非零項, 且非 零項的符號皆相同。 很明顯, 此條件為充分。

若 A 不滿足此條件, 則 det A 的展開式可 能是沒有非零項或是存在異號的非零項。 若 是前者, 則必然 A 不為符號非奇異。 若是後 者, 設 sgn(σ)a1σ(1)a2σ(2)· · · anσ(n) > 0 及 sgn(τ )a1τ (1)a2τ (2)· · · a(n) < 0, 其 中 σ, τ 為 1, 2, · · · , n 的排列。 製造一擁有 下面的性質的方陣 B ∈ Q(A) : B 的元 與 A 相同位置的元為同號 ( +, − 或 0 ), b1σ(1), b2σ(2), · · · , bnσ(n)的絕對值皆為 1, 及 B 的其他非零元的絕對值皆為 ε, 其中 ε 為 一正數。 只要選取 ε 充分小, det B 的值必 為正。 類似地, 我們可以找到一方陣 C ∈ Q(A), 且滿足 det C < 0 。 令 A(λ) = (1 − λ)B + λC 。 顯然, 對每一實數 λ, 0 ≤ λ, A(λ) ∈ Q(A) . 可是det A(λ)

(6)

為定義在閉區間 [0, 1] 的一連續實函數, 且 det A(0) = det B > 0 及 det A(1) = det C < 0 。 因此, 必存在某一 λ0 ∈ (0, 1) 使得 det A(λ0) = 0 。 所以, A 並不是符號 非奇異。 這樣子, 我們證明了條件的必然性。

det A 的展開式含有最少一非零項是實 方陣 A 為符號非奇異的必要條件。 當此條件 已滿足時, 我們可以把 A 的列重新排列及乘 以 ±1 而獲得一方陣, 其主對角線的元皆為 負。 在此假設底下, 我們可利用有向圖 D(A) 來刻劃 A 的符號非奇異性。

定理一: 設 A 為一 n 階實方陣, 其主對角線 元皆為負。 A 為符號非奇異的充分而且必要 條件為 A 的每一迴路乘積皆為負。 當 A 為 符號非奇異時, 對每一方陣 B ∈ Q(A), B 的 r 階主子行列式的符號皆為 (−1)r 。 證明 : 假設 A 的迴路乘積皆為負。 令 B ∈ Q(A) 。 如前一節解釋過, det B 展開式的非 零項可表示成 Πki=1[(−1)i|+1Πτi(B)], 其 中 τ1, · · · τk(k ≥ 1) 為 D(B) = D(A) 的 一組互不相交的迴路, 且 Pki=1i| = n 。 根 據假設, 對每一 i, 1 ≤ i ≤ k, Πτi(B) < 0 。 因此, 可得 sgnhΠki=1[(−1)i|+1Πτi(B)]i= (−1)P

k

i=1(|τi|+2)

= (−1)n。 所 以 有 sgn[det(B)] = (−1)n 。 這樣子, 我們證 明了條件的充分性。 採用類似的計算, 我們也 可以證明命題的最後部份。

現假設 A 有一迴路 α 使得 Πα(A) >

0。 設 |α| = l, 及令 i1, i2, · · · , in−l 為迴路 α 以外的頂點。 則迴路 α, β1 : (i1, i1), β2 : (i2, i2), · · · , βn−l : (in−l, in−l) 為互不相交,

且把 D(A) 的所有頂點含蓋 。 讀者稍作計算 可發現, 在 det A 的展開式中對應這組迴路 的項的符號為 (−1)n+1 。 但 A 的主對角線 元之乘積的符號為 (−1)n 。 因此, det A 的 展開式含有異號的非零項; 故 A 並不是符號 非奇異。

5. 符號可解性—方陣的情況

設 A 為一 n 階實方陣, b 為 ℜn 的一 向量 (用 n × 1 行向量來表示)。 線性系統 Ax = b 可以用 n × (n + 1) 矩陣 (A : b) 來 表示。 若 Ax = b 為一符號可解的系統, 不 難看出, 經過下列 (單一或合成) 的運算所獲 得的每一系統也必然為符號可解:

(1) 重新排列 (A : b) 的列;

(2) 重新排列 A 的行;

(3) 對 (A : b) 的某一列乘上 −1 ; (4) 對 A 的某一行乘上 −1 。

畢竟, 以上的運算對系統 Ax = b 而言, 等 於是對方程或變數重新給予編號, 或對某一 方程或某一變數乘以 −1 。 我們稱以上的四 種運算為容許定性運算。 利用這些運算我們 可以把矩陣 (A : b) 化成 A 的主對角線元皆 取負值, 而向量 b 的各元皆為非負。 可採取這 樣子的步驟: 先重新排列 (A : b) 的列使得 A 的主對角線元皆為非零 [ 若辦不到, 則 A 必然不是符號非奇異, 而原來的系統 Ax = b 則必然不是符號可解 ], 然後對 (A : b) 的列 乘以 ±1 使得 b 為一非負向量。 最後對 A 的 行乘以 ±1 使得 A 的主對角線元皆為負。 對 已化成這樣子的系統 Ax = b, 我們將給予其 為符號可解的等價條件。

(7)

定理二: 設 A 為一 n 階實方陣其主對角線 元皆為負數, b = (b1, · · · , bn)t 為一 n × 1 非負向量。 線性系統 Ax = b 為符號可解的 充分而且必要條件為下列的條件皆成立:

(i) A 的迴路乘積皆取負值;

(ii) 令 M = {j ∈ hni : bj > 0} 。 對任意 k, j ∈ M, k 6= j, 若 α 為從頂點 k 至 j 的一 路徑, 則 Πα(A) > 0 。 對任意 k ∈ hni\M, 所有從 k 至 M 的某一頂點的路徑 β 的對 應路徑乘積 Πβ(A) 皆取相同符號。

當等價條件已滿足時, 解向量 x 的符號 有如下的性質: 若 k ∈ M, 則 sgn(xk) 等 於 −1 。 若 k 6∈ M, 如不存在從頂點 k 至 M 的某一頂點的路徑, 則 sgn(xk) 等於 0 ; 如所有從頂點 k 至 M 的某一頂點的路徑 β 的對應路徑乘積 Πβ(A) 皆為正 (或皆為負), 則 sgn(xk) 等於 −1 (或 1 )。

證明: 假設線性系統 Ax = b 為符號可解。 則 A 必然為符號非奇異方陣, 否則, 存在奇陣方 陣 B ∈ Q(A) 。 此時, 系統 Bx = b 或是 無解, 若有解, 則其解向量的符號並不全部相 同, 因它的解集合可寫成 x0+ ker(B) 的樣 子, 其中 x0 為一解向量, ker(B) 為 B 的零 空間, 且其維度最少為 1 。 這與系統 Ax = b 為符號可解的假設產生矛盾。

因 A 為符號非奇異, 且其主對角線元全 為負, 根據定理一, 條件 (i) 必然成立。

線性系統 Ax = b 為符號可解意指對任 意 B ∈ Q(A) 及 c ∈ Q(b), 向量 B−1c 的符 號為固定; 換言之, 對任意 k ∈ hni, (B−1c)k 的符號為固定。 (B−1c)k是由 B−1的第 k 列 與 c 的乘積來決定。 事實上, 計算這個乘積時

我們只須利用 B−1 的第 k 列而行位置屬 M 的元, 因 cj = 0 若 j 6∈ M 。 茲證明對任 何 k ∈ hni, j ∈ M, 不管怎樣從 Q(A) 選取 B, b(−1)kj 的符號為固定, 其中 b(−1)kj 是表示 B−1 的 (k, j) 元。 因 A 為符號非奇異, 根據 定理一, 若 B ∈ Q(A), 則 sgn(det B) = (−1)n 。 又 b(−1)kj = Bjk/ det B, 所以 sgn(b(−1)kj ) = (−1)nsgn(Bjk) 。 我們分三 種情況來討論 Bjk 的符號:

(一) 不存在 D(A) 的路徑從 k 至 j;

(二) 存在 D(A) 的路徑從 k 至 j, 且對所有 這樣子的路徑 α, 路徑乘積 Πα(A) 的符號皆 為相同;

(三) 存在 D(A) 的路徑從 k 至 j, 及存在兩 條這樣子的路徑其對應的路徑乘積取相反符 號。

根據計算餘因子的圖論表示法, 第一種 情形發生時, b(−1)kj 恆為零; 在第二種情形發 生時, 稍作計算可得 sgn(Bjk) = (−1)n+1 (或 (−1)n ) 若所有從 k 至 j 的路徑的對應 路徑乘積皆為正 (或皆為負)。 顯然, 在第一種 或第二種情形發生時, Bjk(因而 b(−1)kj ) 的符 號為固定。 若是在第三種情形, 必然可找到某 一 B ∈ Q(A) 使得 sgn(b(−1)kj ) = 1, 亦可找 到另一 ˜B ∈ Q(A) 使得 sgn(˜b(−1)kj ) = −1

。 取一實向量 c ∈ Q(b) 使得 cj = 1 (注 意: j ∈ M ) 及其別的非零元的絕對值為 充分小, 則 (B−1c)k 的符號與 b(−1)kj cj 的相 同, 換言之, sgn[(B−1c)k] = 1 。 同理, 可得 sgn[( ˜B−1c)k] = −1 。 所以, 當系統 Ax = b 為符號可解時, 第三種情形不會發生。

以上我們證明了 b(−1)kj 的符號與 B 從 Q(A) 的選取無關。 事實上, 我們可獲得更強

(8)

一點的結論: 對任意 k ∈ hni, B−1 的第 k 列而行位置屬 M 的非零元必取同號; 否則, 固定 B, 從 Q(b) 選取適當的 c, 我們發現 (B−1c)k 可為正亦可為負, 這是一矛盾。 因 此, 我們證得對任意 k ∈ hni, 所有路徑乘 積 Πα(A), 其中 α 為從頂點 k 至 M 的某 一頂點的路徑, 皆取同號。

現考慮解向量 x 的符號。 設 k ∈ M 。 利用定理一, 可得 sgn(a(−1)kk ) = sgn(Akk/ det A) = (−1)n−1/(−1)n =

−1 。 取一向量 c ∈ Q(b) 使得 ck = 1 及 c 的別的非零元的絕對值為充分 小, 則 sgn(xk) = sgn((A−1c)k) = sgn(a(−1)kk ck) = −1 。 但系統 Ax = b 為符 號可解, 故 xk 的符號必為 −1 。 若 k 6∈ M, 根據前面的分析, 對任意 j ∈ M, 我們可以 決定 sgn(Akj), 因此可計算出 sgn(xk), 正 如定理所述。

令 α 為從 k 至 j 的一路徑, 且 j, k ∈ M 。 茲說明路徑乘積 Πα(A) 何 以必然為正。 在 Q(A) 取一方陣 B, 使得 每一對應屬 α 的弧的元為 ±1, 而別的非 零元的絕對值卻為充分小。 從直接計算可得 sgn(Bjk) = (−1)n+1sgn(Πα(A)) ; 因此有 sgn(b(−1)kj ) = sgn(Bjk)/sgn(det(A)) =

−sgn(Πα(A)) 。 現取一向量 c ∈ Qb

使得 cj = 1, 但 c 的別的非零元的 絕對值卻為充分小。 則 sgn((B−1c)k) = sgn(b(−1)kj )sgn(cj) = −sgn(Πα(A)) 。 因 k ∈ M, 在前面已證得 sgn((B−1c)k) = sgn(xk) = −1 。 所以, 我們有 Πα(A) > 0 。

以上我們已證明了條件的必要性及定理 的最後面部份。 在證明定理的最後面部份時, 我們實際上已同時證明了條件的充分性。

若我們考慮的線性系統 Ax = b 不單祇 滿足先決條件 aii < 0, ∀i ∈ hni 及 b ≥ 0, 且還假設它有一非正的解向量 x, 則此系統 為符號可解有比較簡單的刻劃。

定理三: 設 A 為一 n 階實方陣, 其主對角線 元皆為負數, b 為一非負向量。 又假設線性系 統 Ax = b 有一非正的解向量。 則此系統為 符號可解若且唯若下面的條件皆成立:

(i) A 的迴路乘積皆取負值;

(ii) 若 bj > 0, 則對每一終點為頂點 j 的路 徑α, 恆有 Πα(A) > 0 。

在文獻上能找到有關線性系統的符號可 解性的刻劃多以定理三的形式出現。 此結果 可從定理二馬上得到。 當考慮的系統的變數 很少時, 我們可以利用定理二來判別它是否 為符號可解。 但當考慮的系統為很大 (須利用 計算機的幫助) 時, 利用定理三來判別系統的 符號可解性是較為適宜。 那時候, 我們可以採 取下面的步驟來判別系統 Ax = b (其中 A 為 n 階方陣及 b 屬 ℜn ) 是否為符號可解:

(1) 利用容許定性運算把矩陣 (A : b) 化成 (A : b), 其中 A 的主對角線元皆為負及 b ≥ 0 。

(2) 找出方程 Ay = b 的一解向量 y 。 (若 沒有解, 則原系統必定不是符號可解。) (3) 令 M = {j ∈ hni : bj > 0} 。 對每一 k ∈ M, 檢驗是否有 yk < 0 。 若否, 則原系 統必定不是符號可解。 (理由可從定理二看出 來。)

(9)

(4) 對每一 k ∈ hni, 若 yk > 0 則對 (A : b) 的第 k列乘以 −1 及對 A 的 第 k 行乘以 −1 。 (這樣做不會改變akk, 亦 不會改變 bk, 因 bk = 0 ; 而變數 yk 則以它 的負值來代替, 所以變為負。) 設 ˆAˆy = ˆb 為 經轉換最後得到的系統, 則 ˆA 的主對角線元 皆為負, ˆb ≥ 0 及 ˆy ≤ 0 。

(5) 利用定理三的結果來判別系統 ˆAˆy = ˆb (從而原系統 Ax = b ) 的符號可解性。

第五個步驟須克服的, 其實是一個圖論 問題。 在這方面 Maybee[16], Klee及 Lad- ner[9], Manber[15], Hansen[5]等人做了不 少相關的工作。 在研究過程他們引入了符號 可解有向圖 (sign solvable digraph) 的概 念。 這是我們下一節的主題。

6. 符號可解有向圖

所謂符號有向圖是指一不含圈 (loops) 的有向圖, 其每一弧都冠以 + 或 − 號 (分 別稱為正弧及負弧)。 對每一實方陣 A, 它的 對應符號有向圖, 記作 SD(A), 是指有向圖 D(A) 扣除所有可能存在的圈, 弧 (i, j) 是 冠以 + 或 − 號視乎 aij 是正或負。 稱一路 徑或迴路為正 (或負) 若構成這路徑或迴路的 所有弧的符號乘積為正 (或負)。 令 j 為符號 有向圖 D 的一頂點, 我們稱 j 為特異頂點若 所有以頂點 j 為終點的路徑 (若存在) 皆為 正。 (必須強調的一點是, 我們提及的路徑或 迴路都是簡單的。) 若 j 為特異頂點, 則任何 以 j 為終點的路徑的所有弧都是正的; 因為 若 α 是以 j 為終點的一路徑, 且含有負弧,

則必可找到 α 的一子路徑以 j 為終點, 且只 含有一負弧。

我們稱符號有向圖 D 為符號可解若 D 的所有迴路皆為負, 且 D 的每一最大強連通 子圖至少含有一特異頂點。 茲舉一例子以說 明以上的定義。

例4: 令 D 為以下的符號有向圖:

這裡我們是以實線表示正弧, 以虛線表示負 弧。 容易看在 D 恰好有兩迴路, 且皆為負迴 路。 D 有兩個最大強連通子圖, 分別由頂點 集合 {1, 2, 3, 4} 及 {5} 產生。 又頂點 2 及 5 為 D 僅有的特異頂點。 因此, 根據定義 D 為符號可解。

若我們把 D 的弧 (5, 3) 的符號改為負, 則頂點 2 就不是奇異, 而改變後的符號有向 圖也不是符號可解。

比較定理三的結果及符號可解有向圖的 定義, 可得下面的結果:

定理四: 設 A 為一 n 階實方陣其主對角線 元皆為負數, b 為一非負向量, 假設線性系統 Ax = b 有一非正的解向量。 則系統 Ax = b 為符號可解若且唯若符號有向圖 SD(A) 為

(10)

符號可解, 且 {j ∈ hni : bj > 0} 是包含在 由 SD(A) 的奇異頂點構成的集合。

Hansen[5]對符號可解有向圖提供下面 的刻劃:

定理五: 設 D 為一符號有向圖。 以 D+ 表 示 D 的正部份子圖; D+ 的頂點集合跟 D 完全相同, 它的弧集合是由 D 的正弧構成。

D 為符號可解的充分而且必要條件為下面的 兩條件皆成立:

(1) D+ 不包含任何迴路。

(2) D 的每一最大強連通子圖含有一特異頂 點。

很明顯, 定理五所給的條件是 D 為符號 可解的必要條件。 為了證明條件為充分, 可採 用矛盾證法。 假設條件 (1) 及 (2) 皆成立, 但 D 含有一擁有負弧的正迴路 α 。 當然, α 必包含在 D 的某一最大強連通子圖, 設 為 C 。 根據條件 (2), C 含有一特異頂點 k

。 此時並不難找到一負路徑以 k 為終點, 這 與 k 為特異頂點的假設產生矛盾。 有興趣的 讀者可嘗試作這條負路徑或參考原文 [5]。

依據定理五的刻劃, Hansen 提出以下 四個步驟來判別符號有向圖 D 是否為可解:

步驟一: 考慮D的正部份子圖D+。 檢驗D+ 是否含有迴路; 若有, 則D不為符號可解。

步驟二: 決定D的所有最大強連通子圖。

步驟三: 決定D的非特異頂點並給它們標號。

步驟四: 在步驟三沒有給予標號的頂點就 是D 的特異頂點。 檢驗是否D的每一最大強 連通子圖皆包含一特異頂點。 若是, 則D為符 號可解; 若否, 則D不是。

步驟一及步驟二分別可利用現成的算 則, 而步驟三的實施則是基於下面的觀察: 若 k 為 D 的非特異頂點, 則存在一路徑 α 以 k 為終點, 且 α 含有恰好一負弧並以此弧作 開始。 Hansen有算過, 四個步驟總共所花的 時間複雜性為 O(mn), 其中 n 是指 D 的頂 點個數, 而 m 則是弧的個數。 至於細節這裡 從略。

另外, 研究工作者對符號可解有向圖及 不含正迴路的有向圖的構造都有深入的探討, 限於篇幅, 這裡不逐一介紹。

7. 符號可解性—長方矩陣的 情況

對一 般 長 方 實 矩 陣A, 判 別 線 性 系 統Ax = b 的符號可解性問題是可轉化成研究 L –矩陣及 S –矩陣的問題。 先介紹這兩類矩 陣。

令 A 為一 m × n 實矩陣。 以 N(A) 表 示所有屬 Q(A) 的矩陣的零空間之聯集; 換 言之, 向量 x ∈ ℜn 屬 N(A) 若且唯若存在 A ∈ Q(A), 使得 ˜˜ Ax = 0 。 稱矩陣 A 為 L–矩陣若 N(A) = {0} ; 稱 A 為 S –矩 陣若 N(A) = ℜnS{0}Sn+, 其中 ℜn+ ( ℜn ) 是指由 ℜn 所有元皆為正 (負) 的向量 組成的集合。 很明顯, A 為 L –矩陣的一等價 條件為每一屬 Q(A) 的矩陣的行皆為線性獨 立。 當然, 符號非奇異方陣必定是 L –矩陣。

也不難看到 A 為 S –矩陣若且唯若對每一 A ∈ Q(A), ˜˜ A 的零空間為一維, 且通過開正 象限 ℜn+ (一個等價的說法為, ˜A 的行構成一

(11)

n − 1 維的單純形 (simplex) 的頂點, 且這 單純形的相對內點集合包括空間的原點)。

線性系統 Ax = b 的符號可解性問題 可以如下轉換成研究 L–矩陣及 S–矩陣的問 題。 設 x = (x1, · · · , xn)t∈ ℜn 滿足線性系 統 Ax = b, 令 A 的行為 a1, a2, · · · , an 。 這裡每一 ai 都屬於 ℜm 。 又令

J = {j : xj 6= 0} 及

I = {i : 對某一 j ∈ J, aij 6= 0}。

照如下的方法定義一 m × (|J| + 1) 矩陣 A, 並以 aj, j ∈ JS{n+1}, 表示它的 j–行 (注 意: A 行指標集合為 ˜J = JS{n+1}, 而不 是 h|J| + 1i, 這是為了將來表達上的方便):

aj = aj 或 −aj 視乎 xj > 0 或 xj < 0, 並 以 −b 作為 A 的最後一行 an+1。 另外, 以 A′′ 表示 A 的 (m − |I|) × (n − |J|) 子矩陣 (aij)i6∈I,j6∈J 。 則系統 Ax = b 為符號可解若 且唯若 A 為 S–矩陣及 A′′ 為 L–矩陣。 下 面我們將對條件的充分性給予證明。

假設 A 為 S–矩陣而 A′′ 為 L–矩陣。

考慮線性系統 By = c, 其中 B ∈ Q(A) 及 c ∈ Q(b) 為任意。 在 A 及 A′′ 的定義 以 B 代替 A 及 c 代替 b (但仍採用原來 的向量 x ) 可分別得矩陣 B 及 B′′ 。 顯 然我們有 B ∈ Q(A) 及 B′′ ∈ Q(A′′) 。 因 A 為 S–矩陣, 在 B 的零空間存在一正 向量 u = (uj)j∈ ˜J, 且 un+1 = 1 。 對每一 j ∈ J, 令 yj = uj 若 xj > 0, yj = −uj

若 xj < 0, 並令 yj = 0 若 j ∈ hni\J 。 從 Bu = 0 可得 Pj∈J ujbj = −bn+1, 亦即

P

j∈J yjbj = c, 或 By = c 。 因此線性系統 By = c 擁有一解 y, 且 y ∈ Q(x)。 只剩下 解釋為何 B 的行為線性獨立 (因而 y 為系 統的唯一解)。 從集合 J 及 I 的定義, 不難看 出經過適當的行與列重新排列以後, 矩陣 B 可化成如下的形狀:

"B˜ ∗ O B′′

#

,

其中 B′′如前面是B的子矩陣(bij)i6∈I,j6∈J, 而 B 是子矩陣 (b˜ ij)i∈I,j∈J 。 因 B′′ ∈ Q(A′′) 而 A′′ 為 L–矩陣, 所以 B′′ 的行為線性獨 立。 又 m × |J| 矩陣

"B˜ O

#

在右邊補上 −c 及對其行乘以適當的 ±1 可得矩陣 B, 但 B ∈ Q(A) 且 A 為 S–矩陣, 因此 B 的 任意 |J| 行為線性獨立, 故 ˜B 的行也為線性 獨立。 所以, 從以上 B 可化成的形狀可見, B 的行為線性獨立。

條件的必要性是利用矛盾證法及採取類 似的技巧, 從略。

我們稱一實向量為平衡 (balanced) 若 它是零向量或它含有最少一正元及最少一負 元; 否則, 則稱之為非平衡。 Klee, Ladner 及 Manber[10]提供下面 L–矩陣的刻劃, 證 明並不難, 讀者自己可試試看。

定理六: 設 A 為一 m × n 實矩陣, 其行為 a1, · · · , an 。 A 為 L–矩陣的充分而且必要 條件為對每一主對角線元為 0, 1 或 −1 的非 零對角矩陣 D, AD 最少有一列為非平衡。

從表面定義來看, 要判別一矩陣是否為 L–矩陣似乎我們須檢驗是否每一有給定符號 型的矩陣, 其行必為線性獨立, 這牽涉無限多 個條件。 以上的定理對 L–矩陣提供一個有限

(12)

步驟的判別准則。 在論文 [10], Klee, Lad- ner 及 Manber 還證明了在一般的情況判別 L–矩陣的問題屬 NP –完全; 換言之, 找不 到一時間為多項式函數的算則來判別 L–矩 陣。 即是判別符號非奇異方陣的問題是否屬 NP –完全, 到目前為止仍屬一懸問。 (主要的 原因為, 判別符號有向圖的迴路是否皆為負 的問題的時間複雜性尚待解決。)

在研究 L–矩陣 (或 S–矩陣) 時, 往往我 們只需考慮沒有零列的矩陣, 因為對一矩陣 補上或刪去零列並不會影響其為 L–矩陣 (或 S–矩陣) 的性質。 以下的結果告訴我們 L–矩 陣及 S–矩陣是有密切的關連的。

定理七: 設 A 為一 m × n 實矩陣且無零列。

對每一 k ∈ hni, 令 Ak 表示把 A 的第 k 行刪去所得的 m × (n − 1) 矩陣。 則 A 為 S–矩陣的充分而且必要條件為 m = n − 1, A 的每一列為平衡, 及每一 Ak 為 L–矩陣。

有趣的地方是, 判別 L–矩陣的問題 (在 一般情況底下) 屬 NP –完全, 又根據定理七 的結果, 判別 L–矩陣的問題好像只是判別 S –矩陣的問題的子問題, 但卻存在時間為多項 式函數的算則以判別 S–矩陣, 這算則當然不 是基於定理七的結果, 它是基於下面並不難 證明的觀察。

定理八: 設 A 為一 m × n 實矩陣, b 為 ℜm 的一向量。 線性系統 Ax = b 為符號可解, 且 它的解向量 x 為正向量的充分而且必要條件 為矩陣 (A : −b) 為 S–矩陣。

根據定理七的結果, 在研究 (A : −b) 是否為 S–矩陣時, 我們不妨假設此矩陣為

m×(m+1) (及沒有零列), 但根據定理八, 問 題便轉化成考慮線性系統 Ax = b 的符號可 解性及解向量是否為正向量, 是方陣的情況!

正如我們在第五節解釋過, 方陣的情況是可 化為考慮符號有向圖的可解性的問題, 而對 後面的問題 Hansen已提出一個時間為多項 式函數的算則。 因此, S –矩陣的判別問題並 非屬 NP –完全。

若 (A : −b) 為 S–矩陣, 則它的最後 一行 −b 所當的任務跟別的行並沒有什麼差 別, 所以研究工作者後來傾向處理 S–矩陣以 代替處理線性系統的符號可解性 (及其解向 量為正) 的問題。 另外, 他們把 S–矩陣類擴 大為 S–矩陣類。 所謂 S–矩陣是指由 S–

矩陣把某些行以它的負來代替而獲得的矩陣。

不難證得, 矩陣 (A : −b) 為 S–矩陣若且唯 若線性系統 Ax = b 為符號可解, 且其解向 量的元皆為非零 (此時, 我們稱系統為強符號 可解)。 對 S–矩陣及 S–矩陣的結構, Klee, Ladner 及 Manber 等人在論文 [8], [9]及 [10]曾作深入的探討。 以下是他們獲得的其中 一些 (頗深刻的) 結果:

定理九: 每一 S–矩陣至少有一列擁有恰好 兩個非零元。

定理十: 若把一 S–矩陣的某一非零元改變符 號, 則改變後的矩陣必然不為 S–矩陣。

定理十一: 若 A 為一 m×(m+1) S–矩陣, 則 A 的非零元個數必定介乎 2m 與 m(m+3)2 之間, 且此上、 下界的值都可以達到。

基於這些及其他結果, Klee 在論文 [8]提出一個時間複雜性為 O(m2) 的算則以

(13)

判別 m × (m + 1) S–矩陣及 S–矩陣。 跟 上文所提過的 Hansen 算則比較, Klee 的算 則可說是略勝一籌。

最近 Brualdi, Chavey 及 Shader 在 論文 [3]曾對長方 L–矩陣作深入的探討, 獲 得不少深刻的結果, 這裡不作介紹。

8. 結語

目前這個領域的研究仍是方興未艾。 例 如, 最近 Klee, Von Hohenbalken 及 Lewis 在論文 [11]引入 L–系統及 S–系統的概念, 作為 L–矩陣及 S–矩陣的推廣。 他們的理論 可以用來處理廣義的符號可解性問題; 譬如, 可考慮同時涉及強與弱不等式的系統, 諸如

"

≥ 0 < 0

> 0 = 0

# "

ξ1 ξ2

#

=

"

< 0

> 0

#

。 另一方面, 符號非奇異方陣的變體或特殊子 類也吸引了不少研究工作者的興趣; 見論 文[7, 12, 14]。

讀者若對這個領域有興趣, 可留意由 Brualdi及 Shader 合著即將出版的專書 [4]。

筆者尚未有機會看到該書, 但以這兩位作者 在這個領域的造詣, 相信該書是精彩可期。

在定性矩陣理論的發展歷史上有兩個重 要問題引起不少研究工作者的興趣, 其一為 本文所介紹的符號可解性問題, 另一為定性 穩定理論。 後者問題的解決涉及矩陣理論, 圖 形論及常微分方程理論。 有興趣的讀者可翻 看論文 [6]。

參考文獻

1. L. Bassett, J. Maybee, and J.

Quirk, Qualitative economics and the scope of the correspondence principle, Econo- metrica 26:544-563 (1968).

2. R.A. Brualdi, The symbiotic relation- ship of combinatorics and matrix the- ory, Linear Algebra Appl. 162-164:65- 105 (1992).

3. R.A. Brualdi, K.L. Chavey, and B.L.

Shader, Rectangular L-matrices, Lin- ear Algebra Appl. 196:37-61 (1994).

4. R.A. Brualdi and B. Shader, Sign- solvable linear systems and their matri- ces, Cambridge Tracts in mathematics, No. 116, Cambridge University Press, 1995.

5. P. Hansen, Recognizing signsolvable graphs, Discrete Appl. Math. 6:237- 241 (1983).

6. C. Jeffries, V. Klee and P. van den Driessche, Qualitative stability of linear system, Linear Algebra Appl. 87:1-48 (1987).

7. C.R. Johnson, D.D. Olesky and P. van den Driessche, Sign determinancy in LU factorization of P-matrices, Linear Algebra Appl. 217:155-166 (1995).

8. V. Klee, Recursive structure of S- matrices and an O(m2) algorithm for recognizing strong sign solvability, Lin- ear Algebra Appl. 96:233-247 (1987).

9. V. Klee and R. Ladner, Qualitative ma- trices: strong sign-solvability and weak satisfiability, in: H. Greenberg and J. Maybee, eds., Computer-Assisted Analysis and Model Simplification (Academic Press, New York, 1981) 293- 320.

(14)

10. V. Klee, R. Ladner, and R. Manber, Signsolvability revisited, Linear Alge- bra Appl. 59:131-157 (1984).

11. V. Klee, B. Von Hohenbalken and T.

Lewis, On the recognition of S-systems, Linear Algebra Appl. 192: 187-204 (1993).

12. G.M. Lady, T.J. Lundy and J. Maybee, Nearly sign-nonsignular matrices, Lin- ear Algebra Appl. 220: 229-248 (1995).

13. K. Lancaster, The scope of qualitative economics, Rev. Econom. Studies 29:

99-132 (1962).

14. T. Lundy, J.S. Maybee and A.K.

Sen, S-inverse matrices, Linear Alge- bra Appl. 217: 241-253 (1995).

15. R. Manber, Graph-theoretical appro-

ach to qualitative solvability of linear systems, Linear Algebra Appl. 48: 457- 470 (1982).

16. J. Maybee, Sign solvable graphs, Dis- crete Appl. Math. 2: 57-63 (1980).

17. J. Maybee, Sign solvability, in: H.

Greenberg and J. Maybee, eds., Computer-Assisted Analysis and Model Simplification (Academic Press,New York, 1981)201-257.

18. J. Maybee and J. Quirk, Qualitative problems in matrix theory, SIAM Rev.

11:30-51 (1962).

19. P.A. Samuelson, Foundations of Eco- nomic Analysis, Harvard U.P., 1947;

Atheneum, New York, 1971.

—本文作者任教於淡江大學數學系—

參考文獻

相關文件

and Lin, S., A simple algorithm for merging two linearly-ordered sets,

A strong edge-coloring of a graph is a function that assigns to each edge a color such that two edges within distance two apart receive different colors.. The strong chromatic index of

∆ ≥ 7 is strong 3∆-edge-colorable: every planar graph G with maximum degree at least 7 is properly ∆-edge-colorable [22]; moreover if the girth of G is at least 7, then H i is

Lih and Liu [14] proved that the strong chromatic index of a cubic Halin graph, other than two special graphs, is 6 or 7.. It remains an open problem to determine which of such

A strong edge-coloring of a graph is a function that assigns to each edge a color such that every two distinct edges that are adjacent or adjacent to a same edge receive

Breu and Kirk- patrick [35] (see [4]) improved this by giving O(nm 2 )-time algorithms for the domination and the total domination problems and an O(n 2.376 )-time algorithm for

For an important class of matrices the more qualitative assertions of Theorems 13 and 14 can be considerably sharpened. This is the class of consistly

Chen, A one-parametric class of merit functions for the symmetric cone complementarity problem, Journal of Mathematical Analysis and Applications 355 (2009), 195–215..