• 沒有找到結果。

定性線性系統導論

N/A
N/A
Protected

Academic year: 2022

Share "定性線性系統導論"

Copied!
14
0
0

加載中.... (立即查看全文)

全文

(1)

定性線性系統導論

譚必信

1. 前言

經濟學家 Paul Samuelson 於 1947 年在他的經典名著 Foundations of Eco- nomic Analysis[19]建議研究線性系統的定 性。 自那時候開始, 不少經濟學家、 數學家、

計算機科學家、 環境學家及化學家投入這方 面的研究。 特別的, 他們是注重符號可解性及 符號穩定性這兩方面的問題。 本文的目的是 介紹前者的問題。

簡單來說, 所謂一個線性系統 (即線性 方程組) Ax = b 為符號可解是指它的可解 性及它的解向量的符號型是由矩陣 A 及向 量 b 的符號型來決定。 為了能說得明確, 讓 我們先引入一些符號。 實數 a 的符號是記作 sgn(a) ; sgn(a) 是等於 −, 0 或 +, 視 乎 a 為負、 零或正。 (為了方便, 有時候我們 用 −1 及 1 來代替 − 及 + 。) 對任一實 m × n 矩陣 A, 我們以 Q(A) 表示由所有 俱有 A 的符號型的實 m × n 矩陣構成的 集合; 換言之, B ∈ Q(A) 若且唯若對所有 i, j, sgn(bij) = sgn(aij) 。 我們稱線性系統 Ax = b 為符號可解 (sign-solvable) 若這系

統為可解, 且對任意 B ∈ Q(A), c ∈ Q(b), 系統 By = c 亦為可解且 y ∈ Q(x) 。

線性系統符號可解性的第一個基本問題 自然為找出符號可解的等價條件。 第一個問 題解決以後, 值得研究的題目包括找出有效 的判別算則及找出產生符號可解線性系統的 方法。 第一個問題目前已獲得完全解決, 在本 文我們將作比較詳細的介紹。 後面的兩個問 題是相當困難, 且目前尚未完全獲得解決, 限 於篇幅及筆者的學識, 在本文只是點到即止。

這裡我們需用到的工具主要是圖論 (在 研究判別算則時, 凸集合理論及命題邏輯都 是重要的工具, 但本文將不會接觸到這些)。

藉著這個機會, 在本文的第三節, 我們將介紹 行列式的圖論表示法。 Brualdi在論文 [2]曾 指出, 矩陣理論及組合學有一個共生的關係, 而產生這關係的緣由最少一部份可歸諸為矩 陣理論有很大部份與行列式有關 (因為重要 的概念如秩、 特徵值等都可利用行列式來定 義), 但行列式卻有一個圖論表示法。 這個表 示法是很有用處且並不難學習。 可惜的是, 在 大學部的線性代數課程通常都不會教到。

在下一節我們將舉一例子以說明定性分 析如何在實際問題上可派上用場。

1

(2)

2. 一個比較靜態分析的實例

考慮一個單一商品的市場。 假設該商品 的需求量 Qd 為價格 p 及入息 y 的函數。 另 一方面, 我們假設商品的供應量 Qs 只是價 格的函數。 此時市場的剩餘需求函數 E 滿足 方程:

E(p, y) = Qd(p, y) − Qs(p)。

譬如 p = p0, y = y0 為市場的平衡點; 即 E(p0, y0) = 0 。 假設入息參數 y 在 y = y0

附近作微少變動時, 市場可以保持平衡。 經濟 學家所希望知道的為價格 p 應如何隨著 y 的變化而作調整才能夠保持市場的平衡。 像 這樣子的, 就是比較靜態分析 (comparative statics) 的一個基本問題。

這裡我們需用到的數學工具為隱函數存 在定理。 是很合理假設需求量 Qd 是入息 y 的增函數及價格 p 的減函數。 另一方面, 我 們又假設供應量 Qs 是價格 p 的增函數。 換 言之, 我們有:

∂Qd/∂p < 0, ∂Qd/∂y > 0, dQs/dp > 0。

所以, ∂E/∂p = ∂Qd/∂p − dQs/dp < 0

。 根據隱函數存在定理, 在 y = y0 的鄰 域, 存在函數 p(y) 使得 p(y0) = p0 且 E(p(y), y) = 0 。 函數 p(y) 的導數可利用 隱函數微分法求得:

∂E

∂p dp dy +∂E

∂y = 0, dp

dy = −∂E/∂y

∂E/∂p > 0。

這個不等式告訴我們價格 p 應該隨著入息 y 增加而增加纔可以保持市場的平衡!

以上的例子很難說服大家採用定性方法 的好處, 因為它的結論並不令人驚奇, 這只是 普通常識。 但當我們所考慮的經濟系統是涉 及多個商品及剩餘需求函數時, 普通常識或 直覺感就不那麼可靠。 在這裡不打算討論一 般的情形, 讀者不難想像方法及問題基本上 是一樣的, 祇是我們需要多變數的隱函數存 在定理及採用矩陣的表示法。

定性分析的方法對很多門應用科學都有 它的實用價值。 特別的, 當資料不能準確 (或 無法) 量化時, 能預測改變的方向總勝不能作 任何預測。

3. 行列式與迴路乘積

設 A = (aij) 為一 n 階方陣。 以 D(A) 表示 A 的有向圖; 換言之, D(A) 的頂點集合為 hni := {1, 2, · · · , n} 及存 在一弧從 i 至 j, 記之以 (i, j), 若且唯 若aij 6= 0 . 所謂D(A) 的 (簡單) 路徑 是指在 D(A) 中經過相異頂點的一序列相 接的邊; 即如 (i1, i2), (i2, i3), · · · , (il, il+1) (l ≥ 1) 為 D(A) 的弧, 且 i1, · · · , il+1 為相 異的頂點。 若 (i1, i2), (i2, i3), · · · , (il, il+1) 為 D(A) 的弧, i1, · · · , il 為相異, 且 il+1 = i1, 則我們得到 D(A) 的一迴路。 路徑或迴 路通常都記之以希臘字母 α, β, γ, · · · , 等。

若 α : (i1, i2), (i2, i3), · · · , (il, il+1) 為 D(A) 的一路徑, 則 A 相對 α 的路徑乘積 是指矩陣 A 中對應 α 的邊之元的乘積, 即

(3)

ai1i2ai2i3· · · ailil+1, 並記之為 Πα(A) 。 類似 的我們也可以定義迴路乘積, 並以相同的符 號表示。 例如, 若 α 為迴路 (1, 4), (4, 3), (3, 2), (2, 1), 則 Πα(A) = a14a43a32a21

茲談如何利用 A 之迴路乘積以表示 A 的行列式。 設 A 為一 n 階方陣, 則 det A = Pπsgn(π)a1π(1)a2π(2)· · · anπ(n), 其中總和是對 1, 2, · · · , n 的所有排列 π 來 算, 而 sgn(π) 是指排列 π 的符號 (是等 於 1 若 π 為偶排列, 等於 −1 若 π 為 奇排列)。 今考慮 det A 的任一非零通項 sgn(π)a1π(1)a2π(2)· · · anπ(n) 。 π 作為一排 列是可寫成一些循環排列的乘積, 如 π = τ1τ2· · · τk 。 請注意, 若用 |τ | 表示循環 排列 τ 移動的點的個數, 則 sgn(τ ) = (−1)|τ |+1 ; 因為若 τ = (i1i2· · · ik), 則 τ = (i1i2)(i1i3) · · · (i1ik), 即 τ 可由 k − 1 = |τ | − 1 個轉置的乘積表示。 另外, 乘 積 ai1i2ai2i3· · · aiki1 (設為非零) 可表示成 迴路乘積 Πτ(A), 其中 τ 是指 D(A) 由弧 (i1, i2), (i2, i3), · · · , (ik−1, ik) 及 (ik, i1) 所 構成的迴路。 (為了符號上的簡便, 這裡利用 τ 同時表示一循環排列及一迴路。) 現應不難 瞭解下面的計算:

sgn(π)a1π(1)a2π(2)· · · anπ(n)

= sgn(τ1· · · τkτ1(A)Πτ2(A) · · · Πτk(A)

=

k

Y

i=1

[sgn(τiτi(A)]

=

k

Y

i=1

[(−1)i|+1Πτi(A)]。

從以上的分析得知 det A 是等於所有形如

Qk

i=1[(−1)i|+1Πτi(A)] (即一些迴路乘積的

乘積再在前面冠上 ± 號) 的項之總和, 其中 τ1, · · · τk 為 D(A) 的一組 (頂點) 互不相交 的迴路, 其長度的總和 (即 Pki=1i|) 為 n

。 若不存在這樣子的一組 D(A) 的迴路, 則 det A 的值為零。

茲舉一些例子以說明上面所提計算行列 式的方法。

例1 :令

A =

a11 a12 0 0 a21 a22 a23 0 0 a32 0 a34

0 0 a43 a44

則 A 的有向圖 D(A) 為:

(這裡我們是假設 a11, a12, a21, a22, a23, a32, a34, a43 及 a44 為非零。 但若當中有些 是零, 則在以下計算 det A 的過程將產生一 些零項, 但計算公式本身仍是成立的。) 此時 D(A) 包含下列的迴路:

α1 : (1, 1) α2 : (2, 2) α3 : (4, 4) α4 : (1, 2), (2, 1) α5 : (2, 3), (3, 2) α6 : (3, 4), (4, 3) 。

很明顯, 迴路α1, α2及α6為互不相交, 且其長度的總和為4。 這組迴路對det A產生 項 [(−1)1|+1a11][(−1)2|+1a22][(−1)6|+1a34a43]

(4)

= −a11a22a34a43 。 同樣迴路 α1, α3

及 α5 也為互不相交, 且把 D(A) 的 所有頂點都含蓋, 它們對det A 的貢獻為 (a11)(a44)(−a23a32) = −a11a44a23a32 。 另外, 迴路 α4 及 α6 對 det A 的貢獻為 (−a12a21) (−a34a43) = a12a21a34a43 。 除 此以外, 就找不到別的互不相交的迴路, 把 D(A) 的所有頂點都含蓋。 因此, 我們得

detA = a12a21a34a43− a11a22a34a43

−a11a44a23a32

例 2: 設 A 為一 4 階方陣, 其有向圖為:

此時在 D(A) 找不到一組迴路互不相交, 且 把所有的頂點都含蓋。 因此, det A = 0 。 例3: 設 A 為一 4 階方陣, 其有向圖為:

答 案 為:det A = −a12a23a34a41 + a22a13a34a41 +a12a21a34a43 。 有興趣的讀 者不妨自己動手算算看。

茲考慮餘因子的圖論表示法。 先檢驗 4 階方陣 A = (aij) 的情形。 以 Aij 表示 A 在 (i, j) 位置的餘因子。 根據平常的定義, 我 們有

A12 = (−1)1+2det

a21 a23 a24

a31 a33 a34

a41 a43 a44

= a24a33a41+ a21a34a43+ a23a31a44

−a21a33a44− a23a34a41− a24a31a43

試想一下在表示A12的式子中, 是否每一項都 可以利用A的迴路乘積及 (或) 路徑乘積來表 示? 若把項a24a33a41 改寫成(a24a41)(a33), 則此項就等於 Πα1(A)Πα2(A), 其中α1為 路徑(2, 4), (4, 1), 一條從頂點2到頂點1的路 徑, 而α2則為迴路(3, 3) 。 可注意, 路徑α1及 迴路α2為互不相交的。 事實上, a24a33a41也 等於 (−1)1|Πα1(A) · (−1)2|+1Πα2(A)

。 [在 這 裡 我 們 是 假 設α1及α2在 有 向 圖 D(A)都有出現, 否則a24a33a41為零, 對A12 沒有貢獻。]同樣地, 我們發現 a21a34a43 = (−1)1|Πβ1(A) · (−1)2|+1Πβ2(A), 其 中β1 是 路 徑(2, 1) (也 是 從 頂 點2到 頂 點1) 及β2為迴路 (3, 4), (4, 3)。 另外, 又 有−a23a34a41 = (−1)γΠγ(A), 其中 γ 為 路徑(2, 3), (3, 4), (4, 1)。 事實上,A12 的表 示式子的每一項都可寫成以下的樣子:

(−1)|α|Πα(A) ·

k

Y

i=1

[(−1)i|+1Πτi(A)],

(5)

其中α為從頂點 2 到頂點 1 的某一路徑, k ≥ 0, τ1, · · · , τk為迴路, α, τ1, · · · , τk為互 不相交, 且把D(A)的所有頂點都含蓋。 (當 k = 0時, 應把 Qki=1[(−1)i|+1Πτi(A)] 看 作等於1。) 為何是這樣子?

若把a12乘上A12的表示式子的各項, 就 可以看出一些苗頭。 例如, a12(a24a33a41) = [(−1)1|a12Πα1(A)][(−1)2|+1Πα2(A)]。

這裡弧(1, 2)加上迴路 α1就構成一迴路。 讓 我們把這迴路記作 ˜α1, 則 a12(a24a33a41)便 可寫成 (−1)| ˜α1|+1Πα˜1(A)·(−1)2|+1Πα2(A), 即一些 (冠上±號的) 迴路乘積的乘積。 還 有, ˜α1, α2為互不相交, 且把D(A)的所有頂 點都含蓋 。 與前面提到 detA 的圖論表示 法比較, 得知我們獲得的是 detA 的其中 一項。 試換另一角度來看, 從公式detA = a11A11 + a12A12 + a13A13易見, 把a12乘 上A12的表示式子的各項將產生det A的一 些項, 且這些項的圖論表示法都涉及一含有 弧(1, 2)的迴路。

從以上的討論不難明白, 對任一n階方 陣A, 餘因子Ars, r 6= s, 是所有能寫成下面 樣子的項的總和:

(−1)|α|Πα(A)

k

Y

i=1

[(−1)i|+1Πτi(A)], 其中 α 為從頂點 s 至頂點 r 的某一路徑, τi 為迴路, k ≥ 0 (若 k = 0, 式子中涉及 Πτi(A) 的因子都不存在), α, τ1, · · · , τk 為 互不相交, 且把 D(A) 的頂點都含蓋。

另從行列式的圖論表示法, 得知餘因子 Arr 為下面樣子的項的總和

k

Y

i=1

[(−1)i|+1Πτi(A)],

其中 τ1, · · · , τk, k ≥ 1, 為互不相交的迴路, 且其含蓋的頂點為 hni\{r} 。

4. 符號非奇異方陣

符號非奇異方陣與線性系統的符號可解 性問題有密切的關連。 這節我們將介紹這類 矩陣。

我們稱 n 階實方陣 A 為符號非奇異 (sign-nonsingular) 若每一屬 Q(A) 的實方 陣皆為非奇異。 例如: 方陣

"

1 1

−1 2

#

為符 號非奇異, 因每一符號型為

"

+ +

− +

#

的實 方陣, 其行列式必取正值。 又每一主對角線元 全為非零的實三角方陣必為符號非奇異。

實方陣 A 為符號非奇異的充分而且必 要條件為 det A 的展開式含有非零項, 且非 零項的符號皆相同。 很明顯, 此條件為充分。

若 A 不滿足此條件, 則 det A 的展開式可 能是沒有非零項或是存在異號的非零項。 若 是前者, 則必然 A 不為符號非奇異。 若是後 者, 設 sgn(σ)a1σ(1)a2σ(2)· · · anσ(n) > 0 及 sgn(τ )a1τ (1)a2τ (2)· · · a(n) < 0, 其 中 σ, τ 為 1, 2, · · · , n 的排列。 製造一擁有 下面的性質的方陣 B ∈ Q(A) : B 的元 與 A 相同位置的元為同號 ( +, − 或 0 ), b1σ(1), b2σ(2), · · · , bnσ(n)的絕對值皆為 1, 及 B 的其他非零元的絕對值皆為 ε, 其中 ε 為 一正數。 只要選取 ε 充分小, det B 的值必 為正。 類似地, 我們可以找到一方陣 C ∈ Q(A), 且滿足 det C < 0 。 令 A(λ) = (1 − λ)B + λC 。 顯然, 對每一實數 λ, 0 ≤ λ, A(λ) ∈ Q(A) . 可是det A(λ)

(6)

為定義在閉區間 [0, 1] 的一連續實函數, 且 det A(0) = det B > 0 及 det A(1) = det C < 0 。 因此, 必存在某一 λ0 ∈ (0, 1) 使得 det A(λ0) = 0 。 所以, A 並不是符號 非奇異。 這樣子, 我們證明了條件的必然性。

det A 的展開式含有最少一非零項是實 方陣 A 為符號非奇異的必要條件。 當此條件 已滿足時, 我們可以把 A 的列重新排列及乘 以 ±1 而獲得一方陣, 其主對角線的元皆為 負。 在此假設底下, 我們可利用有向圖 D(A) 來刻劃 A 的符號非奇異性。

定理一: 設 A 為一 n 階實方陣, 其主對角線 元皆為負。 A 為符號非奇異的充分而且必要 條件為 A 的每一迴路乘積皆為負。 當 A 為 符號非奇異時, 對每一方陣 B ∈ Q(A), B 的 r 階主子行列式的符號皆為 (−1)r 。 證明 : 假設 A 的迴路乘積皆為負。 令 B ∈ Q(A) 。 如前一節解釋過, det B 展開式的非 零項可表示成 Πki=1[(−1)i|+1Πτi(B)], 其 中 τ1, · · · τk(k ≥ 1) 為 D(B) = D(A) 的 一組互不相交的迴路, 且 Pki=1i| = n 。 根 據假設, 對每一 i, 1 ≤ i ≤ k, Πτi(B) < 0 。 因此, 可得 sgnhΠki=1[(−1)i|+1Πτi(B)]i= (−1)P

k

i=1(|τi|+2)

= (−1)n。 所 以 有 sgn[det(B)] = (−1)n 。 這樣子, 我們證 明了條件的充分性。 採用類似的計算, 我們也 可以證明命題的最後部份。

現假設 A 有一迴路 α 使得 Πα(A) >

0。 設 |α| = l, 及令 i1, i2, · · · , in−l 為迴路 α 以外的頂點。 則迴路 α, β1 : (i1, i1), β2 : (i2, i2), · · · , βn−l : (in−l, in−l) 為互不相交,

且把 D(A) 的所有頂點含蓋 。 讀者稍作計算 可發現, 在 det A 的展開式中對應這組迴路 的項的符號為 (−1)n+1 。 但 A 的主對角線 元之乘積的符號為 (−1)n 。 因此, det A 的 展開式含有異號的非零項; 故 A 並不是符號 非奇異。

5. 符號可解性—方陣的情況

設 A 為一 n 階實方陣, b 為 ℜn 的一 向量 (用 n × 1 行向量來表示)。 線性系統 Ax = b 可以用 n × (n + 1) 矩陣 (A : b) 來 表示。 若 Ax = b 為一符號可解的系統, 不 難看出, 經過下列 (單一或合成) 的運算所獲 得的每一系統也必然為符號可解:

(1) 重新排列 (A : b) 的列;

(2) 重新排列 A 的行;

(3) 對 (A : b) 的某一列乘上 −1 ; (4) 對 A 的某一行乘上 −1 。

畢竟, 以上的運算對系統 Ax = b 而言, 等 於是對方程或變數重新給予編號, 或對某一 方程或某一變數乘以 −1 。 我們稱以上的四 種運算為容許定性運算。 利用這些運算我們 可以把矩陣 (A : b) 化成 A 的主對角線元皆 取負值, 而向量 b 的各元皆為非負。 可採取這 樣子的步驟: 先重新排列 (A : b) 的列使得 A 的主對角線元皆為非零 [ 若辦不到, 則 A 必然不是符號非奇異, 而原來的系統 Ax = b 則必然不是符號可解 ], 然後對 (A : b) 的列 乘以 ±1 使得 b 為一非負向量。 最後對 A 的 行乘以 ±1 使得 A 的主對角線元皆為負。 對 已化成這樣子的系統 Ax = b, 我們將給予其 為符號可解的等價條件。

(7)

定理二: 設 A 為一 n 階實方陣其主對角線 元皆為負數, b = (b1, · · · , bn)t 為一 n × 1 非負向量。 線性系統 Ax = b 為符號可解的 充分而且必要條件為下列的條件皆成立:

(i) A 的迴路乘積皆取負值;

(ii) 令 M = {j ∈ hni : bj > 0} 。 對任意 k, j ∈ M, k 6= j, 若 α 為從頂點 k 至 j 的一 路徑, 則 Πα(A) > 0 。 對任意 k ∈ hni\M, 所有從 k 至 M 的某一頂點的路徑 β 的對 應路徑乘積 Πβ(A) 皆取相同符號。

當等價條件已滿足時, 解向量 x 的符號 有如下的性質: 若 k ∈ M, 則 sgn(xk) 等 於 −1 。 若 k 6∈ M, 如不存在從頂點 k 至 M 的某一頂點的路徑, 則 sgn(xk) 等於 0 ; 如所有從頂點 k 至 M 的某一頂點的路徑 β 的對應路徑乘積 Πβ(A) 皆為正 (或皆為負), 則 sgn(xk) 等於 −1 (或 1 )。

證明: 假設線性系統 Ax = b 為符號可解。 則 A 必然為符號非奇異方陣, 否則, 存在奇陣方 陣 B ∈ Q(A) 。 此時, 系統 Bx = b 或是 無解, 若有解, 則其解向量的符號並不全部相 同, 因它的解集合可寫成 x0+ ker(B) 的樣 子, 其中 x0 為一解向量, ker(B) 為 B 的零 空間, 且其維度最少為 1 。 這與系統 Ax = b 為符號可解的假設產生矛盾。

因 A 為符號非奇異, 且其主對角線元全 為負, 根據定理一, 條件 (i) 必然成立。

線性系統 Ax = b 為符號可解意指對任 意 B ∈ Q(A) 及 c ∈ Q(b), 向量 B−1c 的符 號為固定; 換言之, 對任意 k ∈ hni, (B−1c)k 的符號為固定。 (B−1c)k是由 B−1的第 k 列 與 c 的乘積來決定。 事實上, 計算這個乘積時

我們只須利用 B−1 的第 k 列而行位置屬 M 的元, 因 cj = 0 若 j 6∈ M 。 茲證明對任 何 k ∈ hni, j ∈ M, 不管怎樣從 Q(A) 選取 B, b(−1)kj 的符號為固定, 其中 b(−1)kj 是表示 B−1 的 (k, j) 元。 因 A 為符號非奇異, 根據 定理一, 若 B ∈ Q(A), 則 sgn(det B) = (−1)n 。 又 b(−1)kj = Bjk/ det B, 所以 sgn(b(−1)kj ) = (−1)nsgn(Bjk) 。 我們分三 種情況來討論 Bjk 的符號:

(一) 不存在 D(A) 的路徑從 k 至 j;

(二) 存在 D(A) 的路徑從 k 至 j, 且對所有 這樣子的路徑 α, 路徑乘積 Πα(A) 的符號皆 為相同;

(三) 存在 D(A) 的路徑從 k 至 j, 及存在兩 條這樣子的路徑其對應的路徑乘積取相反符 號。

根據計算餘因子的圖論表示法, 第一種 情形發生時, b(−1)kj 恆為零; 在第二種情形發 生時, 稍作計算可得 sgn(Bjk) = (−1)n+1 (或 (−1)n ) 若所有從 k 至 j 的路徑的對應 路徑乘積皆為正 (或皆為負)。 顯然, 在第一種 或第二種情形發生時, Bjk(因而 b(−1)kj ) 的符 號為固定。 若是在第三種情形, 必然可找到某 一 B ∈ Q(A) 使得 sgn(b(−1)kj ) = 1, 亦可找 到另一 ˜B ∈ Q(A) 使得 sgn(˜b(−1)kj ) = −1

。 取一實向量 c ∈ Q(b) 使得 cj = 1 (注 意: j ∈ M ) 及其別的非零元的絕對值為 充分小, 則 (B−1c)k 的符號與 b(−1)kj cj 的相 同, 換言之, sgn[(B−1c)k] = 1 。 同理, 可得 sgn[( ˜B−1c)k] = −1 。 所以, 當系統 Ax = b 為符號可解時, 第三種情形不會發生。

以上我們證明了 b(−1)kj 的符號與 B 從 Q(A) 的選取無關。 事實上, 我們可獲得更強

(8)

一點的結論: 對任意 k ∈ hni, B−1 的第 k 列而行位置屬 M 的非零元必取同號; 否則, 固定 B, 從 Q(b) 選取適當的 c, 我們發現 (B−1c)k 可為正亦可為負, 這是一矛盾。 因 此, 我們證得對任意 k ∈ hni, 所有路徑乘 積 Πα(A), 其中 α 為從頂點 k 至 M 的某 一頂點的路徑, 皆取同號。

現考慮解向量 x 的符號。 設 k ∈ M 。 利用定理一, 可得 sgn(a(−1)kk ) = sgn(Akk/ det A) = (−1)n−1/(−1)n =

−1 。 取一向量 c ∈ Q(b) 使得 ck = 1 及 c 的別的非零元的絕對值為充分 小, 則 sgn(xk) = sgn((A−1c)k) = sgn(a(−1)kk ck) = −1 。 但系統 Ax = b 為符 號可解, 故 xk 的符號必為 −1 。 若 k 6∈ M, 根據前面的分析, 對任意 j ∈ M, 我們可以 決定 sgn(Akj), 因此可計算出 sgn(xk), 正 如定理所述。

令 α 為從 k 至 j 的一路徑, 且 j, k ∈ M 。 茲說明路徑乘積 Πα(A) 何 以必然為正。 在 Q(A) 取一方陣 B, 使得 每一對應屬 α 的弧的元為 ±1, 而別的非 零元的絕對值卻為充分小。 從直接計算可得 sgn(Bjk) = (−1)n+1sgn(Πα(A)) ; 因此有 sgn(b(−1)kj ) = sgn(Bjk)/sgn(det(A)) =

−sgn(Πα(A)) 。 現取一向量 c ∈ Qb

使得 cj = 1, 但 c 的別的非零元的 絕對值卻為充分小。 則 sgn((B−1c)k) = sgn(b(−1)kj )sgn(cj) = −sgn(Πα(A)) 。 因 k ∈ M, 在前面已證得 sgn((B−1c)k) = sgn(xk) = −1 。 所以, 我們有 Πα(A) > 0 。

以上我們已證明了條件的必要性及定理 的最後面部份。 在證明定理的最後面部份時, 我們實際上已同時證明了條件的充分性。

若我們考慮的線性系統 Ax = b 不單祇 滿足先決條件 aii < 0, ∀i ∈ hni 及 b ≥ 0, 且還假設它有一非正的解向量 x, 則此系統 為符號可解有比較簡單的刻劃。

定理三: 設 A 為一 n 階實方陣, 其主對角線 元皆為負數, b 為一非負向量。 又假設線性系 統 Ax = b 有一非正的解向量。 則此系統為 符號可解若且唯若下面的條件皆成立:

(i) A 的迴路乘積皆取負值;

(ii) 若 bj > 0, 則對每一終點為頂點 j 的路 徑α, 恆有 Πα(A) > 0 。

在文獻上能找到有關線性系統的符號可 解性的刻劃多以定理三的形式出現。 此結果 可從定理二馬上得到。 當考慮的系統的變數 很少時, 我們可以利用定理二來判別它是否 為符號可解。 但當考慮的系統為很大 (須利用 計算機的幫助) 時, 利用定理三來判別系統的 符號可解性是較為適宜。 那時候, 我們可以採 取下面的步驟來判別系統 Ax = b (其中 A 為 n 階方陣及 b 屬 ℜn ) 是否為符號可解:

(1) 利用容許定性運算把矩陣 (A : b) 化成 (A : b), 其中 A 的主對角線元皆為負及 b ≥ 0 。

(2) 找出方程 Ay = b 的一解向量 y 。 (若 沒有解, 則原系統必定不是符號可解。) (3) 令 M = {j ∈ hni : bj > 0} 。 對每一 k ∈ M, 檢驗是否有 yk < 0 。 若否, 則原系 統必定不是符號可解。 (理由可從定理二看出 來。)

(9)

(4) 對每一 k ∈ hni, 若 yk > 0 則對 (A : b) 的第 k列乘以 −1 及對 A 的 第 k 行乘以 −1 。 (這樣做不會改變akk, 亦 不會改變 bk, 因 bk = 0 ; 而變數 yk 則以它 的負值來代替, 所以變為負。) 設 ˆAˆy = ˆb 為 經轉換最後得到的系統, 則 ˆA 的主對角線元 皆為負, ˆb ≥ 0 及 ˆy ≤ 0 。

(5) 利用定理三的結果來判別系統 ˆAˆy = ˆb (從而原系統 Ax = b ) 的符號可解性。

第五個步驟須克服的, 其實是一個圖論 問題。 在這方面 Maybee[16], Klee及 Lad- ner[9], Manber[15], Hansen[5]等人做了不 少相關的工作。 在研究過程他們引入了符號 可解有向圖 (sign solvable digraph) 的概 念。 這是我們下一節的主題。

6. 符號可解有向圖

所謂符號有向圖是指一不含圈 (loops) 的有向圖, 其每一弧都冠以 + 或 − 號 (分 別稱為正弧及負弧)。 對每一實方陣 A, 它的 對應符號有向圖, 記作 SD(A), 是指有向圖 D(A) 扣除所有可能存在的圈, 弧 (i, j) 是 冠以 + 或 − 號視乎 aij 是正或負。 稱一路 徑或迴路為正 (或負) 若構成這路徑或迴路的 所有弧的符號乘積為正 (或負)。 令 j 為符號 有向圖 D 的一頂點, 我們稱 j 為特異頂點若 所有以頂點 j 為終點的路徑 (若存在) 皆為 正。 (必須強調的一點是, 我們提及的路徑或 迴路都是簡單的。) 若 j 為特異頂點, 則任何 以 j 為終點的路徑的所有弧都是正的; 因為 若 α 是以 j 為終點的一路徑, 且含有負弧,

則必可找到 α 的一子路徑以 j 為終點, 且只 含有一負弧。

我們稱符號有向圖 D 為符號可解若 D 的所有迴路皆為負, 且 D 的每一最大強連通 子圖至少含有一特異頂點。 茲舉一例子以說 明以上的定義。

例4: 令 D 為以下的符號有向圖:

這裡我們是以實線表示正弧, 以虛線表示負 弧。 容易看在 D 恰好有兩迴路, 且皆為負迴 路。 D 有兩個最大強連通子圖, 分別由頂點 集合 {1, 2, 3, 4} 及 {5} 產生。 又頂點 2 及 5 為 D 僅有的特異頂點。 因此, 根據定義 D 為符號可解。

若我們把 D 的弧 (5, 3) 的符號改為負, 則頂點 2 就不是奇異, 而改變後的符號有向 圖也不是符號可解。

比較定理三的結果及符號可解有向圖的 定義, 可得下面的結果:

定理四: 設 A 為一 n 階實方陣其主對角線 元皆為負數, b 為一非負向量, 假設線性系統 Ax = b 有一非正的解向量。 則系統 Ax = b 為符號可解若且唯若符號有向圖 SD(A) 為

(10)

符號可解, 且 {j ∈ hni : bj > 0} 是包含在 由 SD(A) 的奇異頂點構成的集合。

Hansen[5]對符號可解有向圖提供下面 的刻劃:

定理五: 設 D 為一符號有向圖。 以 D+ 表 示 D 的正部份子圖; D+ 的頂點集合跟 D 完全相同, 它的弧集合是由 D 的正弧構成。

D 為符號可解的充分而且必要條件為下面的 兩條件皆成立:

(1) D+ 不包含任何迴路。

(2) D 的每一最大強連通子圖含有一特異頂 點。

很明顯, 定理五所給的條件是 D 為符號 可解的必要條件。 為了證明條件為充分, 可採 用矛盾證法。 假設條件 (1) 及 (2) 皆成立, 但 D 含有一擁有負弧的正迴路 α 。 當然, α 必包含在 D 的某一最大強連通子圖, 設 為 C 。 根據條件 (2), C 含有一特異頂點 k

。 此時並不難找到一負路徑以 k 為終點, 這 與 k 為特異頂點的假設產生矛盾。 有興趣的 讀者可嘗試作這條負路徑或參考原文 [5]。

依據定理五的刻劃, Hansen 提出以下 四個步驟來判別符號有向圖 D 是否為可解:

步驟一: 考慮D的正部份子圖D+。 檢驗D+ 是否含有迴路; 若有, 則D不為符號可解。

步驟二: 決定D的所有最大強連通子圖。

步驟三: 決定D的非特異頂點並給它們標號。

步驟四: 在步驟三沒有給予標號的頂點就 是D 的特異頂點。 檢驗是否D的每一最大強 連通子圖皆包含一特異頂點。 若是, 則D為符 號可解; 若否, 則D不是。

步驟一及步驟二分別可利用現成的算 則, 而步驟三的實施則是基於下面的觀察: 若 k 為 D 的非特異頂點, 則存在一路徑 α 以 k 為終點, 且 α 含有恰好一負弧並以此弧作 開始。 Hansen有算過, 四個步驟總共所花的 時間複雜性為 O(mn), 其中 n 是指 D 的頂 點個數, 而 m 則是弧的個數。 至於細節這裡 從略。

另外, 研究工作者對符號可解有向圖及 不含正迴路的有向圖的構造都有深入的探討, 限於篇幅, 這裡不逐一介紹。

7. 符號可解性—長方矩陣的 情況

對一 般 長 方 實 矩 陣A, 判 別 線 性 系 統Ax = b 的符號可解性問題是可轉化成研究 L –矩陣及 S –矩陣的問題。 先介紹這兩類矩 陣。

令 A 為一 m × n 實矩陣。 以 N(A) 表 示所有屬 Q(A) 的矩陣的零空間之聯集; 換 言之, 向量 x ∈ ℜn 屬 N(A) 若且唯若存在 A ∈ Q(A), 使得 ˜˜ Ax = 0 。 稱矩陣 A 為 L–矩陣若 N(A) = {0} ; 稱 A 為 S –矩 陣若 N(A) = ℜnS{0}Sn+, 其中 ℜn+ ( ℜn ) 是指由 ℜn 所有元皆為正 (負) 的向量 組成的集合。 很明顯, A 為 L –矩陣的一等價 條件為每一屬 Q(A) 的矩陣的行皆為線性獨 立。 當然, 符號非奇異方陣必定是 L –矩陣。

也不難看到 A 為 S –矩陣若且唯若對每一 A ∈ Q(A), ˜˜ A 的零空間為一維, 且通過開正 象限 ℜn+ (一個等價的說法為, ˜A 的行構成一

(11)

n − 1 維的單純形 (simplex) 的頂點, 且這 單純形的相對內點集合包括空間的原點)。

線性系統 Ax = b 的符號可解性問題 可以如下轉換成研究 L–矩陣及 S–矩陣的問 題。 設 x = (x1, · · · , xn)t∈ ℜn 滿足線性系 統 Ax = b, 令 A 的行為 a1, a2, · · · , an 。 這裡每一 ai 都屬於 ℜm 。 又令

J = {j : xj 6= 0} 及

I = {i : 對某一 j ∈ J, aij 6= 0}。

照如下的方法定義一 m × (|J| + 1) 矩陣 A, 並以 aj, j ∈ JS{n+1}, 表示它的 j–行 (注 意: A 行指標集合為 ˜J = JS{n+1}, 而不 是 h|J| + 1i, 這是為了將來表達上的方便):

aj = aj 或 −aj 視乎 xj > 0 或 xj < 0, 並 以 −b 作為 A 的最後一行 an+1。 另外, 以 A′′ 表示 A 的 (m − |I|) × (n − |J|) 子矩陣 (aij)i6∈I,j6∈J 。 則系統 Ax = b 為符號可解若 且唯若 A 為 S–矩陣及 A′′ 為 L–矩陣。 下 面我們將對條件的充分性給予證明。

假設 A 為 S–矩陣而 A′′ 為 L–矩陣。

考慮線性系統 By = c, 其中 B ∈ Q(A) 及 c ∈ Q(b) 為任意。 在 A 及 A′′ 的定義 以 B 代替 A 及 c 代替 b (但仍採用原來 的向量 x ) 可分別得矩陣 B 及 B′′ 。 顯 然我們有 B ∈ Q(A) 及 B′′ ∈ Q(A′′) 。 因 A 為 S–矩陣, 在 B 的零空間存在一正 向量 u = (uj)j∈ ˜J, 且 un+1 = 1 。 對每一 j ∈ J, 令 yj = uj 若 xj > 0, yj = −uj

若 xj < 0, 並令 yj = 0 若 j ∈ hni\J 。 從 Bu = 0 可得 Pj∈J ujbj = −bn+1, 亦即

P

j∈J yjbj = c, 或 By = c 。 因此線性系統 By = c 擁有一解 y, 且 y ∈ Q(x)。 只剩下 解釋為何 B 的行為線性獨立 (因而 y 為系 統的唯一解)。 從集合 J 及 I 的定義, 不難看 出經過適當的行與列重新排列以後, 矩陣 B 可化成如下的形狀:

"B˜ ∗ O B′′

#

,

其中 B′′如前面是B的子矩陣(bij)i6∈I,j6∈J, 而 B 是子矩陣 (b˜ ij)i∈I,j∈J 。 因 B′′ ∈ Q(A′′) 而 A′′ 為 L–矩陣, 所以 B′′ 的行為線性獨 立。 又 m × |J| 矩陣

"B˜ O

#

在右邊補上 −c 及對其行乘以適當的 ±1 可得矩陣 B, 但 B ∈ Q(A) 且 A 為 S–矩陣, 因此 B 的 任意 |J| 行為線性獨立, 故 ˜B 的行也為線性 獨立。 所以, 從以上 B 可化成的形狀可見, B 的行為線性獨立。

條件的必要性是利用矛盾證法及採取類 似的技巧, 從略。

我們稱一實向量為平衡 (balanced) 若 它是零向量或它含有最少一正元及最少一負 元; 否則, 則稱之為非平衡。 Klee, Ladner 及 Manber[10]提供下面 L–矩陣的刻劃, 證 明並不難, 讀者自己可試試看。

定理六: 設 A 為一 m × n 實矩陣, 其行為 a1, · · · , an 。 A 為 L–矩陣的充分而且必要 條件為對每一主對角線元為 0, 1 或 −1 的非 零對角矩陣 D, AD 最少有一列為非平衡。

從表面定義來看, 要判別一矩陣是否為 L–矩陣似乎我們須檢驗是否每一有給定符號 型的矩陣, 其行必為線性獨立, 這牽涉無限多 個條件。 以上的定理對 L–矩陣提供一個有限

(12)

步驟的判別准則。 在論文 [10], Klee, Lad- ner 及 Manber 還證明了在一般的情況判別 L–矩陣的問題屬 NP –完全; 換言之, 找不 到一時間為多項式函數的算則來判別 L–矩 陣。 即是判別符號非奇異方陣的問題是否屬 NP –完全, 到目前為止仍屬一懸問。 (主要的 原因為, 判別符號有向圖的迴路是否皆為負 的問題的時間複雜性尚待解決。)

在研究 L–矩陣 (或 S–矩陣) 時, 往往我 們只需考慮沒有零列的矩陣, 因為對一矩陣 補上或刪去零列並不會影響其為 L–矩陣 (或 S–矩陣) 的性質。 以下的結果告訴我們 L–矩 陣及 S–矩陣是有密切的關連的。

定理七: 設 A 為一 m × n 實矩陣且無零列。

對每一 k ∈ hni, 令 Ak 表示把 A 的第 k 行刪去所得的 m × (n − 1) 矩陣。 則 A 為 S–矩陣的充分而且必要條件為 m = n − 1, A 的每一列為平衡, 及每一 Ak 為 L–矩陣。

有趣的地方是, 判別 L–矩陣的問題 (在 一般情況底下) 屬 NP –完全, 又根據定理七 的結果, 判別 L–矩陣的問題好像只是判別 S –矩陣的問題的子問題, 但卻存在時間為多項 式函數的算則以判別 S–矩陣, 這算則當然不 是基於定理七的結果, 它是基於下面並不難 證明的觀察。

定理八: 設 A 為一 m × n 實矩陣, b 為 ℜm 的一向量。 線性系統 Ax = b 為符號可解, 且 它的解向量 x 為正向量的充分而且必要條件 為矩陣 (A : −b) 為 S–矩陣。

根據定理七的結果, 在研究 (A : −b) 是否為 S–矩陣時, 我們不妨假設此矩陣為

m×(m+1) (及沒有零列), 但根據定理八, 問 題便轉化成考慮線性系統 Ax = b 的符號可 解性及解向量是否為正向量, 是方陣的情況!

正如我們在第五節解釋過, 方陣的情況是可 化為考慮符號有向圖的可解性的問題, 而對 後面的問題 Hansen已提出一個時間為多項 式函數的算則。 因此, S –矩陣的判別問題並 非屬 NP –完全。

若 (A : −b) 為 S–矩陣, 則它的最後 一行 −b 所當的任務跟別的行並沒有什麼差 別, 所以研究工作者後來傾向處理 S–矩陣以 代替處理線性系統的符號可解性 (及其解向 量為正) 的問題。 另外, 他們把 S–矩陣類擴 大為 S–矩陣類。 所謂 S–矩陣是指由 S–

矩陣把某些行以它的負來代替而獲得的矩陣。

不難證得, 矩陣 (A : −b) 為 S–矩陣若且唯 若線性系統 Ax = b 為符號可解, 且其解向 量的元皆為非零 (此時, 我們稱系統為強符號 可解)。 對 S–矩陣及 S–矩陣的結構, Klee, Ladner 及 Manber 等人在論文 [8], [9]及 [10]曾作深入的探討。 以下是他們獲得的其中 一些 (頗深刻的) 結果:

定理九: 每一 S–矩陣至少有一列擁有恰好 兩個非零元。

定理十: 若把一 S–矩陣的某一非零元改變符 號, 則改變後的矩陣必然不為 S–矩陣。

定理十一: 若 A 為一 m×(m+1) S–矩陣, 則 A 的非零元個數必定介乎 2m 與 m(m+3)2 之間, 且此上、 下界的值都可以達到。

基於這些及其他結果, Klee 在論文 [8]提出一個時間複雜性為 O(m2) 的算則以

(13)

判別 m × (m + 1) S–矩陣及 S–矩陣。 跟 上文所提過的 Hansen 算則比較, Klee 的算 則可說是略勝一籌。

最近 Brualdi, Chavey 及 Shader 在 論文 [3]曾對長方 L–矩陣作深入的探討, 獲 得不少深刻的結果, 這裡不作介紹。

8. 結語

目前這個領域的研究仍是方興未艾。 例 如, 最近 Klee, Von Hohenbalken 及 Lewis 在論文 [11]引入 L–系統及 S–系統的概念, 作為 L–矩陣及 S–矩陣的推廣。 他們的理論 可以用來處理廣義的符號可解性問題; 譬如, 可考慮同時涉及強與弱不等式的系統, 諸如

"

≥ 0 < 0

> 0 = 0

# "

ξ1 ξ2

#

=

"

< 0

> 0

#

。 另一方面, 符號非奇異方陣的變體或特殊子 類也吸引了不少研究工作者的興趣; 見論 文[7, 12, 14]。

讀者若對這個領域有興趣, 可留意由 Brualdi及 Shader 合著即將出版的專書 [4]。

筆者尚未有機會看到該書, 但以這兩位作者 在這個領域的造詣, 相信該書是精彩可期。

在定性矩陣理論的發展歷史上有兩個重 要問題引起不少研究工作者的興趣, 其一為 本文所介紹的符號可解性問題, 另一為定性 穩定理論。 後者問題的解決涉及矩陣理論, 圖 形論及常微分方程理論。 有興趣的讀者可翻 看論文 [6]。

參考文獻

1. L. Bassett, J. Maybee, and J.

Quirk, Qualitative economics and the scope of the correspondence principle, Econo- metrica 26:544-563 (1968).

2. R.A. Brualdi, The symbiotic relation- ship of combinatorics and matrix the- ory, Linear Algebra Appl. 162-164:65- 105 (1992).

3. R.A. Brualdi, K.L. Chavey, and B.L.

Shader, Rectangular L-matrices, Lin- ear Algebra Appl. 196:37-61 (1994).

4. R.A. Brualdi and B. Shader, Sign- solvable linear systems and their matri- ces, Cambridge Tracts in mathematics, No. 116, Cambridge University Press, 1995.

5. P. Hansen, Recognizing signsolvable graphs, Discrete Appl. Math. 6:237- 241 (1983).

6. C. Jeffries, V. Klee and P. van den Driessche, Qualitative stability of linear system, Linear Algebra Appl. 87:1-48 (1987).

7. C.R. Johnson, D.D. Olesky and P. van den Driessche, Sign determinancy in LU factorization of P-matrices, Linear Algebra Appl. 217:155-166 (1995).

8. V. Klee, Recursive structure of S- matrices and an O(m2) algorithm for recognizing strong sign solvability, Lin- ear Algebra Appl. 96:233-247 (1987).

9. V. Klee and R. Ladner, Qualitative ma- trices: strong sign-solvability and weak satisfiability, in: H. Greenberg and J. Maybee, eds., Computer-Assisted Analysis and Model Simplification (Academic Press, New York, 1981) 293- 320.

(14)

10. V. Klee, R. Ladner, and R. Manber, Signsolvability revisited, Linear Alge- bra Appl. 59:131-157 (1984).

11. V. Klee, B. Von Hohenbalken and T.

Lewis, On the recognition of S-systems, Linear Algebra Appl. 192: 187-204 (1993).

12. G.M. Lady, T.J. Lundy and J. Maybee, Nearly sign-nonsignular matrices, Lin- ear Algebra Appl. 220: 229-248 (1995).

13. K. Lancaster, The scope of qualitative economics, Rev. Econom. Studies 29:

99-132 (1962).

14. T. Lundy, J.S. Maybee and A.K.

Sen, S-inverse matrices, Linear Alge- bra Appl. 217: 241-253 (1995).

15. R. Manber, Graph-theoretical appro-

ach to qualitative solvability of linear systems, Linear Algebra Appl. 48: 457- 470 (1982).

16. J. Maybee, Sign solvable graphs, Dis- crete Appl. Math. 2: 57-63 (1980).

17. J. Maybee, Sign solvability, in: H.

Greenberg and J. Maybee, eds., Computer-Assisted Analysis and Model Simplification (Academic Press,New York, 1981)201-257.

18. J. Maybee and J. Quirk, Qualitative problems in matrix theory, SIAM Rev.

11:30-51 (1962).

19. P.A. Samuelson, Foundations of Eco- nomic Analysis, Harvard U.P., 1947;

Atheneum, New York, 1971.

—本文作者任教於淡江大學數學系—

參考文獻

相關文件

[r]

This thesis investigates the equivalence of two sufficient conditions for the existence of stabilizing switching laws between unstable linear systems, and then employs the

ii 數種濾波技術於線性系統識別之可行性探討 研究生:楊維莘 指導教授:黃炯憲 博士 國立交通大學土木工程學系 摘 要

Basics of qualitative research: Techniques and procedures for developing grounded theory (2nd ed).. Consumer Behavior

The advantages of the proposed approach over the recursive approach on tracking the time varying modal parameters are demonstrated through processing the responses of

[6] Chung-Yu Wu and Cheng-Ta Chiang, &#34;A Low-photocurrent CMOS Retinal Focal-plane Sensor with Pseudo-BJT Smoothing Network and Adaptive Current Schmitt Trigger for Scanner

Totally 30 filamentous fungi were isolated from decaying leaves or twigs collected from Taipei City (Yangmingshan National Park), Taipei County (Huang Ti

(2002) and Pan and Chen (2002, 2003) have studied the robust D-stability problem (i.e., the robust eigenvalue-clustering in a specified circular region problem) for linear