定性線性系統導論

(1)

定性線性系統導論

譚必信

1. 前言

經濟學家 Paul Samuelson 於 1947 年在他的經典名著 Foundations of Eco- nomic Analysis[19]建議研究線性系統的定性。自那時候開始, 不少經濟學家、數學家、

計算機科學家、環境學家及化學家投入這方面的研究。特別的, 他們是注重符號可解性及符號穩定性這兩方面的問題。本文的目的是介紹前者的問題。

簡單來說, 所謂一個線性系統 (即線性方程組) Ax = b 為符號可解是指它的可解性及它的解向量的符號型是由矩陣 A 及向量 b 的符號型來決定。為了能說得明確, 讓我們先引入一些符號。實數 a 的符號是記作 sgn(a) ; sgn(a) 是等於 −, 0 或 +, 視乎 a 為負、零或正。 (為了方便, 有時候我們用 −1 及 1 來代替 − 及 + 。) 對任一實 m × n 矩陣 A, 我們以 Q(A) 表示由所有俱有 A 的符號型的實 m × n 矩陣構成的集合; 換言之, B ∈ Q(A) 若且唯若對所有 i, j, sgn(bij) = sgn(aij) 。我們稱線性系統 Ax = b 為符號可解 (sign-solvable) 若這系

統為可解, 且對任意 B ∈ Q(A), c ∈ Q(b), 系統 By = c 亦為可解且 y ∈ Q(x) 。

線性系統符號可解性的第一個基本問題自然為找出符號可解的等價條件。第一個問題解決以後, 值得研究的題目包括找出有效的判別算則及找出產生符號可解線性系統的方法。第一個問題目前已獲得完全解決, 在本文我們將作比較詳細的介紹。後面的兩個問題是相當困難, 且目前尚未完全獲得解決, 限於篇幅及筆者的學識, 在本文只是點到即止。

這裡我們需用到的工具主要是圖論 (在研究判別算則時, 凸集合理論及命題邏輯都是重要的工具, 但本文將不會接觸到這些)。

藉著這個機會, 在本文的第三節, 我們將介紹行列式的圖論表示法。 Brualdi在論文 [2]曾指出, 矩陣理論及組合學有一個共生的關係, 而產生這關係的緣由最少一部份可歸諸為矩陣理論有很大部份與行列式有關 (因為重要的概念如秩、特徵值等都可利用行列式來定義), 但行列式卻有一個圖論表示法。這個表示法是很有用處且並不難學習。可惜的是, 在大學部的線性代數課程通常都不會教到。

在下一節我們將舉一例子以說明定性分析如何在實際問題上可派上用場。

1

(2)

2. 一個比較靜態分析的實例

考慮一個單一商品的市場。假設該商品的需求量 Qd 為價格 p 及入息 y 的函數。另一方面, 我們假設商品的供應量 Qs 只是價格的函數。此時市場的剩餘需求函數 E 滿足方程:

E(p, y) = Qd(p, y) − Qs(p)。

譬如 p = p0, y = y0 為市場的平衡點; 即 E(p0, y0) = 0 。假設入息參數 y 在 y = y0

附近作微少變動時, 市場可以保持平衡。經濟學家所希望知道的為價格 p 應如何隨著 y 的變化而作調整才能夠保持市場的平衡。像這樣子的, 就是比較靜態分析 (comparative statics) 的一個基本問題。

這裡我們需用到的數學工具為隱函數存在定理。是很合理假設需求量 Qd 是入息 y 的增函數及價格 p 的減函數。另一方面, 我們又假設供應量 Qs 是價格 p 的增函數。換言之, 我們有:

∂Qd/∂p < 0, ∂Qd/∂y > 0, dQs/dp > 0。

所以, ∂E/∂p = ∂Qd/∂p − dQs/dp < 0

。根據隱函數存在定理, 在 y = y₀ 的鄰域, 存在函數 p(y) 使得 p(y0) = p0 且 E(p(y), y) = 0 。函數 p(y) 的導數可利用隱函數微分法求得:

∂E

∂p dp dy +∂E

∂y = 0, dp

dy = −∂E/∂y

∂E/∂p > 0。

這個不等式告訴我們價格 p 應該隨著入息 y 增加而增加纔可以保持市場的平衡!

以上的例子很難說服大家採用定性方法的好處, 因為它的結論並不令人驚奇, 這只是普通常識。但當我們所考慮的經濟系統是涉及多個商品及剩餘需求函數時, 普通常識或直覺感就不那麼可靠。在這裡不打算討論一般的情形, 讀者不難想像方法及問題基本上是一樣的, 祇是我們需要多變數的隱函數存在定理及採用矩陣的表示法。

定性分析的方法對很多門應用科學都有它的實用價值。特別的, 當資料不能準確 (或無法) 量化時, 能預測改變的方向總勝不能作任何預測。

3. 行列式與迴路乘積

設 A = (aij) 為一 n 階方陣。以 D(A) 表示 A 的有向圖; 換言之, D(A) 的頂點集合為 hni := {1, 2, · · · , n} 及存在一弧從 i 至 j, 記之以 (i, j), 若且唯若aij 6= 0 . 所謂D(A) 的 (簡單) 路徑是指在 D(A) 中經過相異頂點的一序列相接的邊; 即如 (i1, i2), (i2, i3), · · · , (il, il+1) (l ≥ 1) 為 D(A) 的弧, 且 i1, · · · , il+1 為相異的頂點。若 (i₁, i2), (i2, i3), · · · , (il, il+1) 為 D(A) 的弧, i₁, · · · , il 為相異, 且 i_l+1 = i1, 則我們得到 D(A) 的一迴路。路徑或迴路通常都記之以希臘字母 α, β, γ, · · · , 等。

若 α : (i₁, i₂), (i₂, i₃), · · · , (il, i_l+1) 為 D(A) 的一路徑, 則 A 相對 α 的路徑乘積是指矩陣 A 中對應 α 的邊之元的乘積, 即

(3)

ai1i2ai2i3· · · ailil+1, 並記之為 Πα(A) 。類似的我們也可以定義迴路乘積, 並以相同的符號表示。例如, 若 α 為迴路 (1, 4), (4, 3), (3, 2), (2, 1), 則 Πα(A) = a₁₄a₄₃a₃₂a₂₁ 。

茲談如何利用 A 之迴路乘積以表示 A 的行列式。設 A 為一 n 階方陣, 則 det A = ^P_πsgn(π)a1π(1)a2π(2)· · · anπ(n), 其中總和是對 1, 2, · · · , n 的所有排列 π 來算, 而 sgn(π) 是指排列 π 的符號 (是等於 1 若 π 為偶排列, 等於 −1 若 π 為奇排列)。今考慮 det A 的任一非零通項 sgn(π)a_1π(1)a_2π(2)· · · a_nπ(n) 。 π 作為一排列是可寫成一些循環排列的乘積, 如 π = τ1τ2· · · τk 。請注意, 若用 |τ | 表示循環排列 τ 移動的點的個數, 則 sgn(τ ) = (−1)^{|τ |+1} ; 因為若 τ = (i1i2· · · ik), 則 τ = (i₁i₂)(i₁i₃) · · · (i₁ik), 即 τ 可由 k − 1 = |τ | − 1 個轉置的乘積表示。另外, 乘積 ai1i2ai2i3· · · aiki1 (設為非零) 可表示成迴路乘積 Π_τ(A), 其中 τ 是指 D(A) 由弧 (i1, i2), (i2, i3), · · · , (ik−1, ik) 及 (ik, i1) 所構成的迴路。 (為了符號上的簡便, 這裡利用 τ 同時表示一循環排列及一迴路。) 現應不難瞭解下面的計算:

sgn(π)a1π(1)a2π(2)· · · anπ(n)

= sgn(τ₁· · · τk)Πτ1(A)Πτ2(A) · · · Πτk(A)

=

k

Y

i=1

[sgn(τi)Πτi(A)]

=

k

Y

i=1

[(−1)^|τⁱ^|+1Πτi(A)]。

從以上的分析得知 det A 是等於所有形如

Qk

i=1[(−1)^|τⁱ^|+1Πτi(A)] (即一些迴路乘積的

乘積再在前面冠上 ± 號) 的項之總和, 其中 τ₁, · · · τk 為 D(A) 的一組 (頂點) 互不相交的迴路, 其長度的總和 (即 ^P^k_i=1|τi|) 為 n

。若不存在這樣子的一組 D(A) 的迴路, 則 det A 的值為零。

茲舉一些例子以說明上面所提計算行列式的方法。

例1 :令

A =







a11 a12 0 0 a21 a22 a23 0 0 a32 0 a34

0 0 a43 a44







。

則 A 的有向圖 D(A) 為:

(這裡我們是假設 a11, a12, a21, a22, a23, a₃₂, a₃₄, a₄₃ 及 a₄₄ 為非零。但若當中有些是零, 則在以下計算 det A 的過程將產生一些零項, 但計算公式本身仍是成立的。) 此時 D(A) 包含下列的迴路:

α₁ : (1, 1) α2 : (2, 2) α3 : (4, 4) α4 : (1, 2), (2, 1) α₅ : (2, 3), (3, 2) α6 : (3, 4), (4, 3) 。

很明顯, 迴路α₁, α2及α6為互不相交, 且其長度的總和為4。這組迴路對det A產生項 [(−1)^|α¹^|+1a₁₁][(−1)^|α²^|+1a₂₂][(−1)^|α⁶^|+1a₃₄a₄₃]

(4)

= −a11a22a34a43 。同樣迴路 α1, α3

及 α₅ 也為互不相交, 且把 D(A) 的所有頂點都含蓋, 它們對det A 的貢獻為 (a₁₁)(a₄₄)(−a₂₃a₃₂) = −a₁₁a₄₄a₂₃a₃₂ 。另外, 迴路 α₄ 及 α₆ 對 det A 的貢獻為 (−a12a21) (−a34a43) = a12a21a34a43 。除此以外, 就找不到別的互不相交的迴路, 把 D(A) 的所有頂點都含蓋。因此, 我們得

detA = a12a21a34a43− a11a22a34a43

−a11a44a23a32。

例 2: 設 A 為一 4 階方陣, 其有向圖為:

此時在 D(A) 找不到一組迴路互不相交, 且把所有的頂點都含蓋。因此, det A = 0 。例3: 設 A 為一 4 階方陣, 其有向圖為:

答案為:det A = −a12a23a34a41 + a₂₂a₁₃a₃₄a₄₁ +a₁₂a₂₁a₃₄a₄₃ 。有興趣的讀者不妨自己動手算算看。

茲考慮餘因子的圖論表示法。先檢驗 4 階方陣 A = (aij) 的情形。以 Aij 表示 A 在 (i, j) 位置的餘因子。根據平常的定義, 我們有

A12 = (−1)¹⁺²det







a21 a23 a24

a31 a33 a34

a41 a43 a44







= a24a33a41+ a21a34a43+ a23a31a44

−a21a33a44− a23a34a41− a24a31a43。

試想一下在表示A₁₂的式子中, 是否每一項都可以利用A的迴路乘積及 (或) 路徑乘積來表示? 若把項a24a33a41 改寫成(a24a41)(a33), 則此項就等於 Πα1(A)Πα2(A), 其中α₁為路徑(2, 4), (4, 1), 一條從頂點2到頂點1的路徑, 而α2則為迴路(3, 3) 。可注意, 路徑α1及迴路α₂為互不相交的。事實上, a₂₄a₃₃a₄₁也等於 (−1)^|α¹^|Πα1(A) · (−1)^|α²^|+1Πα2(A)

。 [在這裡我們是假設α1及α2在有向圖 D(A)都有出現, 否則a₂₄a₃₃a₄₁為零, 對A₁₂ 沒有貢獻。]同樣地, 我們發現 a₂₁a34a43 = (−1)^|β¹^|Πβ1(A) · (−1)^|β²^|+1Πβ2(A), 其中β₁ 是路徑(2, 1) (也是從頂點2到頂點1) 及β₂為迴路 (3, 4), (4, 3)。另外, 又有−a₂₃a34a41 = (−1)^γΠγ(A), 其中 γ 為路徑(2, 3), (3, 4), (4, 1)。事實上,A₁₂ 的表示式子的每一項都可寫成以下的樣子:

(−1)^|α|Πα(A) ·

k

Y

i=1

[(−1)^|τⁱ^|+1Πτi(A)],

(5)

其中α為從頂點 2 到頂點 1 的某一路徑, k ≥ 0, τ1, · · · , τk為迴路, α, τ₁, · · · , τk為互不相交, 且把D(A)的所有頂點都含蓋。 (當 k = 0時, 應把 ^Q^k_i=1[(−1)^|τⁱ^|+1Πτi(A)] 看作等於1。) 為何是這樣子?

若把a12乘上A12的表示式子的各項, 就可以看出一些苗頭。例如, a₁₂(a₂₄a₃₃a₄₁) = [(−1)^|α¹^|a12Πα1(A)][(−1)^|α²^|+1Πα2(A)]。

這裡弧(1, 2)加上迴路 α₁就構成一迴路。讓我們把這迴路記作 ˜α1, 則 a12(a24a33a41)便可寫成 (−1)^{| ˜}^α¹^|+1Πα˜1(A)·(−1)^|α²^|+1Πα2(A), 即一些 (冠上±號的) 迴路乘積的乘積。還有, ˜α1, α2為互不相交, 且把D(A)的所有頂點都含蓋。與前面提到 detA 的圖論表示法比較, 得知我們獲得的是 detA 的其中一項。試換另一角度來看, 從公式detA = a11A11 + a12A12 + a13A13易見, 把a12乘上A₁₂的表示式子的各項將產生det A的一些項, 且這些項的圖論表示法都涉及一含有弧(1, 2)的迴路。

從以上的討論不難明白, 對任一n階方陣A, 餘因子Ars, r 6= s, 是所有能寫成下面樣子的項的總和:

(−1)^|α|Πα(A)

k

Y

i=1

[(−1)^|τⁱ^|+1Πτi(A)], 其中 α 為從頂點 s 至頂點 r 的某一路徑, τi 為迴路, k ≥ 0 (若 k = 0, 式子中涉及 Πτi(A) 的因子都不存在), α, τ1, · · · , τk 為互不相交, 且把 D(A) 的頂點都含蓋。

另從行列式的圖論表示法, 得知餘因子 Arr 為下面樣子的項的總和

k

Y

i=1

[(−1)^|τⁱ^|+1Πτi(A)],

其中 τ1, · · · , τk, k ≥ 1, 為互不相交的迴路, 且其含蓋的頂點為 hni\{r} 。

4. 符號非奇異方陣

符號非奇異方陣與線性系統的符號可解性問題有密切的關連。這節我們將介紹這類矩陣。

我們稱 n 階實方陣 A 為符號非奇異 (sign-nonsingular) 若每一屬 Q(A) 的實方陣皆為非奇異。例如: 方陣

"

1 1

−1 2

#

為符號非奇異, 因每一符號型為

"

+ +

− +

#

的實方陣, 其行列式必取正值。又每一主對角線元全為非零的實三角方陣必為符號非奇異。

實方陣 A 為符號非奇異的充分而且必要條件為 det A 的展開式含有非零項, 且非零項的符號皆相同。很明顯, 此條件為充分。

若 A 不滿足此條件, 則 det A 的展開式可能是沒有非零項或是存在異號的非零項。若是前者, 則必然 A 不為符號非奇異。若是後者, 設 sgn(σ)a_1σ(1)a2σ(2)· · · anσ(n) > 0 及 sgn(τ )a_{1τ (1)}a2τ (2)· · · anτ(n) < 0, 其中 σ, τ 為 1, 2, · · · , n 的排列。製造一擁有下面的性質的方陣 B ∈ Q(A) : B 的元與 A 相同位置的元為同號 ( +, − 或 0 ), b1σ(1), b2σ(2), · · · , bnσ(n)的絕對值皆為 1, 及 B 的其他非零元的絕對值皆為 ε, 其中 ε 為一正數。只要選取 ε 充分小, det B 的值必為正。類似地, 我們可以找到一方陣 C ∈ Q(A), 且滿足 det C < 0 。令 A(λ) = (1 − λ)B + λC 。顯然, 對每一實數 λ, 0 ≤ λ, A(λ) ∈ Q(A) . 可是det A(λ)

(6)

為定義在閉區間 [0, 1] 的一連續實函數, 且 det A(0) = det B > 0 及 det A(1) = det C < 0 。因此, 必存在某一 λ0 ∈ (0, 1) 使得 det A(λ₀) = 0 。所以, A 並不是符號非奇異。這樣子, 我們證明了條件的必然性。

det A 的展開式含有最少一非零項是實方陣 A 為符號非奇異的必要條件。當此條件已滿足時, 我們可以把 A 的列重新排列及乘以 ±1 而獲得一方陣, 其主對角線的元皆為負。在此假設底下, 我們可利用有向圖 D(A) 來刻劃 A 的符號非奇異性。

定理一: 設 A 為一 n 階實方陣, 其主對角線元皆為負。 A 為符號非奇異的充分而且必要條件為 A 的每一迴路乘積皆為負。當 A 為符號非奇異時, 對每一方陣 B ∈ Q(A), B 的 r 階主子行列式的符號皆為 (−1)^r 。證明 : 假設 A 的迴路乘積皆為負。令 B ∈ Q(A) 。如前一節解釋過, det B 展開式的非零項可表示成 Π^k_i=1[(−1)^|τⁱ^|+1Πτi(B)], 其中 τ₁, · · · τk(k ≥ 1) 為 D(B) = D(A) 的一組互不相交的迴路, 且 ^P^k_i=1|τi| = n 。根據假設, 對每一 i, 1 ≤ i ≤ k, Πτi(B) < 0 。因此, 可得 sgn^hΠ^k_i=1[(−1)^|τⁱ^|+1Πτi(B)]ⁱ= (−1)^P

k

i=1(|τi|+2)

= (−1)ⁿ。所以有 sgn[det(B)] = (−1)ⁿ 。這樣子, 我們證明了條件的充分性。採用類似的計算, 我們也可以證明命題的最後部份。

現假設 A 有一迴路 α 使得 Πα(A) >

0。設 |α| = l, 及令 i₁, i₂, · · · , i_n−l 為迴路 α 以外的頂點。則迴路 α, β1 : (i1, i1), β2 : (i₂, i₂), · · · , β_n−l : (i_n−l, i_n−l) 為互不相交,

且把 D(A) 的所有頂點含蓋。讀者稍作計算可發現, 在 det A 的展開式中對應這組迴路的項的符號為 (−1)ⁿ⁺¹ 。但 A 的主對角線元之乘積的符號為 (−1)ⁿ 。因此, det A 的展開式含有異號的非零項; 故 A 並不是符號非奇異。

5. 符號可解性—方陣的情況

設 A 為一 n 階實方陣, b 為 ℜⁿ 的一向量 (用 n × 1 行向量來表示)。線性系統 Ax = b 可以用 n × (n + 1) 矩陣 (A : b) 來表示。若 Ax = b 為一符號可解的系統, 不難看出, 經過下列 (單一或合成) 的運算所獲得的每一系統也必然為符號可解:

(1) 重新排列 (A : b) 的列;

(2) 重新排列 A 的行;

(3) 對 (A : b) 的某一列乘上 −1 ; (4) 對 A 的某一行乘上 −1 。

畢竟, 以上的運算對系統 Ax = b 而言, 等於是對方程或變數重新給予編號, 或對某一方程或某一變數乘以 −1 。我們稱以上的四種運算為容許定性運算。利用這些運算我們可以把矩陣 (A : b) 化成 A 的主對角線元皆取負值, 而向量 b 的各元皆為非負。可採取這樣子的步驟: 先重新排列 (A : b) 的列使得 A 的主對角線元皆為非零 [ 若辦不到, 則 A 必然不是符號非奇異, 而原來的系統 Ax = b 則必然不是符號可解 ], 然後對 (A : b) 的列乘以 ±1 使得 b 為一非負向量。最後對 A 的行乘以 ±1 使得 A 的主對角線元皆為負。對已化成這樣子的系統 Ax = b, 我們將給予其為符號可解的等價條件。

(7)

定理二: 設 A 為一 n 階實方陣其主對角線元皆為負數, b = (b1, · · · , bn)^t 為一 n × 1 非負向量。線性系統 Ax = b 為符號可解的充分而且必要條件為下列的條件皆成立:

(i) A 的迴路乘積皆取負值;

(ii) 令 M = {j ∈ hni : bj > 0} 。對任意 k, j ∈ M, k 6= j, 若 α 為從頂點 k 至 j 的一路徑, 則 Πα(A) > 0 。對任意 k ∈ hni\M, 所有從 k 至 M 的某一頂點的路徑 β 的對應路徑乘積 Πβ(A) 皆取相同符號。

當等價條件已滿足時, 解向量 x 的符號有如下的性質: 若 k ∈ M, 則 sgn(xk) 等於 −1 。若 k 6∈ M, 如不存在從頂點 k 至 M 的某一頂點的路徑, 則 sgn(xk) 等於 0 ; 如所有從頂點 k 至 M 的某一頂點的路徑 β 的對應路徑乘積 Πβ(A) 皆為正 (或皆為負), 則 sgn(xk) 等於 −1 (或 1 )。

證明: 假設線性系統 Ax = b 為符號可解。則 A 必然為符號非奇異方陣, 否則, 存在奇陣方陣 B ∈ Q(A) 。此時, 系統 Bx = b 或是無解, 若有解, 則其解向量的符號並不全部相同, 因它的解集合可寫成 x0+ ker(B) 的樣子, 其中 x0 為一解向量, ker(B) 為 B 的零空間, 且其維度最少為 1 。這與系統 Ax = b 為符號可解的假設產生矛盾。

因 A 為符號非奇異, 且其主對角線元全為負, 根據定理一, 條件 (i) 必然成立。

線性系統 Ax = b 為符號可解意指對任意 B ∈ Q(A) 及 c ∈ Q(b), 向量 B⁻¹c 的符號為固定; 換言之, 對任意 k ∈ hni, (B⁻¹c)_k 的符號為固定。 (B⁻¹c)_k是由 B⁻¹的第 k 列與 c 的乘積來決定。事實上, 計算這個乘積時

我們只須利用 B⁻¹ 的第 k 列而行位置屬 M 的元, 因 cj = 0 若 j 6∈ M 。茲證明對任何 k ∈ hni, j ∈ M, 不管怎樣從 Q(A) 選取 B, b⁽⁻¹⁾_kj 的符號為固定, 其中 b⁽⁻¹⁾_kj 是表示 B⁻¹ 的 (k, j) 元。因 A 為符號非奇異, 根據定理一, 若 B ∈ Q(A), 則 sgn(det B) = (−1)ⁿ 。又 b⁽⁻¹⁾_kj = Bjk/ det B, 所以 sgn(b⁽⁻¹⁾_kj ) = (−1)ⁿsgn(Bjk) 。我們分三種情況來討論 Bjk 的符號:

(一) 不存在 D(A) 的路徑從 k 至 j;

(二) 存在 D(A) 的路徑從 k 至 j, 且對所有這樣子的路徑 α, 路徑乘積 Πα(A) 的符號皆為相同;

(三) 存在 D(A) 的路徑從 k 至 j, 及存在兩條這樣子的路徑其對應的路徑乘積取相反符號。

根據計算餘因子的圖論表示法, 第一種情形發生時, b⁽⁻¹⁾_kj 恆為零; 在第二種情形發生時, 稍作計算可得 sgn(Bjk) = (−1)ⁿ⁺¹ (或 (−1)ⁿ ) 若所有從 k 至 j 的路徑的對應路徑乘積皆為正 (或皆為負)。顯然, 在第一種或第二種情形發生時, Bjk(因而 b⁽⁻¹⁾_kj ) 的符號為固定。若是在第三種情形, 必然可找到某一 B ∈ Q(A) 使得 sgn(b⁽⁻¹⁾_kj ) = 1, 亦可找到另一 ˜B ∈ Q(A) 使得 sgn(˜b⁽⁻¹⁾_kj ) = −1

。取一實向量 c ∈ Q(b) 使得 cj = 1 (注意: j ∈ M ) 及其別的非零元的絕對值為充分小, 則 (B⁻¹c)_k 的符號與 b⁽⁻¹⁾_kj cj 的相同, 換言之, sgn[(B⁻¹c)_k] = 1 。同理, 可得 sgn[( ˜B⁻¹c)_k] = −1 。所以, 當系統 Ax = b 為符號可解時, 第三種情形不會發生。

以上我們證明了 b⁽⁻¹⁾_kj 的符號與 B 從 Q(A) 的選取無關。事實上, 我們可獲得更強

(8)

一點的結論: 對任意 k ∈ hni, B⁻¹ 的第 k 列而行位置屬 M 的非零元必取同號; 否則, 固定 B, 從 Q(b) 選取適當的 c, 我們發現 (B⁻¹c)_k 可為正亦可為負, 這是一矛盾。因此, 我們證得對任意 k ∈ hni, 所有路徑乘積 Πα(A), 其中 α 為從頂點 k 至 M 的某一頂點的路徑, 皆取同號。

現考慮解向量 x 的符號。設 k ∈ M 。利用定理一, 可得 sgn(a⁽⁻¹⁾_kk ) = sgn(Akk/ det A) = (−1)ⁿ⁻¹/(−1)ⁿ =

−1 。取一向量 c ∈ Q(b) 使得 ck = 1 及 c 的別的非零元的絕對值為充分小, 則 sgn(xk) = sgn((A⁻¹c)_k) = sgn(a⁽⁻¹⁾_kk ck) = −1 。但系統 Ax = b 為符號可解, 故 xk 的符號必為 −1 。若 k 6∈ M, 根據前面的分析, 對任意 j ∈ M, 我們可以決定 sgn(Akj), 因此可計算出 sgn(xk), 正如定理所述。

令 α 為從 k 至 j 的一路徑, 且 j, k ∈ M 。茲說明路徑乘積 Πα(A) 何以必然為正。在 Q(A) 取一方陣 B, 使得每一對應屬 α 的弧的元為 ±1, 而別的非零元的絕對值卻為充分小。從直接計算可得 sgn(Bjk) = (−1)ⁿ⁺¹sgn(Πα(A)) ; 因此有 sgn(b⁽⁻¹⁾_kj ) = sgn(Bjk)/sgn(det(A)) =

−sgn(Πα(A)) 。現取一向量 c ∈ Qb

使得 cj = 1, 但 c 的別的非零元的絕對值卻為充分小。則 sgn((B⁻¹c)_k) = sgn(b⁽⁻¹⁾_kj )sgn(cj) = −sgn(Πα(A)) 。因 k ∈ M, 在前面已證得 sgn((B⁻¹c)_k) = sgn(xk) = −1 。所以, 我們有 Πα(A) > 0 。

以上我們已證明了條件的必要性及定理的最後面部份。在證明定理的最後面部份時, 我們實際上已同時證明了條件的充分性。

若我們考慮的線性系統 Ax = b 不單祇滿足先決條件 aii < 0, ∀i ∈ hni 及 b ≥ 0, 且還假設它有一非正的解向量 x, 則此系統為符號可解有比較簡單的刻劃。

定理三: 設 A 為一 n 階實方陣, 其主對角線元皆為負數, b 為一非負向量。又假設線性系統 Ax = b 有一非正的解向量。則此系統為符號可解若且唯若下面的條件皆成立:

(i) A 的迴路乘積皆取負值;

(ii) 若 bj > 0, 則對每一終點為頂點 j 的路徑α, 恆有 Πα(A) > 0 。

在文獻上能找到有關線性系統的符號可解性的刻劃多以定理三的形式出現。此結果可從定理二馬上得到。當考慮的系統的變數很少時, 我們可以利用定理二來判別它是否為符號可解。但當考慮的系統為很大 (須利用計算機的幫助) 時, 利用定理三來判別系統的符號可解性是較為適宜。那時候, 我們可以採取下面的步驟來判別系統 Ax = b (其中 A 為 n 階方陣及 b 屬 ℜⁿ ) 是否為符號可解:

(1) 利用容許定性運算把矩陣 (A : b) 化成 (A^∗ : b^∗), 其中 A^∗ 的主對角線元皆為負及 b^∗ ≥ 0 。

(2) 找出方程 A^∗y = b^∗ 的一解向量 y 。 (若沒有解, 則原系統必定不是符號可解。) (3) 令 M = {j ∈ hni : b^∗_j > 0} 。對每一 k ∈ M, 檢驗是否有 yk < 0 。若否, 則原系統必定不是符號可解。 (理由可從定理二看出來。)

(9)

(4) 對每一 k ∈ hni, 若 yk > 0 則對 (A^∗ : b^∗) 的第 k列乘以 −1 及對 A^∗ 的第 k 行乘以 −1 。 (這樣做不會改變a^∗_kk, 亦不會改變 b^∗_k, 因 b^∗_k = 0 ; 而變數 yk 則以它的負值來代替, 所以變為負。) 設 ˆAˆy = ˆb 為經轉換最後得到的系統, 則 ˆA 的主對角線元皆為負, ˆb ≥ 0 及 ˆy ≤ 0 。

(5) 利用定理三的結果來判別系統 ˆAˆy = ˆb (從而原系統 Ax = b ) 的符號可解性。

第五個步驟須克服的, 其實是一個圖論問題。在這方面 Maybee[16], Klee及 Lad- ner[9], Manber[15], Hansen[5]等人做了不少相關的工作。在研究過程他們引入了符號可解有向圖 (sign solvable digraph) 的概念。這是我們下一節的主題。

6. 符號可解有向圖

所謂符號有向圖是指一不含圈 (loops) 的有向圖, 其每一弧都冠以 + 或 − 號 (分別稱為正弧及負弧)。對每一實方陣 A, 它的對應符號有向圖, 記作 SD(A), 是指有向圖 D(A) 扣除所有可能存在的圈, 弧 (i, j) 是冠以 + 或 − 號視乎 a_ij 是正或負。稱一路徑或迴路為正 (或負) 若構成這路徑或迴路的所有弧的符號乘積為正 (或負)。令 j 為符號有向圖 D 的一頂點, 我們稱 j 為特異頂點若所有以頂點 j 為終點的路徑 (若存在) 皆為正。 (必須強調的一點是, 我們提及的路徑或迴路都是簡單的。) 若 j 為特異頂點, 則任何以 j 為終點的路徑的所有弧都是正的; 因為若 α 是以 j 為終點的一路徑, 且含有負弧,

則必可找到 α 的一子路徑以 j 為終點, 且只含有一負弧。

我們稱符號有向圖 D 為符號可解若 D 的所有迴路皆為負, 且 D 的每一最大強連通子圖至少含有一特異頂點。茲舉一例子以說明以上的定義。

例4: 令 D 為以下的符號有向圖:

這裡我們是以實線表示正弧, 以虛線表示負弧。容易看在 D 恰好有兩迴路, 且皆為負迴路。 D 有兩個最大強連通子圖, 分別由頂點集合 {1, 2, 3, 4} 及 {5} 產生。又頂點 2 及 5 為 D 僅有的特異頂點。因此, 根據定義 D 為符號可解。

若我們把 D 的弧 (5, 3) 的符號改為負, 則頂點 2 就不是奇異, 而改變後的符號有向圖也不是符號可解。

比較定理三的結果及符號可解有向圖的定義, 可得下面的結果:

定理四: 設 A 為一 n 階實方陣其主對角線元皆為負數, b 為一非負向量, 假設線性系統 Ax = b 有一非正的解向量。則系統 Ax = b 為符號可解若且唯若符號有向圖 SD(A) 為

(10)

符號可解, 且 {j ∈ hni : bj > 0} 是包含在由 SD(A) 的奇異頂點構成的集合。

Hansen[5]對符號可解有向圖提供下面的刻劃:

定理五: 設 D 為一符號有向圖。以 D⁺ 表示 D 的正部份子圖; D⁺ 的頂點集合跟 D 完全相同, 它的弧集合是由 D 的正弧構成。

D 為符號可解的充分而且必要條件為下面的兩條件皆成立:

(1) D⁺ 不包含任何迴路。

(2) D 的每一最大強連通子圖含有一特異頂點。

很明顯, 定理五所給的條件是 D 為符號可解的必要條件。為了證明條件為充分, 可採用矛盾證法。假設條件 (1) 及 (2) 皆成立, 但 D 含有一擁有負弧的正迴路 α 。當然, α 必包含在 D 的某一最大強連通子圖, 設為 C 。根據條件 (2), C 含有一特異頂點 k

。此時並不難找到一負路徑以 k 為終點, 這與 k 為特異頂點的假設產生矛盾。有興趣的讀者可嘗試作這條負路徑或參考原文 [5]。

依據定理五的刻劃, Hansen 提出以下四個步驟來判別符號有向圖 D 是否為可解:

步驟一: 考慮D的正部份子圖D⁺。檢驗D⁺ 是否含有迴路; 若有, 則D不為符號可解。

步驟二: 決定D的所有最大強連通子圖。

步驟三: 決定D的非特異頂點並給它們標號。

步驟四: 在步驟三沒有給予標號的頂點就是D 的特異頂點。檢驗是否D的每一最大強連通子圖皆包含一特異頂點。若是, 則D為符號可解; 若否, 則D不是。

步驟一及步驟二分別可利用現成的算則, 而步驟三的實施則是基於下面的觀察: 若 k 為 D 的非特異頂點, 則存在一路徑 α 以 k 為終點, 且 α 含有恰好一負弧並以此弧作開始。 Hansen有算過, 四個步驟總共所花的時間複雜性為 O(mn), 其中 n 是指 D 的頂點個數, 而 m 則是弧的個數。至於細節這裡從略。

另外, 研究工作者對符號可解有向圖及不含正迴路的有向圖的構造都有深入的探討, 限於篇幅, 這裡不逐一介紹。

7. 符號可解性—長方矩陣的情況

對一般長方實矩陣A, 判別線性系統Ax = b 的符號可解性問題是可轉化成研究 L –矩陣及 S –矩陣的問題。先介紹這兩類矩陣。

令 A 為一 m × n 實矩陣。以 N(A) 表示所有屬 Q(A) 的矩陣的零空間之聯集; 換言之, 向量 x ∈ ℜⁿ 屬 N(A) 若且唯若存在 A ∈ Q(A), 使得 ˜˜ Ax = 0 。稱矩陣 A 為 L–矩陣若 N(A) = {0} ; 稱 A 為 S –矩陣若 N(A) = ℜⁿ₋^S{0}^Sℜⁿ₊, 其中 ℜⁿ₊ ( ℜⁿ₋ ) 是指由 ℜⁿ 所有元皆為正 (負) 的向量組成的集合。很明顯, A 為 L –矩陣的一等價條件為每一屬 Q(A) 的矩陣的行皆為線性獨立。當然, 符號非奇異方陣必定是 L –矩陣。

也不難看到 A 為 S –矩陣若且唯若對每一 A ∈ Q(A), ˜˜ A 的零空間為一維, 且通過開正象限 ℜⁿ₊ (一個等價的說法為, ˜A 的行構成一

(11)

n − 1 維的單純形 (simplex) 的頂點, 且這單純形的相對內點集合包括空間的原點)。

線性系統 Ax = b 的符號可解性問題可以如下轉換成研究 L–矩陣及 S–矩陣的問題。設 x = (x1, · · · , xn)^t∈ ℜⁿ 滿足線性系統 Ax = b, 令 A 的行為 a₁, a2, · · · , an 。這裡每一 ai 都屬於 ℜ^m 。又令

J = {j : xj 6= 0} 及

I = {i : 對某一 j ∈ J, aij 6= 0}。

照如下的方法定義一 m × (|J| + 1) 矩陣 A^′, 並以 a^′_j, j ∈ J^S{n+1}, 表示它的 j–行 (注意: A^′ 行指標集合為 ˜J = J^S{n+1}, 而不是 h|J| + 1i, 這是為了將來表達上的方便):

a^′_j = aj 或 −aj 視乎 xj > 0 或 xj < 0, 並以 −b 作為 A^′ 的最後一行 a^′_n+1。另外, 以 A^′′ 表示 A 的 (m − |I|) × (n − |J|) 子矩陣 (aij)_{i6∈I,j6∈J} 。則系統 Ax = b 為符號可解若且唯若 A^′ 為 S–矩陣及 A^′′ 為 L–矩陣。下面我們將對條件的充分性給予證明。

假設 A^′ 為 S–矩陣而 A^′′ 為 L–矩陣。

考慮線性系統 By = c, 其中 B ∈ Q(A) 及 c ∈ Q(b) 為任意。在 A^′ 及 A^′′ 的定義以 B 代替 A 及 c 代替 b (但仍採用原來的向量 x ) 可分別得矩陣 B^′ 及 B^′′ 。顯然我們有 B^′ ∈ Q(A^′) 及 B^′′ ∈ Q(A^′′) 。因 A^′ 為 S–矩陣, 在 B^′ 的零空間存在一正向量 u = (uj)_{j∈ ˜}_J, 且 un+1 = 1 。對每一 j ∈ J, 令 yj = uj 若 xj > 0, yj = −uj

若 x_j < 0, 並令 yj = 0 若 j ∈ hni\J 。從 B^′u = 0 可得 ^P_j∈J ujb^′_j = −b^′_n+1, 亦即

P

j∈J yjbj = c, 或 By = c 。因此線性系統 By = c 擁有一解 y, 且 y ∈ Q(x)。只剩下解釋為何 B 的行為線性獨立 (因而 y 為系統的唯一解)。從集合 J 及 I 的定義, 不難看出經過適當的行與列重新排列以後, 矩陣 B 可化成如下的形狀:

"B˜ ∗ O B^′′

#

,

其中 B^′′如前面是B的子矩陣(bij)_{i6∈I,j6∈J}, 而 B 是子矩陣 (b˜ ij)_i∈I,j∈J 。因 B^′′ ∈ Q(A^′′) 而 A^′′ 為 L–矩陣, 所以 B^′′ 的行為線性獨立。又 m × |J| 矩陣

"B˜ O

#

在右邊補上 −c 及對其行乘以適當的 ±1 可得矩陣 B^′, 但 B^′ ∈ Q(A^′) 且 A^′ 為 S–矩陣, 因此 B^′ 的任意 |J| 行為線性獨立, 故 ˜B 的行也為線性獨立。所以, 從以上 B 可化成的形狀可見, B 的行為線性獨立。

條件的必要性是利用矛盾證法及採取類似的技巧, 從略。

我們稱一實向量為平衡 (balanced) 若它是零向量或它含有最少一正元及最少一負元; 否則, 則稱之為非平衡。 Klee, Ladner 及 Manber[10]提供下面 L–矩陣的刻劃, 證明並不難, 讀者自己可試試看。

定理六: 設 A 為一 m × n 實矩陣, 其行為 a₁, · · · , an 。 A 為 L–矩陣的充分而且必要條件為對每一主對角線元為 0, 1 或 −1 的非零對角矩陣 D, AD 最少有一列為非平衡。

從表面定義來看, 要判別一矩陣是否為 L–矩陣似乎我們須檢驗是否每一有給定符號型的矩陣, 其行必為線性獨立, 這牽涉無限多個條件。以上的定理對 L–矩陣提供一個有限

(12)

步驟的判別准則。在論文 [10], Klee, Lad- ner 及 Manber 還證明了在一般的情況判別 L–矩陣的問題屬 NP –完全; 換言之, 找不到一時間為多項式函數的算則來判別 L–矩陣。即是判別符號非奇異方陣的問題是否屬 NP –完全, 到目前為止仍屬一懸問。 (主要的原因為, 判別符號有向圖的迴路是否皆為負的問題的時間複雜性尚待解決。)

在研究 L–矩陣 (或 S–矩陣) 時, 往往我們只需考慮沒有零列的矩陣, 因為對一矩陣補上或刪去零列並不會影響其為 L–矩陣 (或 S–矩陣) 的性質。以下的結果告訴我們 L–矩陣及 S–矩陣是有密切的關連的。

定理七: 設 A 為一 m × n 實矩陣且無零列。

對每一 k ∈ hni, 令 Ak 表示把 A 的第 k 行刪去所得的 m × (n − 1) 矩陣。則 A 為 S–矩陣的充分而且必要條件為 m = n − 1, A 的每一列為平衡, 及每一 Ak 為 L–矩陣。

有趣的地方是, 判別 L–矩陣的問題 (在一般情況底下) 屬 NP –完全, 又根據定理七的結果, 判別 L–矩陣的問題好像只是判別 S –矩陣的問題的子問題, 但卻存在時間為多項式函數的算則以判別 S–矩陣, 這算則當然不是基於定理七的結果, 它是基於下面並不難證明的觀察。

定理八: 設 A 為一 m × n 實矩陣, b 為 ℜ^m 的一向量。線性系統 Ax = b 為符號可解, 且它的解向量 x 為正向量的充分而且必要條件為矩陣 (A : −b) 為 S–矩陣。

根據定理七的結果, 在研究 (A : −b) 是否為 S–矩陣時, 我們不妨假設此矩陣為

m×(m+1) (及沒有零列), 但根據定理八, 問題便轉化成考慮線性系統 Ax = b 的符號可解性及解向量是否為正向量, 是方陣的情況!

正如我們在第五節解釋過, 方陣的情況是可化為考慮符號有向圖的可解性的問題, 而對後面的問題 Hansen已提出一個時間為多項式函數的算則。因此, S –矩陣的判別問題並非屬 NP –完全。

若 (A : −b) 為 S–矩陣, 則它的最後一行 −b 所當的任務跟別的行並沒有什麼差別, 所以研究工作者後來傾向處理 S–矩陣以代替處理線性系統的符號可解性 (及其解向量為正) 的問題。另外, 他們把 S–矩陣類擴大為 S^∗–矩陣類。所謂 S^∗–矩陣是指由 S–

矩陣把某些行以它的負來代替而獲得的矩陣。

不難證得, 矩陣 (A : −b) 為 S^∗–矩陣若且唯若線性系統 Ax = b 為符號可解, 且其解向量的元皆為非零 (此時, 我們稱系統為強符號可解)。對 S–矩陣及 S^∗–矩陣的結構, Klee, Ladner 及 Manber 等人在論文 [8], [9]及 [10]曾作深入的探討。以下是他們獲得的其中一些 (頗深刻的) 結果:

定理九: 每一 S^∗–矩陣至少有一列擁有恰好兩個非零元。

定理十: 若把一 S–矩陣的某一非零元改變符號, 則改變後的矩陣必然不為 S–矩陣。

定理十一: 若 A 為一 m×(m+1) S^∗–矩陣, 則 A 的非零元個數必定介乎 2m 與 ^m(m+3)₂ 之間, 且此上、下界的值都可以達到。

基於這些及其他結果, Klee 在論文 [8]提出一個時間複雜性為 O(m²) 的算則以

(13)

判別 m × (m + 1) S–矩陣及 S^∗–矩陣。跟上文所提過的 Hansen 算則比較, Klee 的算則可說是略勝一籌。

最近 Brualdi, Chavey 及 Shader 在論文 [3]曾對長方 L–矩陣作深入的探討, 獲得不少深刻的結果, 這裡不作介紹。

8. 結語

目前這個領域的研究仍是方興未艾。例如, 最近 Klee, Von Hohenbalken 及 Lewis 在論文 [11]引入 L–系統及 S–系統的概念, 作為 L–矩陣及 S–矩陣的推廣。他們的理論可以用來處理廣義的符號可解性問題; 譬如, 可考慮同時涉及強與弱不等式的系統, 諸如

"

≥ 0 < 0

> 0 = 0

# "

ξ₁ ξ2

#

=

"

< 0

> 0

#

。另一方面, 符號非奇異方陣的變體或特殊子類也吸引了不少研究工作者的興趣; 見論文[7, 12, 14]。

讀者若對這個領域有興趣, 可留意由 Brualdi及 Shader 合著即將出版的專書 [4]。

筆者尚未有機會看到該書, 但以這兩位作者在這個領域的造詣, 相信該書是精彩可期。

在定性矩陣理論的發展歷史上有兩個重要問題引起不少研究工作者的興趣, 其一為本文所介紹的符號可解性問題, 另一為定性穩定理論。後者問題的解決涉及矩陣理論, 圖形論及常微分方程理論。有興趣的讀者可翻看論文 [6]。

參考文獻

1. L. Bassett, J. Maybee, and J.

Quirk, Qualitative economics and the scope of the correspondence principle, Econo- metrica 26:544-563 (1968).

2. R.A. Brualdi, The symbiotic relation- ship of combinatorics and matrix theory, Linear Algebra Appl. 162-164:65- 105 (1992).

3. R.A. Brualdi, K.L. Chavey, and B.L.

Shader, Rectangular L-matrices, Lin- ear Algebra Appl. 196:37-61 (1994).

4. R.A. Brualdi and B. Shader, Sign- solvable linear systems and their matrices, Cambridge Tracts in mathematics, No. 116, Cambridge University Press, 1995.

5. P. Hansen, Recognizing signsolvable graphs, Discrete Appl. Math. 6:237- 241 (1983).

6. C. Jeffries, V. Klee and P. van den Driessche, Qualitative stability of linear system, Linear Algebra Appl. 87:1-48 (1987).

7. C.R. Johnson, D.D. Olesky and P. van den Driessche, Sign determinancy in LU factorization of P-matrices, Linear Algebra Appl. 217:155-166 (1995).

8. V. Klee, Recursive structure of S- matrices and an O(m²) algorithm for recognizing strong sign solvability, Lin- ear Algebra Appl. 96:233-247 (1987).

9. V. Klee and R. Ladner, Qualitative matrices: strong sign-solvability and weak satisfiability, in: H. Greenberg and J. Maybee, eds., Computer-Assisted Analysis and Model Simplification (Academic Press, New York, 1981) 293- 320.

(14)

10. V. Klee, R. Ladner, and R. Manber, Signsolvability revisited, Linear Alge- bra Appl. 59:131-157 (1984).

11. V. Klee, B. Von Hohenbalken and T.

Lewis, On the recognition of S-systems, Linear Algebra Appl. 192: 187-204 (1993).

12. G.M. Lady, T.J. Lundy and J. Maybee, Nearly sign-nonsignular matrices, Lin- ear Algebra Appl. 220: 229-248 (1995).

13. K. Lancaster, The scope of qualitative economics, Rev. Econom. Studies 29:

99-132 (1962).

14. T. Lundy, J.S. Maybee and A.K.

Sen, S-inverse matrices, Linear Alge- bra Appl. 217: 241-253 (1995).

15. R. Manber, Graph-theoretical appro-

ach to qualitative solvability of linear systems, Linear Algebra Appl. 48: 457- 470 (1982).

16. J. Maybee, Sign solvable graphs, Dis- crete Appl. Math. 2: 57-63 (1980).

17. J. Maybee, Sign solvability, in: H.

Greenberg and J. Maybee, eds., Computer-Assisted Analysis and Model Simplification (Academic Press,New York, 1981)201-257.

18. J. Maybee and J. Quirk, Qualitative problems in matrix theory, SIAM Rev.

11:30-51 (1962).

19. P.A. Samuelson, Foundations of Eco- nomic Analysis, Harvard U.P., 1947;

Atheneum, New York, 1971.

—本文作者任教於淡江大學數學系—

定性線性系統導論