• 沒有找到結果。

從等比級數談起

N/A
N/A
Protected

Academic year: 2022

Share "從等比級數談起"

Copied!
12
0
0

加載中.... (立即查看全文)

全文

(1)

從等比級數談起

謹以此文紀念中央研究院數學所陳明博教授 (1941.6.23 - 1997.12.9)

林琦焜

單研究人, 獲得的是沒有靈魂的知識軀殼, 單研究書籍, 獲得的是沒有血肉的知 識的魂。 看見, 並且觀察; 閱讀, 並且反省, 便是走在通往知識的正途上, 但必須在探 討別人的心時, 不忽略自己的心。

— Caleb Colton —

前言

山不在高, 有仙則名; 水不在深, 有龍則 靈。 數學也是如此, 常常我們只為了尋求很難 的問題而將周遭切身的真理疏忽了, 以致淪 為耍雜技, 訓練有素的猴子, 或者最後一無所 有。 在此筆者要特別呼籲 “好的數學”(good mathematics) 就是以越簡單的方法來解決 困難的問題。 如果要拔一根草需要開一部割 草機或用大斧頭, 那實在是“有夠蠢”。 就好比 有人在小學, 先學了中學數學, 利用中學數學 來解小學的題目, 無知的大眾都說這是天才, 但筆者則認為這頂多是另一隻耍雜技的猴子。

我們將從等比數列談起, 而後想辦法將 此觀念推廣, 為了解決此問題, 自然而然矩陣 的觀念就被引進, 除了介紹矩陣之外, 我們特

別對 Fibonacci 數列作了深入之研究, 當然 我們的方法並沒有限定在此數列對其他的數 列, 讀者也可嘗試。

我們在此文特別要探討的是“固有值”, 除了以數列的角度來看之外, 也將由極值與 微分方程的角度來思考, 最後要說的是“固有 值就在你身邊”。

1. 等比數列, Fibonacci 數列

相信諸位在國中就學過等比數列, 而且 也專精於此, 跟大家談這個題目也並不是要 欺負你們, 而實在是常常許多真理在我們身 邊, 卻不時為我們所疏忽。 在這個專題中我們 要強調的是深奧的數學常常是寓含在熟悉的 數學中。

42

(2)

回顧一下等比數列

a

0

, a

1

, a

2

, . . . , a

n

, a

n+1

, . . . a

n+1

a

n

= λ, n = 0, 1, 2, (1.1) λ就是公比, 等比數列方便之處在於只需知道 數列中任一項則每一項自然就尾隨而至, 換 句話說, 描述等比數列僅需一個參數 (pa- rameter) 即足夠

a

n

= λ

n

a

0

, a

0

R

(1.2) 或者我們可以這麼說, 這是一個一維的 (one dimensional) 問題, 但等比數列畢竟是少數 的特例, 看個出名的 Fibonacci 數列

0, 1, 1, 2, 3, 5, 8, 13 . . . (1.3) 仔細觀察不難看出其遞推關係為

a

0

= 0, a

1

= 1, . . . , a

n+2

= a

n+1

+a

n

, n≥ 0 (1.4) 基本上這是一個差分方程 (difference equa- tion)。 現在的問題是如何求得第n項, 例 如a

100

? 對於第n項是否有相類似於等比數 列 (1.2) 之公式呢? 首先我們先解決 Fi- bonacci 數列的問題, 典型的方法如下: 由 遞迴關係

a

n+2

= a

n+1

+ a

n

知處於中間媒介的a

n+1

如果可分解成兩部份 a

n+1

= (α + β)a

n+1

, α+ β = 1

(1.5) 則原式可表為

a

n+2

− αa

n+1

= βa

n+1

+ a

n

a

n+2

− βa

n+1

= αa

n+1

+ a

n

(1.6)

由 (1.6) 式知如果a

n

之係數可表為

αβ = −1 (1.7) 則 (1.6) 式為

a

n+2

− αa

n+1

= β(a

n+1

− αa

n

)

= · · · = β

n+1

(a

1

− αa

0

) a

n+2

− βa

n+1

= α(a

n+1

− βa

n

)

= · · · = α

n+1

(a

1

− βa

0

) (1.8) 這是兩個等比數列! 換句話說, 如果可 找到 α, β 同時滿足 (1.5), (1.7) 兩式, 則 Fibonacci 數列可化為兩個等比數列。 而 α, β之意義呢?

a

n+2

− a

n+1

− a

n

= 0

⇐⇒ x

2

− x − 1 = 0 (1.9) 由根與係數之關係知, 若 α, β為一元二次方 程式 x

2

− x − 1 = 0之根, 則 α, β滿足

α+ β = 1, αβ = −1

這正是 (1.5), (1.7) 兩式告訴我們的。 利用 (1.8) 式計算可得

a

n+2

= 1 α− β

h

α

n+2

(a

1

− βa

0

)

−β

n+2

(a

1

− αa

0

)

i

(1.10) 有了公式當然很好, 但我們的目標並不 在此, 數學並非以求得答案為唯一目的。 重要 的是在學習過程中, 明白這其中之架構而後 詢問是否可推廣, 有否一般性, 如果一個方法 只能解決一類問題, 那麼這並非一“好數學”!

上述之方法對於更複雜的數列, 顯然有其困

(3)

難, 因此發展新的方法與工具乃是必然的結 果。 但記住我們的思考法則與概念還是建立 在原有的基礎上, 而非憑空想像而來。 如果學 數學是依賴“靈感”的話, 那麼我們來接受教 育便沒有意義!

對於 Fibonacci 數列而言: a

n+2

= a

n+1

+ a

n

每個數 a

n+2

都是由前面兩個數 a

n+1

, a

n

所決定。 換句話說, 必須有兩個參數 (parameters) 方能完整地描述 Fibonacci 數列, 因此我們引進向量的概念

~ x

0

=

"

1 0

#

, ~x

1

=

"

1 1

#

,

~ x

2

=

"

2 1

#

, . . . , ~x

n

=

"

a

n+1

a

n

#

, . . . (1.11) 則 Fibonacci 數列可表為

a

n+2

= a

n+1

+ a

n

a

n+1

= a

n+1

~x

n+1

=

"

1 1 1 0

#

~

x

n

≡ A~x

n

= · · · = A

n+1

~x

0

(1.12) 此式正是等比數列 (1.2) 之推廣。 我們先探 討一下矩陣 A =

"

1 1 1 0

#

, 直接計算可得

A

2

=

1 1 1 0

1 1 1 0

=

2 1 1 1

A

2

− A − I =

2 1 1 1

1 1 1 0

1 0 0 1

=

0 0 0 0

即矩陣A滿足一元二次方程式f (x) = x

2

− x− 1

f(A) = A

2

− A − I = 0

這正是 (1.9) 式所告訴我們的, 在線性代數稱 為 Cayley–Hamilton 定理。 其實這個多 項式很特別, 通常稱之為特徵多項式 (char- acteristic polynomial), 該多項式可由行列 式而得

f(λ) = |λI − A| = det(λI − A) (1.13) 對於 Fibonacci 數列,A =

"

1 1 1 0

#

其特徵 多項式為

f(λ) =

λ− 1 −1

−1 λ

= (λ − 1)λ − 1 = λ

2

− λ − 1 而 α, β為f (λ)之兩個根, 在線性代數我們稱 之為 固有值(eigenvalue), 即固定不變的值, 這可由 (1.8) 式視出一些端倪。

在前面提到α, β之求法, 實際上就相當 於根與係數之關係, 這在矩陣有相似的理論, 我們先介紹一個簡單但重要的概念 —– 跡 (trace)。

定義: 矩陣A = (a

ij

)

ij

之跡 (trace) 為 trA =

n

X

i=1

a

ii

(對角線之和) (1.14)

對 Fibonacci 數列而言 A =

"

1 1 1 0

#

其跡 (trace) 為

trA = 1 + 0 = 1

(4)

再回到特徵多項式可知

f(λ) = λ

2

−λ−1 = λ

2

−(trA)λ+(detA) (1.15) 該式對任何2 × 2矩陣都對, 但我們並不打算 證明, 只是提出這個事實。 讓我們回到 (1.12) 式

~

x

n+1

= A~x

n

= A

n

~x

1

當n不大時A

n

是不難計算, 但當n越來越大之 時, 我們就不能憑匹夫之勇, 硬算算出來那是 浪費生命的。 認為只要努力就有收穫, 那是不 正確的, 一個人的奮鬥必須有正確的方向, 否 則只是徒勞。 某些特殊矩陣A, 其A

n

是容易 求, 例如:

A= λI =

"

λ 0 0 λ

#

=⇒ A

n

=

"

λ

n

0 0 λ

n

#

其實這就是等比數列所對應的矩陣。 另外 A=

"

λ

1

0 0 λ

2

#

=⇒ A

n

=

"

λ

n 1

0 0 λ

n 2

#

對於其他矩陣就沒有這麼便宜, 如何求A

n

? 這牽扯到矩陣對角化的問題。 我們還是 在回到 Fibonacci 數列, 由 (1.6) 式可令

x

n+2

≡ a

n+2

− αa

n+1

y

n+2

≡ a

n+2

− βa

n+1

~y

n+2

=

"

x

n+2

y

n+2

#

(1.16) 即 (1.6) 式可改寫為

x

n+2

= βx

n+1

y

n+2

= αy

n+1

⇐⇒~y

n+2

=

"

β 0 0 α

#

~ y

n+1

(1.17)

這告訴我們 Fibonacci 數列經由適當的變 換, 可化為兩個等比數列 (這個過程就是對角 化 diagonalization) 其關係為

~x

n+2

=

"

1 1 1 0

#

~ x

n+1

⇐⇒ ~y

n+2

=

"

β 0 0 α

#

~

y

n+1

(1.18) 至此我們遇到的第一個問題是兩個不同矩陣

A =

"

1 1 1 0

#

, Λ =

"

β 0 0 α

#

(1.19) 是如何關聯的? 這就是矩陣對角化的問題, 也是線性代數研究的主題之一。

由 (1.16) 式知

~y

n+2

=

"

1 −α 1 −β

#

~x

n+2

≡ P

−1

~x

n+2

(1.20) 代入 (1.18) 式得

~

y

n+2

= P

−1

~x

n+2

= P

−1

A~x

n+1

= Λ~y

n+1

= ΛP

−1

~x

n+1

這相當於說

P

−1

A= ΛP

−1

⇐⇒ A = P AP

−1

(1.21) 這就是所謂對角化的過程, 好處何在? 首先看 矩陣的相乘

A

2

= A · A = (P ΛP

−1

)(P ΛP

−1

)

= P Λ(P

−1

P)ΛP

−1

= P Λ

2

P

−1

A

n

= A · · · A = (P ΛP

−1

)(P ΛP

−1

)

· · · (P ΛP

−1

) = P Λ

n

P

−1

而其中

Λ

n

=

"

β 0 0 α

# n

=

"

β

n

0 0 α

n

#

(5)

這說明原先矩陣A

n

是要經過 n個步驟, 但如 今只需要三個步驟便可求得, 這就是對角化 的好處之一。

關於矩陣P , 我們可以視為高維度空間 的變數變換, 但其意義卻不僅於此, 與固有值 對應的就是 固有空間(eigenspace)

W

α

= {~x ∈

R 2

| A~x = α~x} (1.22) 但

A~x= α~x ⇐⇒ (A − αI)~x = 0 (1.23) 因為行列式 det(A − αI) = |A − αI| = 0, 由解聯立方程組之經驗告訴我們 (1.23) 可能 無解或無窮多解, 但顯然~x = ~0為(1.23)之一 個解, 故 (1.23) 式有無窮多解, 這種解我們 稱之為 固有向量(eigenvector), 如何求固有 向量呢? 當然還是要回到“聯立方程組”

(A − αI)~x=0 ⇐⇒

(1 − α)x + y = 0 x− αy = 0 其解為

"

x y

#

=

"

αy y

#

= y

"

α 1

#

即固有空間W

α

為 W

α

=

(

C

α

"

α 1

#

C

α

R

)

(1.24a) 同理可得另一固有空間

W

β

=

(

C

β

"

β 1

#

C

β

R

)

(1.24b) 將 W

α

, W

β

表為如此完全是為了讀者之 方便, 其表示法並沒有唯一。 通常變數變

換之矩陣 P 是將固有向量

"

β 1

#

,

"

α 1

#

按照順序排好而來, 若取特別的固有向量

−1 α−β

"

β 1

#

,

α−β 1

"

α 1

#

, 即

P = 1 α− β

"

−β α

−1 1

#

(1.25) 反矩陣 P

−1

之求法可由解聯立方程組 而來, 令

"

x y

#

= 1 α− β

"

−β α

−1 1

#

= P

"

a b

#

x=

α−β 1

(−βa + αb) y=

α−β 1

(−a + b) 該聯立方程組之解為

a= x − αy b= x − βy ⇐⇒

"

a b

#

=

"

1 −α 1 −β

# "

x y

#

這相當於說 P

−1

=

"

1 −α 1 −β

#

(1.25

) 這正是 (1.20) 式所表示的反矩陣P

−1

, 其實 解聯立方程組之過程就是在求反矩陣! 其本 質就是數學分析中出名的“反函數定理”。 矩 陣P =

"

β α 1 1

#

之幾何意義為

P

"

1 0

#

=

"

β α 1 1

# "

1 0

#

=

"

β 1

#

P

"

0 1

#

=

"

β α 1 1

# "

0 1

#

=

"

α 1

#

P

"

1 1

#

=

"

β α 1 1

# "

1 1

#

=

"

β+ α 2

#

=

"

β 1

#

+

"

α 1

#

(6)

= P

"

1 0

#

+ P

"

0 1

#

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

... ...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

... ...

...

...

...

...

...

...

...

...

...

...

...

...

...

... ... ... ... ... ...

(1,0) (1,1) (0,1)

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

(α,1) (1,2)

(β,1)

即將平行四邊形的邊帶到邊, 對角線帶到對 角線, 換句話說, 就是保持直線與保持平行 四邊形這個性質在數學上稱為 線性(linear)。

矩陣P 的性質還不只如此, 兩個行向量 (即固 有向量) 是互相垂直的, 這可由內積而得

"

β 1

#

·

"

α 1

#

= (β, 1) · (α, 1) = 1 + αβ = 0 這同時也說明了

R 2

= W

α

⊕ W

β

;

W

β

= W

α

=

("

x y

#

R 2

"

x y

#

·

"

α 1

#

= 0

)

要特別提醒的是矩陣P 並沒有唯一, 原因是我 們有無窮多解。 矩陣P 之求法並沒有限定由 (1.20) 式而得, 利用固有值, 固有向量以及 矩陣之運算法則亦可得, 令 ~x

α

∈ W

α

, ~x

β

∈ W

β

, 為矩陣A之固有向量

A~x

α

= α~x

α

, A~x

β

= β~x

β

, 則

A[~x

β

, ~x

α

] = [A~x

β

, A~x

α

]

= [β~x

β

, α~x

α

]

= [~x

β

, ~x

α

]

"

β 0 0 α

#

(1.26) 或

AQ= QΛ, Q= [~x

β

, ~x

α

] (1.26

) 如果取特別的 ~x

β

=

α−β 1

"

−β

−1

#

, ~x

α

=

1 α−β

"

α 1

#

則 Q = P 為了方便底下我們默 認 ~x

β

=

α−β 1

"

−β

−1

#

, ~x

α

=

α−β 1

"

α 1

#

。 (1.26) 式的好處在於你僅需知道固有值、 固 有向量, 而不受維數之限制, 因此一般線性代 數是從此處談起, 但依筆者之體會, 則建議由 (1.8) 式著手, 因為該式隱含了固有值的原始 意義。

α, β為特徵多項式λ

2

− λ − 1 = 0之兩 個根, 由公式知

α=1 +√ 5

2 ≈ 1.618, β=1 −√

5

2 ≈ −0.618, (1.27)

(7)

α 就是鼎鼎大名的黃金分割。 由 (1.12), (1.21) 式知

~x

n+1

= A

n+1

~x

0

= P Λ

n+1

P

−1

~x

0

= 1 α− β

"

−β α

−1 1

# "

−β

n+1

0 0 α

n+1

#

·

"

1 −α 1 −β

# "

a

1

a

0

#

= 1 α− β

·

"

α

n+2

−β

n+2

αβ

n+2

−α

n+2

β α

n+1

−β

n+1

αβ

n+1

−α

n+1

β

#"

a

1

a

0

#

(1.28) 如果取第一項就是 (1.10) 式

a

n+2

= 1 α− β

h

a

1

n+2

− β

n+2

) +a

0

(αβ

n+2

− α

n+2

β)

i

= 1 α− β

h

α

n+2

(a

1

− βa

0

)

−β

n+2

(a

1

− αa

0

)

i

(1.29) 當然, 若你只是在意答案, 那麼便沒有再談下 去的必要。 偉大的牛頓曾如此自我比喻 —我 只不過是個小孩來到真理的大海, 在此逗留, 偶而撿到幾顆貝殼吧! 許許多多的人來到了 真理的大海, 然而卻不曾“逗留”, 以致讓真 理從旁擦身而過。 在此建議諸位略為停留、 思 索, 難道我們的故事到此就結束了嗎? 如果 學習數學只是要得到一個答案, 那麼你還不 懂數學。 許多時候過程比答案要來的重要。

將(a

1

, a

0

) = (1, 0), α =

1+ 2 5

, β =

1 − √ 5

2

代入 (1.29) 式得, 例如,a

100

為 a

100

= 1

√5

h

(1 +√

5

2 )

100

− (1 −√ 5 2 )

100 i

≈ 3.54 × 10

20

(1.30)

諸位可能會懷疑 (1.30) 式這個數有根號又有 分數, 實在很訝異, 但放心由 Fibonacci 數列 之法則 a

n+2

= a

n+1

+ a

n

, a

0

= 0,a

1

= 1, 因此所有的 Fibonacci 數必定是整數, 另外

1 −√ 5 2 < 1

2

⇒ (1 −√ 5

2 )

100

≪ 1 這告訴我們:

第k個 Fibonacci 數

= 最靠近

1 5

(

1+ 2 5

)

k

之整數 (1.31) 另外我們看一下 Fibonacci 數之比例

a

6

a

5

= 8 5 = 1.6 因此可相信的是

a a

101

100更靠近

1 2

(1 + √ 5)這 個數就是前面提過古希臘人稱之為黃金分割 (golden mean), 也因此為何一個長方形之 長寬比例為1.618 : 1 看起來特別的美。

我們可以將 (1.28) 式表示得更漂亮, 首 先將 ~x

0

=

"

1 0

#

表為固有向量 ~x

β

=

1 α−β

"

−β

−1

#

, ~x

α

=

α−β 1

"

α 1

#

之線性組合 (linear combination)

~x

0

=

"

1 0

#

= 1 α− β

"

−β

−1

#

+ 1 α− β

"

α 1

#

= ~x

β

+ ~x

α

因此

~

x

1

= A~x

0

= A(~x

β

+ ~x

α

) = β~x

β

+ α~x

α

~

x

n+1

= A

n+1

~x

0

= β

n+1

~x

β

+ α

n+1

~x

α

(8)

固有向量~x

β

, ~x

α

原先是分開就一直是分開, 這 情形就如在平面x–y座標,x座標歸x座標 y座 標歸y座標, 而現在是推廣到~x

β

–~x

α

座標吧!

座標是變換了, 但似乎有某些東西是不變的, 例如

(i) A =

"

1 1 1 0

#

與 Λ =

"

β 0 0 α

#

有相同 之固有值β, α

(ii) trA = 1 + 0 = 1 = β + α = trΛ (iii) detA =

1 1 1 0

= −1 = αβ =

β 0 0 α

= detΛ

關於這一連串有趣的事, 我們就留給線性代 數吧!

2. 從極值的角度

我們從求極大極小值來看固有值, 習慣 上還是從題目開始

例題: 試求二次型A(x, y) = 4x

2

+ 8y

2

之極 值, 其中x, y滿足x

2

+ y

2

= 1?

解:

(法 I): 利用x

2

+ y

2

= 1之關係可得 A(x, y) = 4x

2

+ 8y

2

= 4(x

2

+ y

2

) + 4y

2

= 4 + 4y

2

但−1 ≤ y ≤ 1, 因此4 ≤ A(x, y) ≤ 8即

x

2max

+ y

2

=1

A(x, y) = 8, (y = ±1)

x

2min

+y

2

=1

A(x, y) = 4, (y = 0)

(法 II): 利用 Lagrange multiplier 此問題 可化為求

F(x, y, λ) = 4x

2

+ 8y

2

− λ(x

2

+ y

2

− 1) (2.1) 之極值的問題, 分別對x, y微分得

∂F

∂x

= 8x − 2λx = 0

∂F

∂y

= 16y − 2λy = 0 (2.2) 這相當於

"

4 − λ 0 0 8 − λ

# "

x y

#

=

"

0 0

#

(2.3) 但(x, y)

t

= (0, 0)

t

並無法滿足 x

2

+ y

2

= 1, 因此上式除了 (0, 0)

t

解之外應還有其他 解, 故

det

"

4 − λ 0 0 8 − λ

#

=

4 − λ 0 0 8 − λ

= (λ−4)(λ − 8)=0 這就是前面所提的特徵多項式, 而λ則為固有 值, 分別是

λ= 4 或 λ = 8 此時其對應之固有向量為

λ= 4 =⇒ (x, y) = (1, 0)

t

λ= 8 =⇒ (x, y) = (0, 1)

t

x

2max

+ y

2

=1

A(x, y) = 4 · 0 + 8 · 1 = 8

x

2min

+y

2

=1

A(x, y) = 4 · 1 + 8 · 0 = 4 我們看看其幾何意義最大、 最小值所對應之 橢圓為

4x

2

+ 8y

2

= 8 4x

2

+ 8y

2

= 4

(9)

⇐⇒

 

 

(

x 2

)

2

+ y

2

= 1 x

2

+ (

y

1

√2

)

2

= 1 (2.4)

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

..

..

..

..

..

....

....

....

..

..

....

..

....

..

..

....

..

..

....

....

..

..

....

..

....

..

....

....

....

....

....

....

...

..

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

..

....

..

....

....

....

..

....

....

..

....

..

....

..

..

....

..

..

..

....

..

..

..

..

..

....

..

..

..

..

..

..

..

..

..

..

..

..

....

....

..

..

..

..

..

..

..

..

..

..

..

..

....

..

....

..

..

..

....

..

..

..

....

..

....

..

..

....

..

....

....

..

....

....

...

...

...

...

... ...

...

...

... ...

...

...

...

...

...

...

...

...

...

...

...

...

...

(0,1)

(0, 1

√2)

(1, 0)(√2, 0) A(x, y) = 8

A(x, y) = 4

....

....

..

....

....

..

....

....

..

....

....

..

...

....

....

....

....

...

....

....

....

..

....

...

....

....

....

....

...

....

....

....

....

....

...

..

....

...

...

4

之固有向量

...

8

之固有向量

...

...

...

...

..

...

...

...

...

...

..

....

..

....

... ....

....

..

... ..

....

..

..

. ..

....

..

....

... ....

....

..

... ..

...

...

...

...

...

...

. ... ...

...

...

... ... ...

...

...

...

...

為何4, 8會是固有值呢? 我們將二次型表為 4x

2

+ 8y

2

= [x, y]

"

4 0 0 8

# "

x y

#

x y x 4 0 y 0 8

"

4 0 0 8

#

(2.5)

顯然4, 8為矩陣

"

4 0 0 8

#

之固有值, 對於更一 般的二次型則為

ax

2

+2bxy+cy

2

=(x, y)

"

a b b c

# "

x y

#

x y x a b y b c

"

a b b c

#

(2.6)

這告訴我們研究二次型 A(x, y) = ax

2

+ 2bxy + cy

2

相當於探討對稱矩陣 A =

"

a b b c

#

, 我們同樣可問相同的問題。

例題: 試求二次型 A(x, y) = ax

2

+ 2bxy + cy

2

之極值, 其中 x

2

+ y

2

= 1?

依照前面的經驗可猜測的是其極值為固 有值, 而(x, y)

t

則為固有向量。

解: 利用 Lagrange multiplier 將此問題化 為

F(x, y, λ)=ax

2

+2bxy+cy

2

−λ(x

2

+y

2

−1) (2.7) 之極值問題分別微分得

∂F

∂x

= 2ax + 2by − 2λx = 0

∂F

∂y

= 2bx + 2cy − 2λy = 0 (2.8) 或

"

a− λ b b c− λ

# "

x y

#

=

"

0 0

#

(2.9)

但(x, y)

t

= (0, 0)

t

並不滿足x

2

+ y

2

= 1, 故 行列式必為0

det

"

a− λ b b c− λ

#

=

a− λ b b c− λ

= λ

2

− (a + c)λ + ac − b

2

= 0

設兩個固有值為 λ

1

< λ

2

, 而固有向量為

"

x

1

y

1

#

,

"

x

2

y

2

#

, 由標準式λ

1

x

2

+ λ

2

y

2

可知

λ

1

x

2

+ λ

2

y

2

x

2

+ y

2

≥ λ

1

=⇒ minλ

1

x

2

+ λ

2

y

2

x

2

+ y

2

= λ

1

其他細節我們就留給讀者。

(10)

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

(x 1 , y 1 ) (x 2 , y 2 ) λ 1

λ 2

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

...

..

...

...

...

...

...

...

..

...

...

...

...

...

..

...

...

...

..

...

...

....

...

...

....

...

...

....

...

...

....

...

...

..

...

...

..

..

...

...

..

..

..

..

...

..

...

..

..

...

..

...

....

....

..

...

...

...

例題: 試求x

2

+ y

2

之最大值、 最小值, 其 中x, y滿足3x

2

+ 4xy + 3y

2

= 1。

解: 這個題目形式上與前一題雖然不一樣, 但 本質上是相同的。 既然我們已經習慣前一題 之方法, 那麼就想辦法將問題轉化為前一題 之形式, 畢竟人是很難改變的。 我們從複雜的 一項開始

3x

2

+ 4xy + 3y

2

= [x, y]

"

3 2 2 3

# "

x y

#

矩陣 A =

"

3 2 2 3

#

之特徵多項式為

det(λI − A) =

λ− 3 −2

−2 λ− 3

= (λ − 3)

2

− 2

2

= (λ − 5)(λ − 1) 固有值為1, 5而固有向量為

√1 2

"

1

−1

#

, 1

√2

"

1 1

#

P =

" 1

√ 2

√ 1 2

√ −1 2

√ 1 2

#

這個矩陣P 滿足 P

t

=

" 1

√ 2

1 2

√ 1 2

√ 1 2

#

= P

−1

AP = P

"

1 0 0 5

#

=⇒ A=P

"

1 0 0 5

#

P

t

利用此式可將原二次型變形為 3x

2

+ 4xy + 3y

2

= [x, y]

"

3 2 2 3

# "

x y

#

= [x, y]P

"

1 0 0 5

#

P

t

"

x y

#

由上式知 (極自然) 可考慮變數變換

"

X Y

#

= P

t

"

x y

#

= P

−1

"

x y

#

,

"

x y

#

= P

"

X Y

#

=

" 1

√ 2

X+

1 2

Y

1 2

X+

1 2

Y

#

取轉置矩陣得

[X, Y ] = [x, y]P 因此

3x

2

+ 4xy + 3y

2

= [X, Y ]

"

1 0 0 5

# "

X Y

#

= X

2

+ 5Y

2

= 1 而且

x

2

+ y

2

= ( 1

√2X+ 1

√2Y)

2

+( − 1

√2X+ 1

√2Y)

2

= X

2

+ Y

2

= X

2

+1

5(1 − X

2

)

= 1 5+ 4

5X

2

但X之範圍為−1 ≤ X ≤ 1, 故

1

5 ≤ X

2

+ Y

2

≤ 1 5+ 4

5 = 1

(11)

極小值為

1 5

產生在 (X, Y ) = (0, ±

q 1 5

), 而 極大值為 1則產生在 (X, Y ) = (±1, 0)。

3. 微分方程的角度

固有值的另一個看法就是微分方程。 考 慮平面上一運動系統, 其位置座標為 (x(t), y(t)), 其速度 (就是對 t 之微分) (

dx dt

,

dy dt

) 滿 足微分方程組

dx

dt

= ax + by, x(0) = x

0 dy

dt

= cx + dy, y(0) = y

0

(3.1) 如果引進向量的概念, 則 (3.1) 式可視為一 維的問題, 令

X(t) =

"

x(t) y(t)

#

, X(0) =

"

x(0) y(0)

#

=

"

x

0

y

0

#

(3.2) 則 (3.1) 可改寫為

dX dt =

"

a b c d

#

X≡ AX, X(0) =

"

x

0

y

0

#

≡ X

0

(3.3) 對於n維空間, 我們也有與 (3.3) 式相似的結 果。 雖然 (3.3) 式很簡潔、 清爽, 但重要的還 是如何將解求出來, 否則只是畫餅充飢無濟 於事。 為明瞭 (3.3) 式, 我們還是回到一維 的情形, 數學的思維法則都是由簡而繁, 否則 真難想像一個人如何去思考。

dx

dt = at, x(0) = x

0

(3.4) 利用分離變數法, 而後積分得

dx

x = adt =⇒

Z

1

xdx=

Z

adt

=⇒ x(t) = e

at

x

0

(3.5)

由 (3.5) 之結果, 我們也期待 (3.3) 式之解 也能表為 (3.5) 式之形式, 因此我們作如下 之假設

x(t) = e

λt

u

y(t) = e

λt

v (3.6) (u, v)待求。 將 (3.6) 待入 (3.3) 得

λe

λt

u= ae

λt

u+ be

λt

v λe

λt

v = ce

λt

u+ de

λt

v 整理得

au+ bv = λu

cu+ dv = λv, AU= λU, U =

"

u v

#

(3.7) 這告訴我們解微分方程組 (3.3) 相當於解代 數方程組 (3.7)。

微分方程 ⇐⇒ 代數方程

這就是數學的精神, 以已知的知識(代數方程) 來解決未知的問題(微分方程), 並將既有的知 識推廣。

λ就是矩陣A的固有值, 而U =

"

u v

#

則 是固有向量, 我們做個題目

例題: 試解微分方程 X

(t) =

"

1 1 4 1

#

X

解: 矩陣 A =

"

1 1 4 1

#

之特徵多項式為 f(λ) = det(λI − A)

=

λ− 1 −1

−4 λ− 1

= (λ − 3)(λ + 1)

(12)

因此固有值與固有向量分別為 λ= 3, −1, U

1

=

"

1 2

#

, U

2

=

"

1

−2

#

,

"

1 2

#

e

3t

,

"

1

−2

#

e

−t

都是原微分方程之解, 再由重疊原理 (即線性) 知一般解為

X(t) = c

1

"

1 2

#

e

3 t

+ c

2

"

1

−2

#

e

−t

參考資料:

1. 林琦焜: 線性代數的基本定理, 數學傳播 (中央研究院數學所), Vol. 74, p.47–

54(1995).

2. Gilbert Strang, Introduction to Lin- ear Algebra, Wellesley–Cambridge Press (1993), (美亞代理).

—本文作者任教於國立成功大學數學系—

參考文獻

相關文件

今年大專 聯考共有 6745 名考生得了零 分, 是歷年來最多的一次, 這個數據很讓數學 老師興趣濃厚, 作作二份試題就不意外了, 因 為題目很正常, 我不說它很容易, 容易不容易 是因人而異的。 社會組有

Morse 則將此問題考慮到高維度上, 如何去 找封閉測地 線。 有關測地線的問題尚有 ,在二 維的封閉曲面上至少有 3 條不自交的封閉測 地 線, 這是很有名的問題, 直到最近才有詳細 的 證明。

— 牛頓, 1643 – 1727 — Euler 關於這個級數的求和方法非常有創意是一個數學系學生應該具備的常識, 但事與願 違。 我在求學的階段並不知道這段有趣的歷史,

歐拉將信從頭到尾認真看了一遍。 他認 為這絕不是一個普通遊戲, 而是一個頗有價 值的數 學問題。 在以後的思考中, 他首先想到 的是德國大數學家萊布尼茲 (Leibniz, Got- tfried Wilhelm)

以級數 (12) 為例, 它 的收斂速度很快, 僅需計算五個迴圈就可得到 15 位圓周率小數位數。 而且, 由於這是只有兩 個反正切項的 Euler 型公式, 程式的設計非常簡單。 最重要的是, 除了 χ(n)

我們並不清 楚。 事實上, 即使只考慮三個天體的相互作用, 一般來說也是非常困難的, 這就是著名的“三體 問題”。 假如我們要處理的對象的數目是個天文數字, 可以想見,

在解決實際問題時,最大的挑戰常常是將問題轉化成數學的 模型,其中一類可能的模型便是最佳化問題,也就是如何設

黃文璋教授在 「完全數與梅仙尼質 數」 一文中, 談及人們如何引進完全 數, 再轉化為梅仙尼質數的尋找。 黃教 授將此比喻為登山者攀登高峰, 或田徑 選手追求更快的速度及更遠的投擲的