• 沒有找到結果。

均值定理的統合與推廣

N/A
N/A
Protected

Academic year: 2021

Share "均值定理的統合與推廣"

Copied!
11
0
0

加載中.... (立即查看全文)

全文

(1)

均值定理的統合與推廣

蔡聰明

在微積分中, Rolle 定理、Lagrange 的均值定理 (Mean-Value Theorem, 簡記為 MVT), 以及 Cauchy 推廣的均值定理, 堪稱為微積分的基石, 它們是僅次於微積分根本定理的重要定 理。

本文我們要把它們統合在三元均值定理之下, 並且給出幾何解釋。 進一步再推廣成 n 元與 高維空間的均值定理。 連貫的知識對於了解與學習都大有助益。

整個推演的出發點是:

定理1: (Fermat 的內點極值定理, 1629 年)

設 I ⊂ R 為一個區間, f : I → R 為一個函數, 並且 x0 ∈ I。 如果下列三個條件成立:

(i) x0 為 I 的內點;

(ii) f (x0) 為 f 的極值;

(iii) f 在 x0 點可微分。

那麼就有 f(x0) = 0。 反之不然。

反例: 設 f (x) = x3, x ∈ R , 則 f(0) = 0。 我們觀察到: x = 0 是內點, 且 f 在此點 可微分, 但是 f 為遞增函數, f (0) 既不是極大值, 也不是極小值。 這表示, 由 f(x0) = 0 以及 (i) 與 (iii), 無法推導出 (ii)。

1. Rolle 定理

法國數學家 Rolle (1652−1719) 在解方程式時, 觀察到多項函數的行為, 例如 g(x) = x2− 5x + 6 及其導函數 g(x) = 2x − 5 的根之間具有密切關係:

在方程式 g(x) = 0 的兩個根 x = 2 與 x = 3 之間, 必存在有 c ∈ (2, 3) 是導函數方程式 g(x) = 0 的根, 此地 c = 2.5。

推而廣之, Rolle 就得到下面重要的結果。 這只要利用連續函數的極值定理與 Fermat 的 內點極值定理就可以證明。

52

(2)

定理2: (Rolle 定理, 1690 年)

假設 f : [a, b] → R 為一個函數。 如果下列三個條件成立:

(i) f 在 [a, b] 上連續;

(ii) f 在 (a, b) 上可微分;

(iii) f (a) = 0 = f (b)。

那麼就存在 c ∈ (a, b), 使得 f(c) = 0。

證明: 因為 f 在 [a, b] 上連續, 所以 f 在 [a, b] 上取到最大值與最小值, 亦即存在 α, β ∈ [a, b], 使得

f (α) ≤ f (x) ≤ f (β), ∀ x ∈ [a, b]

若 α 與 β 皆為端點, 由 (iii) 知, f 為常函數, 取值 0。 因此, 任取 c ∈ (a, b) 都有 f(c) = 0。

若 α 與 β 不皆為端點, 不妨假設 α 為內點 (β 為內點的情形, 同理可證)。 那麼由費瑪的內點 極值定理就得到 f(α) = 0。 最後, 我們選取 c = α 就好了。

註: (i) 與 (ii) 兩個條件可用 “f 在 [a, b] 上可微分” 來取代。 其次, (iii) 也可以改為 f (a) = f (b)。

注意: 在 (ii) 中即使只有一點不可微分都不行! 例如 f (x) = 1 − |x|, x ∈ [−1, 1]。

歷史故事: 在微積分草創期, 微積分建立在無窮小 (infinitesimal) 的論證上面, 無窮小有 時等於 0, 有時又不等於 0, 這個矛盾難於說清楚。 因此 Rolle 批評微積分是: 一堆智巧的錯誤 集 (a collection of ingenious fallacies)。 但在晚年他改變了態度, 視微積分為一門有用的學 問。

問1: 甲乙兩人賽跑, 同時出發且同時抵達終點, 中間的過程互有快慢。 試證必存在有某個 時刻, 兩人具有相同的速度。

2. Lagrange 的均值定理

在 Rolle 定理中, 將端點的條件 (iii) 棄掉, 就得到下面推廣的重要結果:

定理3: (Lagrange 的均值定理, MVT, 1797 年) 假設 f : [a, b] → R 為一個函數。 如果下列兩個條件成立:

(i) f 在 [a, b] 上連續;

(ii) f 在 (a, b) 上可微分;

那麼就存在 c ∈ (a, b), 使得

f(c) = f (b) − f (a)

b − a (1)

(3)

或者

f (b) − f (a) = f(c)(b − a) (2) 或者

f (b) = f (a) + f(c)(b − a). (3) 用幾何直觀來說: 將割線 ℓ 平行移動, 終至切曲線於 (c, f (c)) 點。

註: (i) 與 (ii) 兩個條件可用 “f 在 [a, b] 上可微分” 來取代。 另外, c 點可以表成 c = a + θ(b − a) 之形式, 其中 0 < θ < 1; Rolle 定理亦然。 又注意, 在 (ii) 中即使只有一點不可 微分都不行。

在均值定理中, 若再要求 f (a) = f (b) = 0 的條件, 那麼就變成 Rolle 定理。 因此, 均值 定理是 Rolle 定理的推廣, 並且可用 Rolle 定理來證明。 因此, 兩者在邏輯上等價!

另外, 這個定理的一個意思是, 可用有限步驟的演算式 f (b) − f (a)

b − a 來取代無窮步驟的演 算式 f(c) = lim

x→c

f (x) − f (c)

x − c , 但是必須付出 c 不明確的代價。

推論: (不等號形式的均值定理)

假設 f 在 [a, b] 上可微分並且 |f(x)| ≤ K, ∀ x ∈ (a, b), 則有

|f (b) − f (a)| ≤ K · (b − a).

顯然常函數的微分為 0, 反過來也成立, 但這不顯然, 並且要小心敘述。 因為階梯函數 f (x) = [x] 在可微分處, 皆有 f(x) = 0, 但它不是常函數。 下面定理是 MVT 的簡單結論。

定理4: (微分方程根本補題)

若 f(x) = 0, ∀ x ∈ (a, b), 則 f 在 (a, b) 上為常函數。

註: 運動學的解釋: 速度恆為 0 的質點, 是靜止不動的, 從而位置不變。

(4)

這個定理可以用來確認一階微分方程 y(t) = αy(t) 解答的形貌, 故稱為微分方程根本補 題。 我們都知道 y = Ceαt 是這個微分方程的解答。 問還有沒有其它形式的解答? 沒有! 證明 如下:

假設 y1 為任意解答, 故有 dy1/dt = αy1。 考慮函數 y1/eαt, 微分得到 D(y1/eαt) = (y1eαt− y1αeαt)/e2αt = 0。 因此, y1/eαt = C, 常數。 從而 y1 = Ceαt

故事: 俄國物理學家 Kapitza 提出如下的問題:「將炒菜盤綁在狗的尾巴上, 當狗向前跑 時, 炒菜盤就會因為接觸地面而發出聲音, 若要使炒菜盤不發出聲音, 問如何辦到? 」 許多物理 學家想不出答案, 最後 Kapitza 公佈答案: 讓狗跑動的速度為 0 ! 速度為 0 是運動的特例。

推論: 若 f(x) = g(x), ∀ x ∈ (a, b), 則 f − g 在 (a, b) 為常數; 亦即 f (x) = g(x) + C, ∀ x ∈ (a, b).

定理5: (定積分的均值定理)

設 f 在 [a, b] 上連續, 則存在 c ∈ (a, b), 使得 Z b

a

f (x)dx = f (c)(b − a) 或 f (c) = 1 b − a

Z b a

f (x)dx. (4) 定理6: 假設 f 定義在 [a, b] 為連續可微分, 則下列兩敘述等價:

(i) Newton-Leibniz 公式 (N-L 公式):

Z b a

f(x)dx = f(c)(b − a)。

(ii) Lagrange 的均值定理: 存在 c ∈ (a, b) 使得 f (b) − f (a) = f(c)(b − a)。

證明: (i) ⇒ (ii): 將 N-L 公式 Rb

a f(x)dx = f (b) − f (a) 以及積分的均值定理: 存 在 c ∈ (a, b) 使得 Rb

af(x)dx = f(c)(b − a), 兩者結合起來就得到 Lagrange 的均值定理 f (b) − f (a) = f(c)(b − a)。

(ii) ⇒ (i): 對 [a, b] 作分割: a = x0 < x1 < · · · < xn = b。 將 f 對一分割小段 [xk−1, xk] 使用 Lagrange 均值定理, 得知存在 ck−1 ∈ (xk−1, xk) 使得

f (xk) − f (xk−1) = f(ck−1)(xk− xk−1).

作 Riemann 和得到

n

X

k=1

f(ck−1)(xk− xk−1) =

n

X

k=1

hf (xk) − f (xk−1)i

= f (b) − f (a) 取極限就得到 N-L 公式:

Z b a

f(x)dx = f (b) − f (a).

(5)

N-L 公式與 MVT 最重要且美麗的推廣就是下面的 Taylor 定理:

定理7: (Taylor 定理, 1715 年)

假設 f 定義在 (a, b) 上, 具有直到 n + 1 階連續可微分, x0 ∈ (a, b), 則

f (x) = Pn(x) + Rn+1(x), ∀ x ∈ (a, b) (5) 其中

Pn(x) = f (x0) + f(x0)(x − x0) + f′′(x0)

2! (x − x0)2+ · · · + f(n)(x0)

n! (x − x0)n 叫做在 x0 點的第 n 階 Taylor 多項式, 並且剩餘項可以表為積分形式:

Rn+1(x) = Z x

x0

f(n+1)(t)

n! (x − t)ndt (6)

也可以表為微分形式:

Rn+1(x) = f(n+1)(c)

(n + 1)!(x − x0)n+1 (7) 其中 c 為介於 x0 與 x 之間的一個數。 這叫做 Lagrange 形式的剩餘項。

註: 當 n = 0 時, (5) 式的積分剩餘項與微分剩餘項分別化約為 N-L 公式以及 MVT。

3. 均值定理的推廣

均值定理只涉及一個函數, 現在從一個函數變成兩個, 作 「兩元化」 之推廣, 我們就得到下 面的重要結果:

定理8: (Cauchy 的兩元均值定理, 1821 年)

(i) 假設 f, g : [a, b] → R 為兩個連續函數並且在 (a, b) 上可微分。

那麼就存在 c ∈ (a, b), 使得

[f (b) − f (a)]g(c) = [g(b) − g(a)]f(c). (8) (ii) 若進一步再要求 g(t) 6= 0, ∀ t ∈ (a, b) 那麼就存在 c ∈ (a, b), 使得

f (b) − f (a)

g(b) − g(a) = f(c)

g(c). (9)

上述 (8) 與 (9) 兩式都叫做 Cauchy 公式。

註1: 根據 Rolle 定理, 條件 g(x) 6= 0, ∀ x ∈ (a, b), 保證了 g(b) − g(a) 6= 0。

(6)

註2: 取 g(t) = t, g(t) = 1, 則推廣的均值變率定理就變成均值定理。

Cauchy 的兩元均值定理是 L’Hopital 規則的理論基礎, 這是探求不定型極限的有力工 具。

4. 三元化的統合觀點

上述是從 “特殊” 逐漸走到 “一般” 的情形, 而 Rolle 定理是核心。 我們再採用 「三元化」

的觀點, 涉及到三個地位相同的函數, 並且利用行列式的工具來表達, 就得到推廣的三元均值定 理, 統合了上述所有的均值定理。

定理9: (推廣的三元均值定理)

假設函數 f , g, h 在 [a, b] 上連續並且在 (a, b) 上可微分, 令

F (t) =

f (a) f (b) f (t) g(a) g(b) g(t) h(a) h(b) h(t)

, ∀ t ∈ [a, b]

則存在 c ∈ (a, b), 使得 F(c) = 0, 亦即

f (a) f (b) f(c) g(a) g(b) g(c) h(a) h(b) h(c)

= 0. (10)

或者

f(c)[g(a)h(b) − h(a)g(b)] + g(c)[h(a)f (b) − f (a)h(b)]

+h(c)[f (a)g(b) − g(a)f (b)] = 0. (11) 證明: 顯然 F 在 [a, b] 上連續, 在 (a, b) 上可微分, 並且 F (a) = F (b) = 0。 由 Rolle 定理得知, 存在 c ∈ (a, b), 使得 F(c) = 0。

函數F (t) 與定理 9 有幾何上的解釋:

考慮三維空間中的參數曲線

Γ : x = f (t), y = g(t), z = h(t) t ∈ [a, b]

其上三點 (f (a), g(a), h(a)), (f (b), g(b), h(b)), (f (t), g(t), h(t)), 形成三個從原點出發的位 置向量:

~u = f (a)~i + g(a)~j + h(a)~k, ~v = f (b)~i + g(b)~j + h(b)~k

~

w(t) = f (t)~i + g(t)~j + h(t)~k.

(7)

它們所張出平行六面體, 其有號體積就是 F (t)。 我們欲求 F (t) 的極值。 令 π(~u, ~v) 表示由 ~u 與 ~v 所張出的平面, 曲線 Γ 由 (f (a), g(a), h(a)) 點出發到達 (f (b), g(b), h(b)), 我們只要在 曲線 Γ 上找一點 (f (c), g(c), h(c)), 使得距離平面 π(~u, ~v) 為最遠或最近, 就有 F(c) = 0。

推論1: (Cauchy 的兩元均值定理)

在定理 9 的假設下, 並且取 h(t) ≡ 1, 則存在 c ∈ (a, b), 使得

f (a) f (b) f(c) g(a) g(b) g(c)

1 1 0

= 0. (12)

亦即

[f (b) − f (a)]g(c) = [g(b) − g(a)]f(c).

進一步, 若再假設 g(x) 6= 0, ∀ x ∈ (a, b), 則上式可寫成 f (b) − f (a)

g(b) − g(a) = f(c) g(c). 推論2: (Lagrange 的均值定理, MVT)

在定理 9 的假設下, 並且取 h(t) ≡ 1 與 g(t) = t, 則存在 c ∈ (a, b), 使得

f (a) f (b) f(c)

a b 1

1 1 0

= 0. (13)

亦即

f (b) − f (a) = f(c)(b − a).

推論3: (Rolle 定理)

在定理 9 的假設下, 並且取 h(t) ≡ 1, g(t) = t 且 f (a) = f (b) = 0, 則存在 c ∈ (a, b), 使得

0 0 f(c)

a b 1

1 1 0

= 0. (14)

亦即 f(c) = 0。

值得注意的是, 定理 9 以及上述三個推論在邏輯上都是等價的, 一般結果等價於特例! 這 在數學中是常見的事情, 但是對於初學者卻仍然會覺得很驚奇。 另一個例子: 勘根定理是中間 值定理的特例, 但兩者在邏輯上也是等價的。

(8)

定理 9 統合了 Cauchy 的兩元均值定理, Lagrange 的均值定理以及 Rolle 定理為特例, 並且它的證明極其簡潔, 簡直是一行就證明完成。 定理 9 含納無窮, 簡直比太平洋還要壯觀。 這 恰好應驗了法國數學家 A. Weil 的一句名言:

更普遍與更簡潔是結伴同行的。

(Greater generality and greater simplicity go hand in hand.)

5. 四元化的推廣

定理10: (推廣的四元均值定理)

假設函數 f , g, h, k 在 [a, b] 上連續, a < x0 < b。 令

G(t) =

f (a) f (x0) f (b) f (t) g(a) g(x0) g(b) g(t) h(a) h(x0) h(b) h(t) k(a) k(x0) k(b) k(t)

, ∀ t ∈ [a, b].

(i) 若 f , g, h, k 在 (a, b) 上可微分, 則存在 α, β, a < α < x0 < β < b, 使得 G(α) = 0 = G(β)。

(ii) 進一步, 若 f , g, h, k 在 (a, b) 上為二階可微分, 那麼就存在 c ∈ (α, β) ⊂ (a, b), 使得 G′′(c) = 0, 亦即

f (a) f (x0) f (b) f′′(c) g(a) g(x0) g(b) g′′(c) h(a) h(x0) h(b) h′′(c) k(a) k(x0) k(b) k′′(c)

= 0. (15)

這由 Rolle 定理立即就得證。 我們觀察定理 10的一個特例:

特例: (二階導數的均值定理)

在定理 10裡, 假設 f 為二階可微分, 並且取 k(t) ≡ 1, h(t) = t, g(t) = t2, 則存在 c ∈ (a, b), 使得

G′′(c) =

f (a) f (x0) f (b) f′′(c) a2 x20 b2 2

a x0 b 0

1 1 1 0

= 0

(9)

從而

f (x0) − f (a)

x0− a − f (b) − f (a) b − a

x0− b = 1 2f′′(c).

此式可看作是二階導數的均值公式。

6. n 元化的推廣

上述定理 10又可以再推展到 n 個函數的情形, 採用 Rolle 定理就可得證。

定理11: (推廣的 n 元均值定理, n ≥ 3)

假設 n 個函數 f1, f2, . . . , fn 在 [a, b] 上連續, a < x0 < x1 < · · · < xn−3 < b。 令

H(t) =

f1(a) f1(x0) · · · f1(b) f1(t) f2(a) f2(x0) · · · f2(b) f2(t)

... ... · · · ... ... ... ... · · · ... ...

fn(a) fn(x0) · · · fn(b) fn(t)

, t ∈ [a, b].

第 1 層: 若 f1, f2, . . . , fn 在 (a, b) 上可微分, 則存在 c1,1 < c1,2 < · · · < c1,n−2 使得 a < c1,1 < x0 < c1,2 < x1 < c1,3· · · < xn−3 < c1,n−2 < b, 並且

H(c1,k) = 0, k = 1, . . . , n − 2.

第 2 層: 進一步, 若 f1, f2, . . . , fn 在 (a, b) 上為二階可微分, 那麼就存在 c2,1 < c2,2 <

· · · < c2,n−3, 使得 c1,1 < c2,1 < c1,2 < c2,2 < c1,3· · · < c1,n−3 < c2,n−3 < c1,n−2, 並且 H′′(c2,k) = 0, k = 1, . . . , n − 3。

繼續不斷做下去· · · ·

第 n − 2 層: 最後, 若 f1, f2, . . . , fn 在 (a, b) 上為 n − 2 階可微分, 那麼就存在 cn−2,1, 使 得 a < cn−1,1 < cn−2,1< cn−1,2 < b, 並且 H(n−2)(cn−2,1) = 0。

7. 高維空間的推廣

另一方面, 在高等微積分裡, 定義在高維空間上的實值或向量值的多變數函數 f , 還有各 式各樣的均值定理, 我們分成 f : R n → R 與 f : R n→ R m 兩種情形來討論。

定理12: (高維空間的均值定理)

(i) 假設函數 f : U ⊂ R n → R 在開集 U 上可微分。 令 a 與 b 皆屬於 U 且連結它們的線

(10)

段 L(a, b) 也都落在 U 裡。 那麼存在一點 c = a + t0(b − a), 其中 0 < t0 < 1, 使得

f (b) − f (a) = ∇f (c) · (b − a). (16) (ii) 假設 f = (f1, f2, . . . , fm) : U ⊂ R n → R m 在開集 U 上可微分, 線段 L(a, b) 落在 U 裡, 則存在 c1, . . . , cm 屬於線段 L(a, b), 使得

fk(b) − fk(a) = ∇fk(ck) · (b − a), k = 1, 2, . . . , m.

證明: (i) 考慮函數 g(t) = f [a + t(b − a)], 對 g 在 [0, 1] 上使用 Lagrange 均值定理 與連鎖規則就好了。 (ii) 對於每個分量 fk 皆分別使用 (i) 就得證。

對於 (ii) 的情形, 美中不足的是, 其中落在線段上的諸點 ck ∈ L(a, b) 對每個分量函數 fk 皆不同。 因此我們無法期盼如 (16) 式具有共同點之結果, 對所有函數 f : A ⊂ Rn→ Rm 都成立。

反例: 假設 f1(x) = cos x, f2(x) = sin x, 並且選取 a = 0, b = 2π。 考慮函數 f = (f1, f2) : [0, 2π] → R 2, 則 (16) 式之形的均值定理不成立。

修改為不等式形式的均值定理是可行之道。

定理13: (高維空間不等式形式的均值定理)

假設 U ⊂ R n 為開集, f : U → R m 為可微分函數。 令 a 與 b 皆屬於 U 且連結它們的線 段 L(a, b) 也都落在 U 裡。 再假設

kDf (x)k ≤ M, ∀ x ∈ L(a, b) 其中 k k 表示線性算子的範數 (norm)。 那麼我們就有

kf (b) − f (a)k ≤ M · kb − ak. (17)

證明: 考慮函數 g(t) = f [a + t(b − a)], t ∈ [0, 1]。 利用連鎖規則, 作微分得到 d

dtf [a + t(b − a)] = Df [a + t(b − a)] · (b − a)。 對 t 從 t = 0 積分到 t = 1 得到 f (b) − f (a) =

Z 1 0

n

Df [a + t(b − a)] · (b − a)o dt

此地的積分是對各成份函數來定義。 現在取範數, 因為積分的範數小於等於範數的積分, 就得到 (17) 式。

(11)

將定理 13 中的高維歐氏空間改為更廣泛的賦範向量空間 (normed vector space), 結果 仍然成立。

下面我們給出均值定理的一個重要用途:

定理14: 假設 U ⊂ R n 為連通的開集, 並且 f : U → R m 為可微分函數。 如果 Df (x) = 0, ∀ x ∈ U, 則 f 為常函數。

證明: 取定一點 a ∈ U, 並且令 V = {b ∈ U|f (b) = f (a)}, 即 V = f−1(a)。 因為 f 為連續函數, 故 V 為 U 中的閉集。 另一方面, 因為 U 為開集, 故對於每個 x ∈ V ⊂ U, 都 存在開的球 B, 半徑大於 0 且被包含於 U 中。 這個球 B 是凸集 (convex set), 由定理 13 知, f (y) = f (x) = f (a), ∀ y ∈ B。 從而 V 也是 U 中的開集。 今因 U 為連通集, 而連通集中沒 有既開且閉的真子集, 所以 V = U。

8. 結語

將數學結果連貫成有機整體, 使得沒有一片知識是孤立的, 這是數學美的要素之一。 在微 積分裡, 均值定理的知識網是一個著名的例子, 其中 Rolle 定理是核心樞紐!

最後我們整理出本文所涉及的定理之邏輯網絡 (logical net):

參考文獻

1. Gabriel Klambauer, Aspects of Calculus, Springer-Verlag, 1986.

2. E. Hairer and G. Wanner, Analysis by Its History, Springer-Verlag, 1996.

3. James R. Munkres, Analysis on Manifold, Addison-Wesley, 1991.

4. J. E. Marsden and M. J. Hoffman, Elementary Classical Analysis, 1974.

5. A. Avez, Differential Calculus, John Wiley and Sons, 1986.

6. 黃見利, 均值定理的一個有趣的幾何意義, 數學傳播, 29 卷 2 期, 2005。

本文作者為台大數學系退休教授

參考文獻

相關文件

在 Riemann 映射定理中指出, 任意兩個邊界多於一點的單連通域是全純等價的, 即存在 雙方 單值 (即單葉) 的全純映射, 將一個映為另一個。

Cauchy 積分理論是複變函數論中三個主要組成部分之一, 有了 Cauchy 積分理論, 複變 函 數論才形成一門獨立的學科, 並且導出一系列在微積分中得不到的結果。 我們先從 Cauchy

(三) 變率與微分、 求和與積分: “變率” 與 “求和” 是函數的兩種定量型 (quantitative) 的基本性質。 但是它們的定義本身就是理論的起點, 有如當年

✗齊合立克(John Zahorik) 知識是人類所建構的 知識是臆測的、可誤的 知識的成長在於揭露. 引起後現

於是我們若想要在已知函數值的某一點,了解附近大概的函

這是一個二階微分方程 (second-order differential equation)

是以法國物理學家 Augustin Fresnel 命名的。.

對於給定的一個 x 值,經過某一對應方式後得到「唯一」的 y 值,這種對應方式我們稱 為函數,其中 x 是自變數,y 是應變數。. 而在表