均值定理的統合與推廣

(1)

均值定理的統合與推廣

蔡聰明

在微積分中, Rolle 定理、Lagrange 的均值定理 (Mean-Value Theorem, 簡記為 MVT), 以及 Cauchy 推廣的均值定理, 堪稱為微積分的基石, 它們是僅次於微積分根本定理的重要定理。

本文我們要把它們統合在三元均值定理之下, 並且給出幾何解釋。進一步再推廣成 n 元與高維空間的均值定理。連貫的知識對於了解與學習都大有助益。

整個推演的出發點是:

定理1: (Fermat 的內點極值定理, 1629 年)

設 I ⊂ R 為一個區間, f : I → R 為一個函數, 並且 x₀ ∈ I。如果下列三個條件成立:

(i) x0 為 I 的內點;

(ii) f (x0) 為 f 的極值;

(iii) f 在 x0 點可微分。

那麼就有 f^′(x₀) = 0。反之不然。

反例: 設 f (x) = x³, x ∈ R , 則 f^′(0) = 0。我們觀察到: x = 0 是內點, 且 f 在此點可微分, 但是 f 為遞增函數, f (0) 既不是極大值, 也不是極小值。這表示, 由 f^′(x0) = 0 以及 (i) 與 (iii), 無法推導出 (ii)。

1. Rolle 定理

法國數學家 Rolle (1652−1719) 在解方程式時, 觀察到多項函數的行為, 例如 g(x) = x²− 5x + 6 及其導函數 g^′(x) = 2x − 5 的根之間具有密切關係:

在方程式 g(x) = 0 的兩個根 x = 2 與 x = 3 之間, 必存在有 c ∈ (2, 3) 是導函數方程式 g^′(x) = 0 的根, 此地 c = 2.5。

推而廣之, Rolle 就得到下面重要的結果。這只要利用連續函數的極值定理與 Fermat 的內點極值定理就可以證明。

52

(2)

定理2: (Rolle 定理, 1690 年)

假設 f : [a, b] → R 為一個函數。如果下列三個條件成立:

(i) f 在 [a, b] 上連續;

(ii) f 在 (a, b) 上可微分;

(iii) f (a) = 0 = f (b)。

那麼就存在 c ∈ (a, b), 使得 f^′(c) = 0。

證明: 因為 f 在 [a, b] 上連續, 所以 f 在 [a, b] 上取到最大值與最小值, 亦即存在 α, β ∈ [a, b], 使得

f (α) ≤ f (x) ≤ f (β), ∀ x ∈ [a, b]

若 α 與 β 皆為端點, 由 (iii) 知, f 為常函數, 取值 0。因此, 任取 c ∈ (a, b) 都有 f^′(c) = 0。

若 α 與 β 不皆為端點, 不妨假設 α 為內點 (β 為內點的情形, 同理可證)。那麼由費瑪的內點極值定理就得到 f^′(α) = 0。最後, 我們選取 c = α 就好了。

註: (i) 與 (ii) 兩個條件可用 “f 在 [a, b] 上可微分” 來取代。其次, (iii) 也可以改為 f (a) = f (b)。

注意: 在 (ii) 中即使只有一點不可微分都不行! 例如 f (x) = 1 − |x|, x ∈ [−1, 1]。

歷史故事: 在微積分草創期, 微積分建立在無窮小 (infinitesimal) 的論證上面, 無窮小有時等於 0, 有時又不等於 0, 這個矛盾難於說清楚。因此 Rolle 批評微積分是: 一堆智巧的錯誤集 (a collection of ingenious fallacies)。但在晚年他改變了態度, 視微積分為一門有用的學問。

問1: 甲乙兩人賽跑, 同時出發且同時抵達終點, 中間的過程互有快慢。試證必存在有某個時刻, 兩人具有相同的速度。

2. Lagrange 的均值定理

在 Rolle 定理中, 將端點的條件 (iii) 棄掉, 就得到下面推廣的重要結果:

定理3: (Lagrange 的均值定理, MVT, 1797 年) 假設 f : [a, b] → R 為一個函數。如果下列兩個條件成立:

(i) f 在 [a, b] 上連續;

(ii) f 在 (a, b) 上可微分;

那麼就存在 c ∈ (a, b), 使得

f^′(c) = f (b) − f (a)

b − a (1)

(3)

或者

f (b) − f (a) = f^′(c)(b − a) (2) 或者

f (b) = f (a) + f^′(c)(b − a). (3) 用幾何直觀來說: 將割線 ℓ 平行移動, 終至切曲線於 (c, f (c)) 點。

註: (i) 與 (ii) 兩個條件可用 “f 在 [a, b] 上可微分” 來取代。另外, c 點可以表成 c = a + θ(b − a) 之形式, 其中 0 < θ < 1; Rolle 定理亦然。又注意, 在 (ii) 中即使只有一點不可微分都不行。

在均值定理中, 若再要求 f (a) = f (b) = 0 的條件, 那麼就變成 Rolle 定理。因此, 均值定理是 Rolle 定理的推廣, 並且可用 Rolle 定理來證明。因此, 兩者在邏輯上等價!

另外, 這個定理的一個意思是, 可用有限步驟的演算式 f (b) − f (a)

b − a 來取代無窮步驟的演算式 f^′(c) = lim

x→c

f (x) − f (c)

x − c , 但是必須付出 c 不明確的代價。

推論: (不等號形式的均值定理)

假設 f 在 [a, b] 上可微分並且 |f^′(x)| ≤ K, ∀ x ∈ (a, b), 則有

|f (b) − f (a)| ≤ K · (b − a).

顯然常函數的微分為 0, 反過來也成立, 但這不顯然, 並且要小心敘述。因為階梯函數 f (x) = [x] 在可微分處, 皆有 f^′(x) = 0, 但它不是常函數。下面定理是 MVT 的簡單結論。

定理4: (微分方程根本補題)

若 f^′(x) = 0, ∀ x ∈ (a, b), 則 f 在 (a, b) 上為常函數。

註: 運動學的解釋: 速度恆為 0 的質點, 是靜止不動的, 從而位置不變。

(4)

這個定理可以用來確認一階微分方程 y^′(t) = αy(t) 解答的形貌, 故稱為微分方程根本補題。我們都知道 y = Ce^αt 是這個微分方程的解答。問還有沒有其它形式的解答? 沒有! 證明如下:

假設 y1 為任意解答, 故有 dy1/dt = αy1。考慮函數 y1/e^αt, 微分得到 D(y1/e^αt) = (y₁^′e^αt− y1αe^αt)/e^2αt = 0。因此, y1/e^αt = C, 常數。從而 y1 = Ce^αt。

故事: 俄國物理學家 Kapitza 提出如下的問題:「將炒菜盤綁在狗的尾巴上, 當狗向前跑時, 炒菜盤就會因為接觸地面而發出聲音, 若要使炒菜盤不發出聲音, 問如何辦到? 」許多物理學家想不出答案, 最後 Kapitza 公佈答案: 讓狗跑動的速度為 0 ! 速度為 0 是運動的特例。

推論: 若 f^′(x) = g^′(x), ∀ x ∈ (a, b), 則 f − g 在 (a, b) 為常數; 亦即 f (x) = g(x) + C, ∀ x ∈ (a, b).

定理5: (定積分的均值定理)

設 f 在 [a, b] 上連續, 則存在 c ∈ (a, b), 使得 Z b

a

f (x)dx = f (c)(b − a) 或 f (c) = 1 b − a

Z b a

f (x)dx. (4) 定理6: 假設 f 定義在 [a, b] 為連續可微分, 則下列兩敘述等價:

(i) Newton-Leibniz 公式 (N-L 公式):

Z b a

f^′(x)dx = f^′(c)(b − a)。

(ii) Lagrange 的均值定理: 存在 c ∈ (a, b) 使得 f (b) − f (a) = f^′(c)(b − a)。

證明: (i) ⇒ (ii): 將 N-L 公式 Rb

a f^′(x)dx = f (b) − f (a) 以及積分的均值定理: 存在 c ∈ (a, b) 使得 Rb

af^′(x)dx = f^′(c)(b − a), 兩者結合起來就得到 Lagrange 的均值定理 f (b) − f (a) = f^′(c)(b − a)。

(ii) ⇒ (i): 對 [a, b] 作分割: a = x0 < x1 < · · · < xn = b。將 f 對一分割小段 [x_k−1, xk] 使用 Lagrange 均值定理, 得知存在 c_k−1 ∈ (x_k−1, xk) 使得

f (xk) − f (x_k−1) = f^′(c_k−1)(xk− x_k−1).

作 Riemann 和得到

n

X

k=1

f^′(c_k−1)(xk− x_k−1) =

n

X

k=1

hf (xk) − f (x_k−1)i

= f (b) − f (a) 取極限就得到 N-L 公式:

Z b a

f^′(x)dx = f (b) − f (a).

(5)

N-L 公式與 MVT 最重要且美麗的推廣就是下面的 Taylor 定理:

定理7: (Taylor 定理, 1715 年)

假設 f 定義在 (a, b) 上, 具有直到 n + 1 階連續可微分, x₀ ∈ (a, b), 則

f (x) = Pn(x) + Rn+1(x), ∀ x ∈ (a, b) (5) 其中

Pn(x) = f (x0) + f^′(x0)(x − x0) + f^′′(x0)

2! (x − x0)²+ · · · + f⁽ⁿ⁾(x0)

n! (x − x0)ⁿ 叫做在 x0 點的第 n 階 Taylor 多項式, 並且剩餘項可以表為積分形式:

R_n+1(x) = Z x

x0

f⁽ⁿ⁺¹⁾(t)

n! (x − t)ⁿdt (6)

也可以表為微分形式:

Rn+1(x) = f⁽ⁿ⁺¹⁾(c)

(n + 1)!(x − x0)ⁿ⁺¹ (7) 其中 c 為介於 x₀ 與 x 之間的一個數。這叫做 Lagrange 形式的剩餘項。

註: 當 n = 0 時, (5) 式的積分剩餘項與微分剩餘項分別化約為 N-L 公式以及 MVT。

3. 均值定理的推廣

均值定理只涉及一個函數, 現在從一個函數變成兩個, 作「兩元化」之推廣, 我們就得到下面的重要結果:

定理8: (Cauchy 的兩元均值定理, 1821 年)

(i) 假設 f, g : [a, b] → R 為兩個連續函數並且在 (a, b) 上可微分。

那麼就存在 c ∈ (a, b), 使得

[f (b) − f (a)]g^′(c) = [g(b) − g(a)]f^′(c). (8) (ii) 若進一步再要求 g^′(t) 6= 0, ∀ t ∈ (a, b) 那麼就存在 c ∈ (a, b), 使得

f (b) − f (a)

g(b) − g(a) = f^′(c)

g^′(c). (9)

上述 (8) 與 (9) 兩式都叫做 Cauchy 公式。

註1: 根據 Rolle 定理, 條件 g^′(x) 6= 0, ∀ x ∈ (a, b), 保證了 g(b) − g(a) 6= 0。

(6)

註2: 取 g(t) = t, g^′(t) = 1, 則推廣的均值變率定理就變成均值定理。

Cauchy 的兩元均值定理是 L’Hopital 規則的理論基礎, 這是探求不定型極限的有力工具。

4. 三元化的統合觀點

上述是從 “特殊” 逐漸走到 “一般” 的情形, 而 Rolle 定理是核心。我們再採用「三元化」

的觀點, 涉及到三個地位相同的函數, 並且利用行列式的工具來表達, 就得到推廣的三元均值定理, 統合了上述所有的均值定理。

定理9: (推廣的三元均值定理)

假設函數 f , g, h 在 [a, b] 上連續並且在 (a, b) 上可微分, 令

F (t) =

f (a) f (b) f (t) g(a) g(b) g(t) h(a) h(b) h(t)

, ∀ t ∈ [a, b]

則存在 c ∈ (a, b), 使得 F^′(c) = 0, 亦即

f (a) f (b) f^′(c) g(a) g(b) g^′(c) h(a) h(b) h^′(c)

= 0. (10)

或者

f^′(c)[g(a)h(b) − h(a)g(b)] + g^′(c)[h(a)f (b) − f (a)h(b)]

+h^′(c)[f (a)g(b) − g(a)f (b)] = 0. (11) 證明: 顯然 F 在 [a, b] 上連續, 在 (a, b) 上可微分, 並且 F (a) = F (b) = 0。由 Rolle 定理得知, 存在 c ∈ (a, b), 使得 F^′(c) = 0。

函數F (t) 與定理 9 有幾何上的解釋:

考慮三維空間中的參數曲線

Γ : x = f (t), y = g(t), z = h(t) t ∈ [a, b]

其上三點 (f (a), g(a), h(a)), (f (b), g(b), h(b)), (f (t), g(t), h(t)), 形成三個從原點出發的位置向量:

~u = f (a)~i + g(a)~j + h(a)~k, ~v = f (b)~i + g(b)~j + h(b)~k

~

w(t) = f (t)~i + g(t)~j + h(t)~k.

(7)

它們所張出平行六面體, 其有號體積就是 F (t)。我們欲求 F (t) 的極值。令 π(~u, ~v) 表示由 ~u 與 ~v 所張出的平面, 曲線 Γ 由 (f (a), g(a), h(a)) 點出發到達 (f (b), g(b), h(b)), 我們只要在曲線 Γ 上找一點 (f (c), g(c), h(c)), 使得距離平面 π(~u, ~v) 為最遠或最近, 就有 F^′(c) = 0。

推論1: (Cauchy 的兩元均值定理)

在定理 9 的假設下, 並且取 h(t) ≡ 1, 則存在 c ∈ (a, b), 使得

f (a) f (b) f^′(c) g(a) g(b) g^′(c)

1 1 0

= 0. (12)

亦即

[f (b) − f (a)]g^′(c) = [g(b) − g(a)]f^′(c).

進一步, 若再假設 g^′(x) 6= 0, ∀ x ∈ (a, b), 則上式可寫成 f (b) − f (a)

g(b) − g(a) = f^′(c) g^′(c). 推論2: (Lagrange 的均值定理, MVT)

在定理 9 的假設下, 並且取 h(t) ≡ 1 與 g(t) = t, 則存在 c ∈ (a, b), 使得

f (a) f (b) f^′(c)

a b 1

1 1 0

= 0. (13)

亦即

f (b) − f (a) = f^′(c)(b − a).

推論3: (Rolle 定理)

在定理 9 的假設下, 並且取 h(t) ≡ 1, g(t) = t 且 f (a) = f (b) = 0, 則存在 c ∈ (a, b), 使得

0 0 f^′(c)

a b 1

1 1 0

= 0. (14)

亦即 f^′(c) = 0。

值得注意的是, 定理 9 以及上述三個推論在邏輯上都是等價的, 一般結果等價於特例! 這在數學中是常見的事情, 但是對於初學者卻仍然會覺得很驚奇。另一個例子: 勘根定理是中間值定理的特例, 但兩者在邏輯上也是等價的。

(8)

定理 9 統合了 Cauchy 的兩元均值定理, Lagrange 的均值定理以及 Rolle 定理為特例, 並且它的證明極其簡潔, 簡直是一行就證明完成。定理 9 含納無窮, 簡直比太平洋還要壯觀。這恰好應驗了法國數學家 A. Weil 的一句名言:

更普遍與更簡潔是結伴同行的。

(Greater generality and greater simplicity go hand in hand.)

5. 四元化的推廣

定理10: (推廣的四元均值定理)

假設函數 f , g, h, k 在 [a, b] 上連續, a < x₀ < b。令

G(t) =

f (a) f (x0) f (b) f (t) g(a) g(x0) g(b) g(t) h(a) h(x0) h(b) h(t) k(a) k(x0) k(b) k(t)

, ∀ t ∈ [a, b].

(i) 若 f , g, h, k 在 (a, b) 上可微分, 則存在 α, β, a < α < x₀ < β < b, 使得 G^′(α) = 0 = G^′(β)。

(ii) 進一步, 若 f , g, h, k 在 (a, b) 上為二階可微分, 那麼就存在 c ∈ (α, β) ⊂ (a, b), 使得 G^′′(c) = 0, 亦即

f (a) f (x0) f (b) f^′′(c) g(a) g(x0) g(b) g^′′(c) h(a) h(x0) h(b) h^′′(c) k(a) k(x₀) k(b) k^′′(c)

= 0. (15)

這由 Rolle 定理立即就得證。我們觀察定理 10的一個特例:

特例: (二階導數的均值定理)

在定理 10裡, 假設 f 為二階可微分, 並且取 k(t) ≡ 1, h(t) = t, g(t) = t², 則存在 c ∈ (a, b), 使得

G^′′(c) =

f (a) f (x0) f (b) f^′′(c) a² x²₀ b² 2

a x0 b 0

1 1 1 0

= 0

(9)

從而

f (x0) − f (a)

x0− a − f (b) − f (a) b − a

x0− b = 1 2f^′′(c).

此式可看作是二階導數的均值公式。

6. n 元化的推廣

上述定理 10又可以再推展到 n 個函數的情形, 採用 Rolle 定理就可得證。

定理11: (推廣的 n 元均值定理, n ≥ 3)

假設 n 個函數 f₁, f₂, . . . , fn 在 [a, b] 上連續, a < x₀ < x₁ < · · · < x_n−3 < b。令

H(t) =

f1(a) f1(x0) · · · f1(b) f1(t) f2(a) f2(x0) · · · f2(b) f2(t)

... ... · · · ... ... ... ... · · · ... ...

fn(a) fn(x0) · · · fn(b) fn(t)

, t ∈ [a, b].

第 1 層: 若 f₁, f2, . . . , fn 在 (a, b) 上可微分, 則存在 c_1,1 < c1,2 < · · · < c_1,n−2 使得 a < c1,1 < x0 < c1,2 < x1 < c1,3· · · < x_n−3 < c_1,n−2 < b, 並且

H^′(c1,k) = 0, k = 1, . . . , n − 2.

第 2 層: 進一步, 若 f₁, f₂, . . . , fn 在 (a, b) 上為二階可微分, 那麼就存在 c_2,1 < c_2,2 <

· · · < c_2,n−3, 使得 c1,1 < c2,1 < c1,2 < c2,2 < c1,3· · · < c_1,n−3 < c_2,n−3 < c_1,n−2, 並且 H^′′(c2,k) = 0, k = 1, . . . , n − 3。

繼續不斷做下去· · · ·

第 n − 2 層: 最後, 若 f₁, f2, . . . , fn 在 (a, b) 上為 n − 2 階可微分, 那麼就存在 c_n−2,1, 使得 a < c_n−1,1 < c_n−2,1< c_n−1,2 < b, 並且 H⁽ⁿ⁻²⁾(c_n−2,1) = 0。

7. 高維空間的推廣

另一方面, 在高等微積分裡, 定義在高維空間上的實值或向量值的多變數函數 f , 還有各式各樣的均值定理, 我們分成 f : R ⁿ → R 與 f : R ⁿ→ R ^m 兩種情形來討論。

定理12: (高維空間的均值定理)

(i) 假設函數 f : U ⊂ R ⁿ → R 在開集 U 上可微分。令 a 與 b 皆屬於 U 且連結它們的線

(10)

段 L(a, b) 也都落在 U 裡。那麼存在一點 c = a + t0(b − a), 其中 0 < t0 < 1, 使得

f (b) − f (a) = ∇f (c) · (b − a). (16) (ii) 假設 f = (f1, f2, . . . , fm) : U ⊂ R ⁿ → R ^m 在開集 U 上可微分, 線段 L(a, b) 落在 U 裡, 則存在 c₁, . . . , cm 屬於線段 L(a, b), 使得

fk(b) − fk(a) = ∇fk(ck) · (b − a), k = 1, 2, . . . , m.

證明: (i) 考慮函數 g(t) = f [a + t(b − a)], 對 g 在 [0, 1] 上使用 Lagrange 均值定理與連鎖規則就好了。 (ii) 對於每個分量 fk 皆分別使用 (i) 就得證。

對於 (ii) 的情形, 美中不足的是, 其中落在線段上的諸點 c_k ∈ L(a, b) 對每個分量函數 fk 皆不同。因此我們無法期盼如 (16) 式具有共同點之結果, 對所有函數 f : A ⊂ Rⁿ→ R^m 都成立。

反例: 假設 f1(x) = cos x, f2(x) = sin x, 並且選取 a = 0, b = 2π。考慮函數 f = (f1, f2) : [0, 2π] → R ², 則 (16) 式之形的均值定理不成立。

修改為不等式形式的均值定理是可行之道。

定理13: (高維空間不等式形式的均值定理)

假設 U ⊂ R ⁿ 為開集, f : U → R ^m 為可微分函數。令 a 與 b 皆屬於 U 且連結它們的線段 L(a, b) 也都落在 U 裡。再假設

kDf (x)k ≤ M, ∀ x ∈ L(a, b) 其中 k k 表示線性算子的範數 (norm)。那麼我們就有

kf (b) − f (a)k ≤ M · kb − ak. (17)

證明: 考慮函數 g(t) = f [a + t(b − a)], t ∈ [0, 1]。利用連鎖規則, 作微分得到 d

dtf [a + t(b − a)] = Df [a + t(b − a)] · (b − a)。對 t 從 t = 0 積分到 t = 1 得到 f (b) − f (a) =

Z 1 0

n

Df [a + t(b − a)] · (b − a)o dt

此地的積分是對各成份函數來定義。現在取範數, 因為積分的範數小於等於範數的積分, 就得到 (17) 式。

(11)

將定理 13 中的高維歐氏空間改為更廣泛的賦範向量空間 (normed vector space), 結果仍然成立。

下面我們給出均值定理的一個重要用途:

定理14: 假設 U ⊂ R ⁿ 為連通的開集, 並且 f : U → R ^m 為可微分函數。如果 Df (x) = 0, ∀ x ∈ U, 則 f 為常函數。

證明: 取定一點 a ∈ U, 並且令 V = {b ∈ U|f (b) = f (a)}, 即 V = f⁻¹(a)。因為 f 為連續函數, 故 V 為 U 中的閉集。另一方面, 因為 U 為開集, 故對於每個 x ∈ V ⊂ U, 都存在開的球 B, 半徑大於 0 且被包含於 U 中。這個球 B 是凸集 (convex set), 由定理 13 知, f (y) = f (x) = f (a), ∀ y ∈ B。從而 V 也是 U 中的開集。今因 U 為連通集, 而連通集中沒有既開且閉的真子集, 所以 V = U。

8. 結語

將數學結果連貫成有機整體, 使得沒有一片知識是孤立的, 這是數學美的要素之一。在微積分裡, 均值定理的知識網是一個著名的例子, 其中 Rolle 定理是核心樞紐!

最後我們整理出本文所涉及的定理之邏輯網絡 (logical net):

參考文獻

1. Gabriel Klambauer, Aspects of Calculus, Springer-Verlag, 1986.

2. E. Hairer and G. Wanner, Analysis by Its History, Springer-Verlag, 1996.

3. James R. Munkres, Analysis on Manifold, Addison-Wesley, 1991.

4. J. E. Marsden and M. J. Hoffman, Elementary Classical Analysis, 1974.

5. A. Avez, Differential Calculus, John Wiley and Sons, 1986.

6. 黃見利, 均值定理的一個有趣的幾何意義, 數學傳播, 29 卷 2 期, 2005。

—

本文作者為台大數學系退休教授