均值定理的統合與推廣
蔡聰明
在微積分中, Rolle 定理、Lagrange 的均值定理 (Mean-Value Theorem, 簡記為 MVT), 以及 Cauchy 推廣的均值定理, 堪稱為微積分的基石, 它們是僅次於微積分根本定理的重要定 理。
本文我們要把它們統合在三元均值定理之下, 並且給出幾何解釋。 進一步再推廣成 n 元與 高維空間的均值定理。 連貫的知識對於了解與學習都大有助益。
整個推演的出發點是:
定理1: (Fermat 的內點極值定理, 1629 年)
設 I ⊂ R 為一個區間, f : I → R 為一個函數, 並且 x0 ∈ I。 如果下列三個條件成立:
(i) x0 為 I 的內點;
(ii) f (x0) 為 f 的極值;
(iii) f 在 x0 點可微分。
那麼就有 f′(x0) = 0。 反之不然。
反例: 設 f (x) = x3, x ∈ R , 則 f′(0) = 0。 我們觀察到: x = 0 是內點, 且 f 在此點 可微分, 但是 f 為遞增函數, f (0) 既不是極大值, 也不是極小值。 這表示, 由 f′(x0) = 0 以及 (i) 與 (iii), 無法推導出 (ii)。
1. Rolle 定理
法國數學家 Rolle (1652−1719) 在解方程式時, 觀察到多項函數的行為, 例如 g(x) = x2− 5x + 6 及其導函數 g′(x) = 2x − 5 的根之間具有密切關係:
在方程式 g(x) = 0 的兩個根 x = 2 與 x = 3 之間, 必存在有 c ∈ (2, 3) 是導函數方程式 g′(x) = 0 的根, 此地 c = 2.5。
推而廣之, Rolle 就得到下面重要的結果。 這只要利用連續函數的極值定理與 Fermat 的 內點極值定理就可以證明。
52
定理2: (Rolle 定理, 1690 年)
假設 f : [a, b] → R 為一個函數。 如果下列三個條件成立:
(i) f 在 [a, b] 上連續;
(ii) f 在 (a, b) 上可微分;
(iii) f (a) = 0 = f (b)。
那麼就存在 c ∈ (a, b), 使得 f′(c) = 0。
證明: 因為 f 在 [a, b] 上連續, 所以 f 在 [a, b] 上取到最大值與最小值, 亦即存在 α, β ∈ [a, b], 使得
f (α) ≤ f (x) ≤ f (β), ∀ x ∈ [a, b]
若 α 與 β 皆為端點, 由 (iii) 知, f 為常函數, 取值 0。 因此, 任取 c ∈ (a, b) 都有 f′(c) = 0。
若 α 與 β 不皆為端點, 不妨假設 α 為內點 (β 為內點的情形, 同理可證)。 那麼由費瑪的內點 極值定理就得到 f′(α) = 0。 最後, 我們選取 c = α 就好了。
註: (i) 與 (ii) 兩個條件可用 “f 在 [a, b] 上可微分” 來取代。 其次, (iii) 也可以改為 f (a) = f (b)。
注意: 在 (ii) 中即使只有一點不可微分都不行! 例如 f (x) = 1 − |x|, x ∈ [−1, 1]。
歷史故事: 在微積分草創期, 微積分建立在無窮小 (infinitesimal) 的論證上面, 無窮小有 時等於 0, 有時又不等於 0, 這個矛盾難於說清楚。 因此 Rolle 批評微積分是: 一堆智巧的錯誤 集 (a collection of ingenious fallacies)。 但在晚年他改變了態度, 視微積分為一門有用的學 問。
問1: 甲乙兩人賽跑, 同時出發且同時抵達終點, 中間的過程互有快慢。 試證必存在有某個 時刻, 兩人具有相同的速度。
2. Lagrange 的均值定理
在 Rolle 定理中, 將端點的條件 (iii) 棄掉, 就得到下面推廣的重要結果:
定理3: (Lagrange 的均值定理, MVT, 1797 年) 假設 f : [a, b] → R 為一個函數。 如果下列兩個條件成立:
(i) f 在 [a, b] 上連續;
(ii) f 在 (a, b) 上可微分;
那麼就存在 c ∈ (a, b), 使得
f′(c) = f (b) − f (a)
b − a (1)
或者
f (b) − f (a) = f′(c)(b − a) (2) 或者
f (b) = f (a) + f′(c)(b − a). (3) 用幾何直觀來說: 將割線 ℓ 平行移動, 終至切曲線於 (c, f (c)) 點。
註: (i) 與 (ii) 兩個條件可用 “f 在 [a, b] 上可微分” 來取代。 另外, c 點可以表成 c = a + θ(b − a) 之形式, 其中 0 < θ < 1; Rolle 定理亦然。 又注意, 在 (ii) 中即使只有一點不可 微分都不行。
在均值定理中, 若再要求 f (a) = f (b) = 0 的條件, 那麼就變成 Rolle 定理。 因此, 均值 定理是 Rolle 定理的推廣, 並且可用 Rolle 定理來證明。 因此, 兩者在邏輯上等價!
另外, 這個定理的一個意思是, 可用有限步驟的演算式 f (b) − f (a)
b − a 來取代無窮步驟的演 算式 f′(c) = lim
x→c
f (x) − f (c)
x − c , 但是必須付出 c 不明確的代價。
推論: (不等號形式的均值定理)
假設 f 在 [a, b] 上可微分並且 |f′(x)| ≤ K, ∀ x ∈ (a, b), 則有
|f (b) − f (a)| ≤ K · (b − a).
顯然常函數的微分為 0, 反過來也成立, 但這不顯然, 並且要小心敘述。 因為階梯函數 f (x) = [x] 在可微分處, 皆有 f′(x) = 0, 但它不是常函數。 下面定理是 MVT 的簡單結論。
定理4: (微分方程根本補題)
若 f′(x) = 0, ∀ x ∈ (a, b), 則 f 在 (a, b) 上為常函數。
註: 運動學的解釋: 速度恆為 0 的質點, 是靜止不動的, 從而位置不變。
這個定理可以用來確認一階微分方程 y′(t) = αy(t) 解答的形貌, 故稱為微分方程根本補 題。 我們都知道 y = Ceαt 是這個微分方程的解答。 問還有沒有其它形式的解答? 沒有! 證明 如下:
假設 y1 為任意解答, 故有 dy1/dt = αy1。 考慮函數 y1/eαt, 微分得到 D(y1/eαt) = (y1′eαt− y1αeαt)/e2αt = 0。 因此, y1/eαt = C, 常數。 從而 y1 = Ceαt。
故事: 俄國物理學家 Kapitza 提出如下的問題:「將炒菜盤綁在狗的尾巴上, 當狗向前跑 時, 炒菜盤就會因為接觸地面而發出聲音, 若要使炒菜盤不發出聲音, 問如何辦到? 」 許多物理 學家想不出答案, 最後 Kapitza 公佈答案: 讓狗跑動的速度為 0 ! 速度為 0 是運動的特例。
推論: 若 f′(x) = g′(x), ∀ x ∈ (a, b), 則 f − g 在 (a, b) 為常數; 亦即 f (x) = g(x) + C, ∀ x ∈ (a, b).
定理5: (定積分的均值定理)
設 f 在 [a, b] 上連續, 則存在 c ∈ (a, b), 使得 Z b
a
f (x)dx = f (c)(b − a) 或 f (c) = 1 b − a
Z b a
f (x)dx. (4) 定理6: 假設 f 定義在 [a, b] 為連續可微分, 則下列兩敘述等價:
(i) Newton-Leibniz 公式 (N-L 公式):
Z b a
f′(x)dx = f′(c)(b − a)。
(ii) Lagrange 的均值定理: 存在 c ∈ (a, b) 使得 f (b) − f (a) = f′(c)(b − a)。
證明: (i) ⇒ (ii): 將 N-L 公式 Rb
a f′(x)dx = f (b) − f (a) 以及積分的均值定理: 存 在 c ∈ (a, b) 使得 Rb
af′(x)dx = f′(c)(b − a), 兩者結合起來就得到 Lagrange 的均值定理 f (b) − f (a) = f′(c)(b − a)。
(ii) ⇒ (i): 對 [a, b] 作分割: a = x0 < x1 < · · · < xn = b。 將 f 對一分割小段 [xk−1, xk] 使用 Lagrange 均值定理, 得知存在 ck−1 ∈ (xk−1, xk) 使得
f (xk) − f (xk−1) = f′(ck−1)(xk− xk−1).
作 Riemann 和得到
n
X
k=1
f′(ck−1)(xk− xk−1) =
n
X
k=1
hf (xk) − f (xk−1)i
= f (b) − f (a) 取極限就得到 N-L 公式:
Z b a
f′(x)dx = f (b) − f (a).
N-L 公式與 MVT 最重要且美麗的推廣就是下面的 Taylor 定理:
定理7: (Taylor 定理, 1715 年)
假設 f 定義在 (a, b) 上, 具有直到 n + 1 階連續可微分, x0 ∈ (a, b), 則
f (x) = Pn(x) + Rn+1(x), ∀ x ∈ (a, b) (5) 其中
Pn(x) = f (x0) + f′(x0)(x − x0) + f′′(x0)
2! (x − x0)2+ · · · + f(n)(x0)
n! (x − x0)n 叫做在 x0 點的第 n 階 Taylor 多項式, 並且剩餘項可以表為積分形式:
Rn+1(x) = Z x
x0
f(n+1)(t)
n! (x − t)ndt (6)
也可以表為微分形式:
Rn+1(x) = f(n+1)(c)
(n + 1)!(x − x0)n+1 (7) 其中 c 為介於 x0 與 x 之間的一個數。 這叫做 Lagrange 形式的剩餘項。
註: 當 n = 0 時, (5) 式的積分剩餘項與微分剩餘項分別化約為 N-L 公式以及 MVT。
3. 均值定理的推廣
均值定理只涉及一個函數, 現在從一個函數變成兩個, 作 「兩元化」 之推廣, 我們就得到下 面的重要結果:
定理8: (Cauchy 的兩元均值定理, 1821 年)
(i) 假設 f, g : [a, b] → R 為兩個連續函數並且在 (a, b) 上可微分。
那麼就存在 c ∈ (a, b), 使得
[f (b) − f (a)]g′(c) = [g(b) − g(a)]f′(c). (8) (ii) 若進一步再要求 g′(t) 6= 0, ∀ t ∈ (a, b) 那麼就存在 c ∈ (a, b), 使得
f (b) − f (a)
g(b) − g(a) = f′(c)
g′(c). (9)
上述 (8) 與 (9) 兩式都叫做 Cauchy 公式。
註1: 根據 Rolle 定理, 條件 g′(x) 6= 0, ∀ x ∈ (a, b), 保證了 g(b) − g(a) 6= 0。
註2: 取 g(t) = t, g′(t) = 1, 則推廣的均值變率定理就變成均值定理。
Cauchy 的兩元均值定理是 L’Hopital 規則的理論基礎, 這是探求不定型極限的有力工 具。
4. 三元化的統合觀點
上述是從 “特殊” 逐漸走到 “一般” 的情形, 而 Rolle 定理是核心。 我們再採用 「三元化」
的觀點, 涉及到三個地位相同的函數, 並且利用行列式的工具來表達, 就得到推廣的三元均值定 理, 統合了上述所有的均值定理。
定理9: (推廣的三元均值定理)
假設函數 f , g, h 在 [a, b] 上連續並且在 (a, b) 上可微分, 令
F (t) =
f (a) f (b) f (t) g(a) g(b) g(t) h(a) h(b) h(t)
, ∀ t ∈ [a, b]
則存在 c ∈ (a, b), 使得 F′(c) = 0, 亦即
f (a) f (b) f′(c) g(a) g(b) g′(c) h(a) h(b) h′(c)
= 0. (10)
或者
f′(c)[g(a)h(b) − h(a)g(b)] + g′(c)[h(a)f (b) − f (a)h(b)]
+h′(c)[f (a)g(b) − g(a)f (b)] = 0. (11) 證明: 顯然 F 在 [a, b] 上連續, 在 (a, b) 上可微分, 並且 F (a) = F (b) = 0。 由 Rolle 定理得知, 存在 c ∈ (a, b), 使得 F′(c) = 0。
函數F (t) 與定理 9 有幾何上的解釋:
考慮三維空間中的參數曲線
Γ : x = f (t), y = g(t), z = h(t) t ∈ [a, b]
其上三點 (f (a), g(a), h(a)), (f (b), g(b), h(b)), (f (t), g(t), h(t)), 形成三個從原點出發的位 置向量:
~u = f (a)~i + g(a)~j + h(a)~k, ~v = f (b)~i + g(b)~j + h(b)~k
~
w(t) = f (t)~i + g(t)~j + h(t)~k.
它們所張出平行六面體, 其有號體積就是 F (t)。 我們欲求 F (t) 的極值。 令 π(~u, ~v) 表示由 ~u 與 ~v 所張出的平面, 曲線 Γ 由 (f (a), g(a), h(a)) 點出發到達 (f (b), g(b), h(b)), 我們只要在 曲線 Γ 上找一點 (f (c), g(c), h(c)), 使得距離平面 π(~u, ~v) 為最遠或最近, 就有 F′(c) = 0。
推論1: (Cauchy 的兩元均值定理)
在定理 9 的假設下, 並且取 h(t) ≡ 1, 則存在 c ∈ (a, b), 使得
f (a) f (b) f′(c) g(a) g(b) g′(c)
1 1 0
= 0. (12)
亦即
[f (b) − f (a)]g′(c) = [g(b) − g(a)]f′(c).
進一步, 若再假設 g′(x) 6= 0, ∀ x ∈ (a, b), 則上式可寫成 f (b) − f (a)
g(b) − g(a) = f′(c) g′(c). 推論2: (Lagrange 的均值定理, MVT)
在定理 9 的假設下, 並且取 h(t) ≡ 1 與 g(t) = t, 則存在 c ∈ (a, b), 使得
f (a) f (b) f′(c)
a b 1
1 1 0
= 0. (13)
亦即
f (b) − f (a) = f′(c)(b − a).
推論3: (Rolle 定理)
在定理 9 的假設下, 並且取 h(t) ≡ 1, g(t) = t 且 f (a) = f (b) = 0, 則存在 c ∈ (a, b), 使得
0 0 f′(c)
a b 1
1 1 0
= 0. (14)
亦即 f′(c) = 0。
值得注意的是, 定理 9 以及上述三個推論在邏輯上都是等價的, 一般結果等價於特例! 這 在數學中是常見的事情, 但是對於初學者卻仍然會覺得很驚奇。 另一個例子: 勘根定理是中間 值定理的特例, 但兩者在邏輯上也是等價的。
定理 9 統合了 Cauchy 的兩元均值定理, Lagrange 的均值定理以及 Rolle 定理為特例, 並且它的證明極其簡潔, 簡直是一行就證明完成。 定理 9 含納無窮, 簡直比太平洋還要壯觀。 這 恰好應驗了法國數學家 A. Weil 的一句名言:
更普遍與更簡潔是結伴同行的。
(Greater generality and greater simplicity go hand in hand.)
5. 四元化的推廣
定理10: (推廣的四元均值定理)
假設函數 f , g, h, k 在 [a, b] 上連續, a < x0 < b。 令
G(t) =
f (a) f (x0) f (b) f (t) g(a) g(x0) g(b) g(t) h(a) h(x0) h(b) h(t) k(a) k(x0) k(b) k(t)
, ∀ t ∈ [a, b].
(i) 若 f , g, h, k 在 (a, b) 上可微分, 則存在 α, β, a < α < x0 < β < b, 使得 G′(α) = 0 = G′(β)。
(ii) 進一步, 若 f , g, h, k 在 (a, b) 上為二階可微分, 那麼就存在 c ∈ (α, β) ⊂ (a, b), 使得 G′′(c) = 0, 亦即
f (a) f (x0) f (b) f′′(c) g(a) g(x0) g(b) g′′(c) h(a) h(x0) h(b) h′′(c) k(a) k(x0) k(b) k′′(c)
= 0. (15)
這由 Rolle 定理立即就得證。 我們觀察定理 10的一個特例:
特例: (二階導數的均值定理)
在定理 10裡, 假設 f 為二階可微分, 並且取 k(t) ≡ 1, h(t) = t, g(t) = t2, 則存在 c ∈ (a, b), 使得
G′′(c) =
f (a) f (x0) f (b) f′′(c) a2 x20 b2 2
a x0 b 0
1 1 1 0
= 0
從而
f (x0) − f (a)
x0− a − f (b) − f (a) b − a
x0− b = 1 2f′′(c).
此式可看作是二階導數的均值公式。
6. n 元化的推廣
上述定理 10又可以再推展到 n 個函數的情形, 採用 Rolle 定理就可得證。
定理11: (推廣的 n 元均值定理, n ≥ 3)
假設 n 個函數 f1, f2, . . . , fn 在 [a, b] 上連續, a < x0 < x1 < · · · < xn−3 < b。 令
H(t) =
f1(a) f1(x0) · · · f1(b) f1(t) f2(a) f2(x0) · · · f2(b) f2(t)
... ... · · · ... ... ... ... · · · ... ...
fn(a) fn(x0) · · · fn(b) fn(t)
, t ∈ [a, b].
第 1 層: 若 f1, f2, . . . , fn 在 (a, b) 上可微分, 則存在 c1,1 < c1,2 < · · · < c1,n−2 使得 a < c1,1 < x0 < c1,2 < x1 < c1,3· · · < xn−3 < c1,n−2 < b, 並且
H′(c1,k) = 0, k = 1, . . . , n − 2.
第 2 層: 進一步, 若 f1, f2, . . . , fn 在 (a, b) 上為二階可微分, 那麼就存在 c2,1 < c2,2 <
· · · < c2,n−3, 使得 c1,1 < c2,1 < c1,2 < c2,2 < c1,3· · · < c1,n−3 < c2,n−3 < c1,n−2, 並且 H′′(c2,k) = 0, k = 1, . . . , n − 3。
繼續不斷做下去· · · ·
第 n − 2 層: 最後, 若 f1, f2, . . . , fn 在 (a, b) 上為 n − 2 階可微分, 那麼就存在 cn−2,1, 使 得 a < cn−1,1 < cn−2,1< cn−1,2 < b, 並且 H(n−2)(cn−2,1) = 0。
7. 高維空間的推廣
另一方面, 在高等微積分裡, 定義在高維空間上的實值或向量值的多變數函數 f , 還有各 式各樣的均值定理, 我們分成 f : R n → R 與 f : R n→ R m 兩種情形來討論。
定理12: (高維空間的均值定理)
(i) 假設函數 f : U ⊂ R n → R 在開集 U 上可微分。 令 a 與 b 皆屬於 U 且連結它們的線
段 L(a, b) 也都落在 U 裡。 那麼存在一點 c = a + t0(b − a), 其中 0 < t0 < 1, 使得
f (b) − f (a) = ∇f (c) · (b − a). (16) (ii) 假設 f = (f1, f2, . . . , fm) : U ⊂ R n → R m 在開集 U 上可微分, 線段 L(a, b) 落在 U 裡, 則存在 c1, . . . , cm 屬於線段 L(a, b), 使得
fk(b) − fk(a) = ∇fk(ck) · (b − a), k = 1, 2, . . . , m.
證明: (i) 考慮函數 g(t) = f [a + t(b − a)], 對 g 在 [0, 1] 上使用 Lagrange 均值定理 與連鎖規則就好了。 (ii) 對於每個分量 fk 皆分別使用 (i) 就得證。
對於 (ii) 的情形, 美中不足的是, 其中落在線段上的諸點 ck ∈ L(a, b) 對每個分量函數 fk 皆不同。 因此我們無法期盼如 (16) 式具有共同點之結果, 對所有函數 f : A ⊂ Rn→ Rm 都成立。
反例: 假設 f1(x) = cos x, f2(x) = sin x, 並且選取 a = 0, b = 2π。 考慮函數 f = (f1, f2) : [0, 2π] → R 2, 則 (16) 式之形的均值定理不成立。
修改為不等式形式的均值定理是可行之道。
定理13: (高維空間不等式形式的均值定理)
假設 U ⊂ R n 為開集, f : U → R m 為可微分函數。 令 a 與 b 皆屬於 U 且連結它們的線 段 L(a, b) 也都落在 U 裡。 再假設
kDf (x)k ≤ M, ∀ x ∈ L(a, b) 其中 k k 表示線性算子的範數 (norm)。 那麼我們就有
kf (b) − f (a)k ≤ M · kb − ak. (17)
證明: 考慮函數 g(t) = f [a + t(b − a)], t ∈ [0, 1]。 利用連鎖規則, 作微分得到 d
dtf [a + t(b − a)] = Df [a + t(b − a)] · (b − a)。 對 t 從 t = 0 積分到 t = 1 得到 f (b) − f (a) =
Z 1 0
n
Df [a + t(b − a)] · (b − a)o dt
此地的積分是對各成份函數來定義。 現在取範數, 因為積分的範數小於等於範數的積分, 就得到 (17) 式。
將定理 13 中的高維歐氏空間改為更廣泛的賦範向量空間 (normed vector space), 結果 仍然成立。
下面我們給出均值定理的一個重要用途:
定理14: 假設 U ⊂ R n 為連通的開集, 並且 f : U → R m 為可微分函數。 如果 Df (x) = 0, ∀ x ∈ U, 則 f 為常函數。
證明: 取定一點 a ∈ U, 並且令 V = {b ∈ U|f (b) = f (a)}, 即 V = f−1(a)。 因為 f 為連續函數, 故 V 為 U 中的閉集。 另一方面, 因為 U 為開集, 故對於每個 x ∈ V ⊂ U, 都 存在開的球 B, 半徑大於 0 且被包含於 U 中。 這個球 B 是凸集 (convex set), 由定理 13 知, f (y) = f (x) = f (a), ∀ y ∈ B。 從而 V 也是 U 中的開集。 今因 U 為連通集, 而連通集中沒 有既開且閉的真子集, 所以 V = U。
8. 結語
將數學結果連貫成有機整體, 使得沒有一片知識是孤立的, 這是數學美的要素之一。 在微 積分裡, 均值定理的知識網是一個著名的例子, 其中 Rolle 定理是核心樞紐!
最後我們整理出本文所涉及的定理之邏輯網絡 (logical net):