平 均 論
李春億
一 . 平均數的基本特性
設 n ≥ 2, 某實數集 D 中的 n 個數 x1, x2, . . . , xn 的平均數有下列數種:
1. 算術平均數 x1+x2+···+xn n。 D 為所有實數的集合。
2. 幾何平均數 √nx1x2· · · xn。 D 為所有正實數的集合。
3. 調和平均數 1 n x1+x21+···+xn1
。 D 可以選為正實數的集合。
4. 方均根
q
x21+x22+···+xn 2n。 D 可以選為正實數的集合。5. 反調和平均數 xx21+x22+···+x2n
1+x2+···+xn。 D 可以選為正實數的集合。
此外尚有兩個正數的希羅平均數 a+√ab+b
3 。 這希羅平均數似乎沒有推廣到 n 個數的理想 辦法。
現在數學只是定義出如上幾個特定的平均數, 並討論其個別特性及彼此間的關係, 而缺乏 完整的理論。 本文將試著定義出較完整的平均數的理論, 以創立一個平均論 (Average The- ory)。
若 x1, x2, · · · , xn 均為實數的集合 D 中的數, a = m(x1, x2, · · · , xn) 是類似上述各種 平均數的一項函數。 我們稱得 m 為平均法 (averaging method), a 為平均數 (average) 或平 均值 (average value), n 為項次, D 為平均數的定義域。 我們至少對平均法作以下的要求:
1、 確定性: 對任意正整數 n ≥ 2, m 均可視為一個 n 個變數的函數。 換言之, a 可由 x1, x2, . . . , xn 完全決定。
2、 封閉性: a ∈ D.
3、 居中性: min(x1, x2, . . . , xn) ≤ a ≤ max(x1, x2, . . . , xn)。
4、 對稱性: 若i1, i2, . . . , in 為 1, 2, . . . , n 的一個排列, 則
m(xi1, xi2, . . . , xin) = m(x1, x2, . . . , xn).
5、 次方遞迴性: 若 a1 = m(x1,1, x1,2, . . . , x1,nk), a2 = m(x2,1, x2,2, . . . , x2,nk),. . . , an =
m(xn,1, xn,2, . . . , xn,nk), 則
m(a1, a2, . . . , an) = m(x1,1, . . . , x1,nk, x2,1, . . . , x2,nk, . . . , xn,1, . . . , xn,nk).
對稱性基本上就是交換律的延伸。 次方遞迴性類似結合律。 以上定義的種種平均數都有確 定性、 對稱性、 定義域的選擇也使它們有封閉性。 但反調和平均數沒有居中性和性。 我們願意把 它排除在要討論的平均論之外。
二 . 運算平均數
設 D 為實數的集合, p(x, y) 為 x ∈ D, y ∈ D 的函數。 若 p(x, y) ∈ D, 且對 x, y, z ∈ D 滿足
交換律: p(x, y) = p(y, x),
結合律: p(p(x, y), z) = p(x, p(y, z)),
則我們稱 p 為一個運算。 我們可以用遞迴的方式定義多於兩個運算元的運算如下:
p(x1, x2, . . . , xn) = p(p(x1, x2, . . . , xn−1), xn).
這樣定義的運算具有確定性、 對稱性、 封閉性和組合性。
設 p 為集合 D 上的一運算, x1, x2, . . . , xn ∈ D。 若有一數 a 使 p(a, a, . . . , a
| {z }
n項
) = p(x1, x2, . . . , xn),
我們則暫時把 a 叫作由 p 所定義的 x1, x2, . . . , xn 的運算平均數。
例如: 若 p(x, y) = x + y, 則由 p 所定義的運算平均數為算術平均數。
若 p(x, y) = xy, 則由 p 所定義的運算平均數為幾何平均數。
若 p(x, y) = xy, 則由 p 所定義的運算平均數為幾何平均數。
若 p(x, y) = x1 + 1y, 則由 p 所定義的運算平均數為調和平均數。
若 p(x, y) = x2 + y2, 則由 p 所定義的運算平均數為方均根。
若 p(x, y) = max(x, y), 則由p所定義的運算平均數為最大值。
若 p(x, y) = min(x, y), 則由p所定義的運算平均數為最小值。
但希羅平均數和反調和平均數似乎都不是運算平均數。
定理1: 運算平均數具次方遞迴性。
證明: 設 m 為由運算 p 所得的運算平均數, ai = m(xi,1, xi,2, . . . , xi,nk), i = 1, 2, . . . , n, a = m(a1, a2, . . . , an), 則 p(xi,1, xi,2, . . . , xi,nk) 等於 nk 個 ai 經過運算 p 所運算出來 的結果。 由結合律, p(x1,1, . . . , x1,nk, x2,1, . . . , x2,nk, . . . , xn,1, . . . , xn,nk) 等於 a1, a2, . . . , an
諸數每個出現 nk 次在 p 下計算的結果。 但每組 a1, a2, . . . , an在 p 下的運算相當於 n 個 a 在 p 下的運算, 所以 p(x1,1, . . . , x1,nk, x2,1, . . . , x2,nk, . . . , xn,1, . . . , xn,nk) 等於 n · nk = nk+1 個 a 在 p 下運算的結果。 這就是說
a = m(x1,1, . . . , x1,nk, x2,1, . . . , x2,nk, . . . , xn,1, . . . , xn,nk).
利用和定理 1 相似的證明, 我們也可以證明。
定理2: 設m為運算平均法,
a = m(x1, x2, . . . , xn), a1= m(a, x2, . . . , xn), a2= m(x1, a, . . . , xn),
...
an= m(x1, x2, . . . , a), a0= m(a1, a2, . . . , an).
則 a0 = a。
定理 2 是運算平均數的一個必要條件, 當它不成立時, 可以證明這種平均數不是運算平均 數。 另一方面, 雖然由定理 1 知運算平均數具有次方遞迴性, 但在別的性質上就不那麼理想了。
首先, 若 12 ∈ D, 而令 p(x, y) = 12, 則 p 是 D 上的一個運算, 但這時可以得到任意 D 中 的數都是 D 中任意多個數在 p 下的運算平均數, 所以在這個 p 下沒有確定性。 再者, 令 D 為 正整數的集合, 若 p(x, y) = g.c.d(x, y), 則 p 是一個好的運算, 但 p(4, 6) = 2 < min(4, 6)。
所以這運算平均數沒有居中性。 同理 l.c.m. 運算也沒有居中性。 由於這些問題, 我們必須縮減 運算的範圍, 以達到適當的平均數的理論。
三 . 函數平均數
在本節中我們把運算平均數特殊化, 選擇呈下形的運算:
p(x, y) = f (x) + f (y),
1. f : (u, v) → (u, v) 為二階可微的單調函數。
2. f′′(x) f′(x) 連續。
這時我們稱由運算 f (x) + f (y) 所定義的平均數為函數平均數 m(x1, x2, . . . , xn) = f−1
h
1n
X
ni=1
f (xi)
i
. 函數 f 叫作平均化函數 (averaging function)。函數平均數顯然具有確定性、 封閉性、 居中性、 對稱性。 由定理 1 知它也具有次方遞迴性。
所以在研究平均數時, 它是很好的研究對象。 本文以下以討論函數平均數為主。
設 f (x) 為平均化函數, 則 f′(x) 6= 0。 由不定積分知 ln |f′(x)| 連續。 但 f(x) 是單調函 數, 所以 f′(x) 不改變符號, 因而連續。 再從條件 2 知 f′′(x) 連續。
定理3: 設 f (x) 和 g(x) 均為區間 (u, v) 上的平均化函數, 則下列四條件同值:
(1) f′′(x)
f′(x) = g′′(x) g′(x);
(2) f (x) 和 g(x) 互相可以表為一次式. 即有常數 c0 和 c1 6= 0 使 f (x) = c0+ c1g(x).
(3) 若 x1, x2, . . . , xn∈ (u, v), 則 f−1
1
n
X
ni=1
f (xi)
= g−1
1 n
X
ni=1
g(xi)
. (4) 若 x, y ∈ (u, v), 則
f−1
1
2[f (x) + f (y)]
= g−1
1
2[g(x) + g(y)]
. 證明: (1) ⇒ (2). 從 (1) 得
h
f′(x) g′(x)i
′= g′(x)f′′(x) − f′(x)g′′(x) g′(x)2 = 0.
所以有常數 c1 使 f′(x) = c1g′(x)。 再積分便得 (2)。
(2) ⇒ (1). 從 (2), f′(x) = c1g′(x)。 再微分得 f′′(x) = c1g′′(x)。 相除即得 (1) 式。
(2) ⇒ (3). 令 f(x) = y。 g(x) = c11(y − c0); f−1(y) = x = g−1(c1
1(y − c0))。 於是 f−1(1
n
X
ni=1
f (xi)) = f−1(1 n
X
ni=1
[c0+ c1g(xi)])
= f−1(c0+ c1
1 n
X
ni=1
g(xi)) = g−1(1 n
X
ni=1
g(xi))
(3) ⇒ (4). (4) 其實就是 (3) 中 n = 2 的特殊情形。
(4) ⇒ (2). 設 fg−1= h, g(x) = ξ, g(y) = η。 (4) 式可以看成 h(ξ) + h(η)
2 = h(ξ + η 2 ).
將 ξ 和 η 看成獨立變數。 兩邊關於 ξ 作偏微分, 得 12h′(ξ) = 12h′(ξ+η2 )。 再關於法無 η 作偏微分, 得 14h′′(ξ+η2 ) = 0。 因 ξ+η2 可以是 g 的值域中的任意數, 故得 h′′(ξ) = 0, 即 h(ξ) = c0 + c1+ ξ, 其中 c0 和 c1 是常數。 但這就 (2)。
以上討論的平均化函數 f (x) 的定義域均為一開區間 (u, v)。 若 limx→u+f (x)存在, 我們 可以把 u 加到 f (x) 的定義域裡去。 同理若 limx→v−f (x) 存在, 我們也可以把 v 加到 f (x) 的定義域裡去。 下表列出幾個平均化函數:
f (x) ff′′(x)(x) 定義域 xt, t > 0 t−1x [0, ∞) xt, t < 0 t−1x (0, ∞)
ex 1 (−∞, ∞)
ln x −1x (0, ∞)
cos x cot x [0, π]
sin x − tan x [−π2,π2] tan x 2 tan x (−π2,π2)
設 f (x) 為 f (x) 的反函數。 若 f (x) 為單調, F (x) 亦為單調。 若 ff′′′(x)(x) 為連續, 則 F′′(x)
F′(x) = − f′′(F (x))
[f′(F (x))]2 = f′′(F (x)) f′(x)
−1 f′(F (x)) 亦為連續。 因此, 一個平均化函數的反函數亦為平均化函數。
四 . 函 數平均數間的不等式
算術平均數的平均化函數為 f (x) = x。 此時 ff′′′(x)(x) = 0。 幾何平均數的平均化函數為 g(x) = ln x, (x > 0)。 此時 gg′′′(x)(x) = −x1。 我們知道算術平均數大於幾何平均數, 同時也得到 0 ≥ −x1。 其實這現象是普遍的, 即
(1) f′′(x)
f′(x) ≥ g′′(x) g′(x);
(2) 若x1, x2, . . . , xn ∈ (u, v), 則 f−1
1
n
X
nk=1
f (xk)
≥ g−1
1 n
X
nk=1
g(xk)
.
(3) 若 x1, x2, . . . , xn ∈ (u, v), w1, w2, . . . , wn 為正實數, w1+ w2+ · · · + wn= 1, 則 f−1
X
nk=1
wkf (xk)
≥ g−1
X
nk=1
wkg(xk)
. 註: (3) 中左右二算式叫加權平均數。
證: (1) ⇒ (2). 因 f′(x) 6= 0 連續, 故 f′(x) 在 (u, v) 上符號不變。 以下就 f′(x) > 0 的情形立。 令 ξ = g(x), h(ξ) = f (g−1(ξ)), ξk = g(xk)。 選擇 ¯x ∈ (u, v) 使 g(¯x) =
1
n[g(x1) + g(x2) + · · · + g(xn)]。 令 ¯ξ = g(¯x)。 ¯ξ = n1(ξ1+ ξ2+ · · · + ξn)。 現在計算 h(ξ) 的導函數:
h′(ξ) = f′(g1(ξ))
g′(g−1(ξ)) = f′(x) g′(x), h′′(x) = 1
g′(x) d dx
f′(x) g′(x)
= g′(x)f′′(x) − f′(x)g′′(x)
g′(x)3 = f′(x) g′(x)
f′′(x)f′(x) −g′′(x) g′(x)
.
注意 g′(x) 在 (u, v) 中的符號也不變。 若g′(x) > 0, h′(ξ) 為增函數。 此時 h′′(ξ) > 0。 當 xk < ¯x 時, ξk < ¯ξ, 由微分學的均值定理可得
h(ξk) − h(¯ξ)
ξk− ¯ξ ≤ h′( ¯ξ), f (xk) − f(¯x) ≥ h′( ¯ξ)[g(xk) − g(¯x)], 即
f (¯x) ≤ f(xk) − h′( ¯ξ)[g(xk) − g(¯x)].
仿此當 xk > ¯x 時亦有此式。 當 xk = ¯x 時, 此不等式為等式。 將此式關於法無k求算術平均數, 乃得 f (¯x) ≤ n1
P
f (xk), 即 g−1h
1n
X
g(xk)i
= g−1g(¯x) = ¯x ≤ f−1h
1 nX
f (xk)i
.若 g′(x) < 0, h′(ξ) 為減函數, 我們將上述的討論作適當的修改, 仍可以得到相同的結論。
(2) ⇒ (3). 先設 wk均為有理數。 經通分後可令 wk = mk/m。 m1+m2+· · ·+mn= m (3) 式的兩邊分別是 m1 個 x1, m2 個 x2,. . . , mn 個 xn 在平均化函數 f 和 g 下的函數平均 數, 所以從 (2) 知 (3) 成立。 利用任意實數都可以用一系列的實數來逼近的原理, 我們可以把 這結果推展至 wk 為實數的情形。
(3) ⇒ (1). 我們就 f′(x) > 0 的情形立論, f′(x) < 0 的情形仿此不贅。
取 x, y, z ∈ (u, v)。 令 ξ = g(x), η = g(y), ζ = g(z)。 我們假定 ξ < η < ζ, 則
η−ξ
ζ−ξ,ζ−ηζ−ξ 均為正, 且其和為 1。 從 (2) 得 f−1
η − ξ
ζ − ξf (z) + ζ − η
ζ − ξf (x)
≥ g−1
η − ξ
ζ − ξζ +ζ − η
ζ − ξξ
= g−1(η).
定義函數 h 如下: h(ξ) = f (g−1(ξ)), 則上式可以寫作 η − ξ
ζ − ξh(ζ) + ζ − η
ζ − ξh(ξ) ≥ h(η).
於是有
h(ζ) − h(η) ≥ ζ − η
ζ − ξh(ζ) − ζ − η
ζ − ξh(ξ) ≥ h(η).
故 h(ζ) − h(η)
ζ − η ≥ h(ζ) − h(ξ) ζ − ξ . 令 η → ζ, 則得
h′(ζ) ≥ h(ζ) − h(ξ) ζ − ξ . 仿此, h(η)−h(ξ)η−ξ ≤ h(ζ)−h(ξ)ζ−ξ 。 令 η → ζ, 則得
h′(ξ) ≤ h(ζ) − h(ξ) ζ − ξ . 所以 h′(ζ) ≥ h′(ξ), 即 h′(ξ) 是 ξ 的增函數, 所以 h′′(ξ) ≥ 0。
以下計算 h′′(ξ)。 從 h(ξ) 的定義知
h′(ξ) = f′(g−1(ξ))(g−1)′(ξ) = f′(x) g′(x). 遂有
0 ≤ h′′(ξ) = g′(x)f′′(x) − f′(x)g′′(x) g′(x)2
dx
dξ =
h
f′′(x)f′(x) − g′′(x) g′(x)
i
f′(x) g′(x)2. 由假定, f′(x) > 0。 故得f′′(x)
≥ g′′(x) .
五 . 算幾不等式
算幾不等式 (算術平均數大於或等於幾何不均數) 是函數平均數不等式的一個例子。 算術 平均數的平均化函數為 f (x) = x, 幾何平均數的平均化函數為 g(x) = ln x。 二者定義域的交 界為所有正實數的集合。 因為
f′′(x)
f′(x) = 0 < −1
x = g′′(x) g′(x),
所以有算幾不等式。 由於這不等式的重要性, 以下我們另給它一個簡短的證明:
定理5: 設 x1, x2, . . . , xn 為 n 個正數, a = x1+ x2+ · · · + xn
n , g = √n
x1x2· · · xn
分別為它們的算術平均數和幾何平均數, 則 a ≥ g。 其中等號當且僅當所有 xk 都等於法無 a 時成立。
證: 令 f (x) = ln x。 f′(a) = 1a, f′′(x) = −x12. 由 Taylor 定理可得對每個 xk 均有在 a 和 xk 間的一數 ξk, 使
ln xk = ln a + 1
a(xk− a) − 1
ξk2(xk− a)2. 因此
ln g = 1 n
X
ln xk = ln a − 1na(
X
xk− a) − 1 nX
1ξ2k(xk− a)2
= 1 n
X
ln xk = ln a − 1 nX
1ξk2(xk− a)2
≤ ln a.
遂有 a ≥ g。 因 ξ1k2 > 0, 所以等號成立的充要條件是每個 xk− a 都等於0。