平均論

(1)

平均論

李春億

一 . 平均數的基本特性

設 n ≥ 2, 某實數集 D 中的 n 個數 x¹, x2, . . . , xn 的平均數有下列數種:

1. 算術平均數 ^x¹^+x²^+···+x_n ⁿ。 D 為所有實數的集合。

2. 幾何平均數 √ⁿx1x2· · · xⁿ。 D 為所有正實數的集合。

3. 調和平均數 1 ⁿ x1+_x2¹+···+xn¹

。 D 可以選為正實數的集合。

4. 方均根

^q

^x²¹^+x²²^+···+x_n ²ⁿ。 D 可以選為正實數的集合。

5. 反調和平均數 ^x_x²¹^+x²²^+···+x²ⁿ

1+x2+···+xⁿ。 D 可以選為正實數的集合。

此外尚有兩個正數的希羅平均數 ^a+^√^ab+b

3 。這希羅平均數似乎沒有推廣到 n 個數的理想辦法。

現在數學只是定義出如上幾個特定的平均數, 並討論其個別特性及彼此間的關係, 而缺乏完整的理論。本文將試著定義出較完整的平均數的理論, 以創立一個平均論 (Average The- ory)。

若 x1, x2, · · · , xⁿ 均為實數的集合 D 中的數, a = m(x1, x2, · · · , xⁿ) 是類似上述各種平均數的一項函數。我們稱得 m 為平均法 (averaging method), a 為平均數 (average) 或平均值 (average value), n 為項次, D 為平均數的定義域。我們至少對平均法作以下的要求:

1、確定性: 對任意正整數 n ≥ 2, m 均可視為一個 n 個變數的函數。換言之, a 可由 x1, x2, . . . , xn 完全決定。

2、封閉性: a ∈ D.

3、居中性: min(x₁, x₂, . . . , xn) ≤ a ≤ max(x1, x₂, . . . , xn)。

4、對稱性: 若i₁, i₂, . . . , in 為 1, 2, . . . , n 的一個排列, 則

m(xi1, xi2, . . . , xin) = m(x₁, x₂, . . . , xn).

5、次方遞迴性: 若 a₁ = m(x_1,1, x_1,2, . . . , x_1,n^k), a₂ = m(x_2,1, x_2,2, . . . , x_2,n^k),. . . , an =

(2)

m(xn,1, xn,2, . . . , x_n,n^k), 則

m(a1, a2, . . . , an) = m(x1,1, . . . , x_1,n^k, x2,1, . . . , x_2,n^k, . . . , xn,1, . . . , xn,n^k).

對稱性基本上就是交換律的延伸。次方遞迴性類似結合律。以上定義的種種平均數都有確定性、對稱性、定義域的選擇也使它們有封閉性。但反調和平均數沒有居中性和性。我們願意把它排除在要討論的平均論之外。

二 . 運算平均數

設 D 為實數的集合, p(x, y) 為 x ∈ D, y ∈ D 的函數。若 p(x, y) ∈ D, 且對 x, y, z ∈ D 滿足

交換律: p(x, y) = p(y, x),

結合律: p(p(x, y), z) = p(x, p(y, z)),

則我們稱 p 為一個運算。我們可以用遞迴的方式定義多於兩個運算元的運算如下:

p(x1, x2, . . . , xn) = p(p(x1, x2, . . . , x_n−1), xn).

這樣定義的運算具有確定性、對稱性、封閉性和組合性。

設 p 為集合 D 上的一運算, x1, x2, . . . , xn ∈ D。若有一數 a 使 p(a, a, . . . , a

| {z }

n項

) = p(x1, x2, . . . , xn),

我們則暫時把 a 叫作由 p 所定義的 x₁, x2, . . . , xn 的運算平均數。

例如: 若 p(x, y) = x + y, 則由 p 所定義的運算平均數為算術平均數。

若 p(x, y) = xy, 則由 p 所定義的運算平均數為幾何平均數。

若 p(x, y) = _x¹ + ¹_y, 則由 p 所定義的運算平均數為調和平均數。

若 p(x, y) = x² + y², 則由 p 所定義的運算平均數為方均根。

若 p(x, y) = max(x, y), 則由p所定義的運算平均數為最大值。

若 p(x, y) = min(x, y), 則由p所定義的運算平均數為最小值。

但希羅平均數和反調和平均數似乎都不是運算平均數。

定理1: 運算平均數具次方遞迴性。

(3)

證明: 設 m 為由運算 p 所得的運算平均數, ai = m(xi,1, xi,2, . . . , x_i,n^k), i = 1, 2, . . . , n, a = m(a1, a2, . . . , an), 則 p(xi,1, xi,2, . . . , x_i,n^k) 等於 n^k 個 ai 經過運算 p 所運算出來的結果。由結合律, p(x_1,1, . . . , x1,n^k, x2,1, . . . , x2,n^k, . . . , xn,1, . . . , xn,n^k) 等於 a1, a2, . . . , an

諸數每個出現 n^k 次在 p 下計算的結果。但每組 a₁, a2, . . . , an在 p 下的運算相當於 n 個 a 在 p 下的運算, 所以 p(x1,1, . . . , x_1,n^k, x2,1, . . . , x_2,n^k, . . . , xn,1, . . . , xn,n^k) 等於 n · n^k = n^k+1 個 a 在 p 下運算的結果。這就是說

a = m(x1,1, . . . , x_1,n^k, x2,1, . . . , x_2,n^k, . . . , xn,1, . . . , x_n,n^k).

利用和定理 1 相似的證明, 我們也可以證明。

定理2: 設m為運算平均法,

a = m(x1, x2, . . . , xn), a₁= m(a, x₂, . . . , xn), a2= m(x1, a, . . . , xn),

...

an= m(x1, x2, . . . , a), a0= m(a1, a2, . . . , an).

則 a0 = a。

定理 2 是運算平均數的一個必要條件, 當它不成立時, 可以證明這種平均數不是運算平均數。另一方面, 雖然由定理 1 知運算平均數具有次方遞迴性, 但在別的性質上就不那麼理想了。

首先, 若 12 ∈ D, 而令 p(x, y) = 12, 則 p 是 D 上的一個運算, 但這時可以得到任意 D 中的數都是 D 中任意多個數在 p 下的運算平均數, 所以在這個 p 下沒有確定性。再者, 令 D 為正整數的集合, 若 p(x, y) = g.c.d(x, y), 則 p 是一個好的運算, 但 p(4, 6) = 2 < min(4, 6)。

所以這運算平均數沒有居中性。同理 l.c.m. 運算也沒有居中性。由於這些問題, 我們必須縮減運算的範圍, 以達到適當的平均數的理論。

三 . 函數平均數

在本節中我們把運算平均數特殊化, 選擇呈下形的運算:

p(x, y) = f (x) + f (y),

(4)

1. f : (u, v) → (u, v) 為二階可微的單調函數。

2. f^′′(x) f^′(x) 連續。

這時我們稱由運算 f (x) + f (y) 所定義的平均數為函數平均數 m(x1, x2, . . . , xn) = f⁻¹

^h

1

n

X

n

i=1

f (xi)

ⁱ

. 函數 f 叫作平均化函數 (averaging function)。

函數平均數顯然具有確定性、封閉性、居中性、對稱性。由定理 1 知它也具有次方遞迴性。

所以在研究平均數時, 它是很好的研究對象。本文以下以討論函數平均數為主。

設 f (x) 為平均化函數, 則 f^′(x) 6= 0。由不定積分知 ln |f^′(x)| 連續。但 f(x) 是單調函數, 所以 f^′(x) 不改變符號, 因而連續。再從條件 2 知 f^′′(x) 連續。

定理3: 設 f (x) 和 g(x) 均為區間 (u, v) 上的平均化函數, 則下列四條件同值:

(1) f^′′(x)

f^′(x) = g^′′(x) g^′(x);

(2) f (x) 和 g(x) 互相可以表為一次式. 即有常數 c0 和 c1 6= 0 使 f (x) = c0+ c1g(x).

(3) 若 x1, x2, . . . , xn∈ (u, v), 則 f⁻¹

1

n

X

n

i=1

f (xi)

= g⁻¹

1 n

X

n

i=1

g(xi)

. (4) 若 x, y ∈ (u, v), 則

f⁻¹

1

2[f (x) + f (y)]

= g⁻¹

1

2[g(x) + g(y)]

. 證明: (1) ⇒ (2). 從 (1) 得

h

f^′(x) g^′(x)

i

_′

= g^′(x)f^′′(x) − f^′(x)g^′′(x) g^′(x)² = 0.

所以有常數 c1 使 f^′(x) = c1g^′(x)。再積分便得 (2)。

(2) ⇒ (1). 從 (2), f^′(x) = c1g^′(x)。再微分得 f^′′(x) = c1g^′′(x)。相除即得 (1) 式。

(2) ⇒ (3). 令 f(x) = y。 g(x) = c¹1(y − c⁰); f⁻¹(y) = x = g⁻¹(_c¹

1(y − c⁰))。於是 f⁻¹(1

n

X

n

i=1

f (xi)) = f⁻¹(1 n

X

n

i=1

[c0+ c1g(xi)])

= f⁻¹(c0+ c1

1 n

X

n

i=1

g(xi)) = g⁻¹(1 n

X

n

i=1

g(xi))

(5)

(3) ⇒ (4). (4) 其實就是 (3) 中 n = 2 的特殊情形。

(4) ⇒ (2). 設 fg⁻¹= h, g(x) = ξ, g(y) = η。 (4) 式可以看成 h(ξ) + h(η)

2 = h(ξ + η 2 ).

將 ξ 和 η 看成獨立變數。兩邊關於 ξ 作偏微分, 得 ¹₂h^′(ξ) = ¹₂h^′(^ξ+η₂ )。再關於法無 η 作偏微分, 得 ¹₄h^′′(^ξ+η₂ ) = 0。因 ^ξ+η₂ 可以是 g 的值域中的任意數, 故得 h^′′(ξ) = 0, 即 h(ξ) = c₀ + c₁+ ξ, 其中 c₀ 和 c₁ 是常數。但這就 (2)。

以上討論的平均化函數 f (x) 的定義域均為一開區間 (u, v)。若 lim_x→u⁺f (x)存在, 我們可以把 u 加到 f (x) 的定義域裡去。同理若 lim_x→v⁻f (x) 存在, 我們也可以把 v 加到 f (x) 的定義域裡去。下表列出幾個平均化函數:

f (x) ^f_f^′′_(x)^(x) 定義域 x^t, t > 0 ^t−1_x [0, ∞) x^t, t < 0 ^t−1_x (0, ∞)

e^x 1 (−∞, ∞)

ln x −¹x (0, ∞)

cos x cot x [0, π]

sin x − tan x [−^π2,^π₂] tan x 2 tan x (−^π₂,^π₂)

設 f (x) 為 f (x) 的反函數。若 f (x) 為單調, F (x) 亦為單調。若 ^f_f^′′′(x)^(x) 為連續, 則 F^′′(x)

F^′(x) = − f^′′(F (x))

[f^′(F (x))]² = f^′′(F (x)) f^′(x)

−1 f^′(F (x)) 亦為連續。因此, 一個平均化函數的反函數亦為平均化函數。

四 . 函數平均數間的不等式

算術平均數的平均化函數為 f (x) = x。此時 ^f_f^′′_′_(x)^(x) = 0。幾何平均數的平均化函數為 g(x) = ln x, (x > 0)。此時 ^g_g^′′′(x)^(x) = −x¹。我們知道算術平均數大於幾何平均數, 同時也得到 0 ≥ −x¹。其實這現象是普遍的, 即

(6)

(1) f^′′(x)

f^′(x) ≥ g^′′(x) g^′(x);

(2) 若x1, x2, . . . , xn ∈ (u, v), 則 f⁻¹

1

n

X

n

k=1

f (xk)

≥ g⁻¹

1 n

X

n

k=1

g(xk)

.

(3) 若 x1, x2, . . . , xn ∈ (u, v), w¹, w2, . . . , wn 為正實數, w1+ w2+ · · · + wⁿ= 1, 則 f⁻¹

X

n

k=1

wkf (xk)

≥ g⁻¹

X

n

k=1

wkg(xk)

. 註: (3) 中左右二算式叫加權平均數。

證: (1) ⇒ (2). 因 f^′(x) 6= 0 連續, 故 f^′(x) 在 (u, v) 上符號不變。以下就 f^′(x) > 0 的情形立。令 ξ = g(x), h(ξ) = f (g⁻¹(ξ)), ξk = g(xk)。選擇 ¯x ∈ (u, v) 使 g(¯x) =

1

n[g(x1) + g(x2) + · · · + g(xⁿ)]。令 ¯ξ = g(¯x)。 ¯ξ = _n¹(ξ1+ ξ2+ · · · + ξⁿ)。現在計算 h(ξ) 的導函數:

h^′(ξ) = f^′(g¹(ξ))

g^′(g⁻¹(ξ)) = f^′(x) g^′(x), h^′′(x) = 1

g^′(x) d dx

f^′(x) g^′(x)

= g^′(x)f^′′(x) − f^′(x)g^′′(x)

g^′(x)³ = f^′(x) g^′(x)

f^′′(x)

f^′(x) −g^′′(x) g^′(x)

.

注意 g^′(x) 在 (u, v) 中的符號也不變。若g^′(x) > 0, h^′(ξ) 為增函數。此時 h^′′(ξ) > 0。當 xk < ¯x 時, ξk < ¯ξ, 由微分學的均值定理可得

h(ξk) − h(¯ξ)

ξk− ¯ξ ≤ h^′( ¯ξ), f (xk) − f(¯x) ≥ h^′( ¯ξ)[g(xk) − g(¯x)], 即

f (¯x) ≤ f(x^k) − h^′( ¯ξ)[g(xk) − g(¯x)].

仿此當 xk > ¯x 時亦有此式。當 xk = ¯x 時, 此不等式為等式。將此式關於法無k求算術平均數, 乃得 f (¯x) ≤ n¹

P

f (xk), 即 g⁻¹

^h

1

n

X

g(xk)

ⁱ

= g⁻¹g(¯x) = ¯x ≤ f⁻¹

^h

1 n

X

f (xk)

ⁱ

.

若 g^′(x) < 0, h^′(ξ) 為減函數, 我們將上述的討論作適當的修改, 仍可以得到相同的結論。

(7)

(2) ⇒ (3). 先設 w^k均為有理數。經通分後可令 wk = mk/m。 m1+m2+· · ·+mⁿ= m (3) 式的兩邊分別是 m1 個 x₁, m2 個 x₂,. . . , mn 個 xn 在平均化函數 f 和 g 下的函數平均數, 所以從 (2) 知 (3) 成立。利用任意實數都可以用一系列的實數來逼近的原理, 我們可以把這結果推展至 wk 為實數的情形。

(3) ⇒ (1). 我們就 f^′(x) > 0 的情形立論, f^′(x) < 0 的情形仿此不贅。

取 x, y, z ∈ (u, v)。令 ξ = g(x), η = g(y), ζ = g(z)。我們假定 ξ < η < ζ, 則

η−ξ

ζ−ξ,^ζ−η_ζ−ξ 均為正, 且其和為 1。從 (2) 得 f⁻¹

η − ξ

ζ − ξf (z) + ζ − η

ζ − ξf (x)

≥ g⁻¹

η − ξ

ζ − ξζ +ζ − η

ζ − ξξ

= g⁻¹(η).

定義函數 h 如下: h(ξ) = f (g⁻¹(ξ)), 則上式可以寫作 η − ξ

ζ − ξh(ζ) + ζ − η

ζ − ξh(ξ) ≥ h(η).

於是有

h(ζ) − h(η) ≥ ζ − η

ζ − ξh(ζ) − ζ − η

ζ − ξh(ξ) ≥ h(η).

故 h(ζ) − h(η)

ζ − η ≥ h(ζ) − h(ξ) ζ − ξ . 令 η → ζ, 則得

h^′(ζ) ≥ h(ζ) − h(ξ) ζ − ξ . 仿此, ^h^(η)−h(ξ)_η−ξ ≤ ^h^(ζ)−h(ξ)_ζ−ξ 。令 η → ζ, 則得

h^′(ξ) ≤ h(ζ) − h(ξ) ζ − ξ . 所以 h^′(ζ) ≥ h^′(ξ), 即 h^′(ξ) 是 ξ 的增函數, 所以 h^′′(ξ) ≥ 0。

以下計算 h^′′(ξ)。從 h(ξ) 的定義知

h^′(ξ) = f^′(g⁻¹(ξ))(g⁻¹)^′(ξ) = f^′(x) g^′(x). 遂有

0 ≤ h^′′(ξ) = g^′(x)f^′′(x) − f^′(x)g^′′(x) g^′(x)²

dx

dξ =

^h

f^′′(x)

f^′(x) − g^′′(x) g^′(x)

i

f^′(x) g^′(x)². 由假定, f^′(x) > 0。故得

f^′′(x)

≥ g^′′(x) .

(8)

五 . 算幾不等式

算幾不等式 (算術平均數大於或等於幾何不均數) 是函數平均數不等式的一個例子。算術平均數的平均化函數為 f (x) = x, 幾何平均數的平均化函數為 g(x) = ln x。二者定義域的交界為所有正實數的集合。因為

f^′′(x)

f^′(x) = 0 < −1

x = g^′′(x) g^′(x),

所以有算幾不等式。由於這不等式的重要性, 以下我們另給它一個簡短的證明:

定理5: 設 x1, x2, . . . , xn 為 n 個正數, a = x1+ x2+ · · · + xⁿ

n , g = √ⁿ

x1x2· · · xⁿ

分別為它們的算術平均數和幾何平均數, 則 a ≥ g。其中等號當且僅當所有 x^k 都等於法無 a 時成立。

證: 令 f (x) = ln x。 f^′(a) = ¹_a, f^′′(x) = −x¹². 由 Taylor 定理可得對每個 xk 均有在 a 和 xk 間的一數 ξk, 使

ln xk = ln a + 1

a(xk− a) − 1

ξ_k²(xk− a)². 因此

ln g = 1 n

X

ln xk = ln a − 1

na(

^X

xk− a) − 1 n

X

1

ξ²_k(xk− a)²

= 1 n

X

ln xk = ln a − 1 n

X

1

ξ_k²(xk− a)²

≤ ln a.

遂有 a ≥ g。因 _ξ¹_k² > 0, 所以等號成立的充要條件是每個 xk− a 都等於0。

參考資料

1.

數學史概論

_,

著者

: Howard Eves,

譯者

_:

歐陽絳

_.

曉園出版社

_. 2.

凸分析導論

_,

著者

_{: (}

荷蘭

_{) J. D.}

蒂爾

(van Tiel).

亞東書局

_.

—

本文作者任職於瑞昱半導體

平 均 論

平 均 論

李春億

一 . 平均數的基本特性

q

二 . 運算平均數

| {z }

三 . 函數平均數

h

X

i



X





X











h

i

X

X

X

X

四 . 函 數平均數間的不等式



X





X





X





X







P

h

X

i

h

X

i









h

i

五 . 算幾不等式

X

X

X

X

X

參考資料

1.

,

: Howard Eves,

:

.

. 2.

,

: (

) J. D.

(van Tiel).

.

—

—

平均論

平均論

^q

^h

ⁱ

四 . 函數平均數間的不等式

^h

ⁱ

^h

ⁱ

^h

^X

_,

_:

_.

_. 2.

_,

_{: (}

_{) J. D.}

_.