不等式

(1)

Muirhead 不等式

陳柏宇 · ^張福春

摘要: 本文首先探討蓋、雙重隨機矩陣及凸包之間的等價關係, 並介紹由這些概念所得到的 Muirhead 不等式, 及其在古典不等式和數學競賽不等式問題中的應用。

美國數學會 2010 年分類索引: 主要 26D。

關鍵詞: 凸包、 Muirhead 條件、 Muirhead 不等式、羅倫斯曲線、蓋、雙重隨機矩陣、相異代表系、伯克霍夫定理。

1. 前言

不等式是數學中重要的分支, 不論是在日常生活中或是在數學的領域裡, 我們常會希望能夠對我們有興趣的量探討其最大值或最小值, 或是對某些無法確切計算的數值給出一個最大或最小的界, 以便我們對其性質能做更深入的瞭解。

[5] 探討 n 變數對稱代數函數的等式及不等式, 以及其相關代數方法的應用, 其中特別探討了有關 n 維向量中特定排序及其中包含形如 xâ₁¹xâ₂²· · · xânⁿ 的對稱冪次式。 Muirhead 想要將這類型的對稱冪次式的值做排序, 因而發展了 Muirhead 不等式。原本需要反覆使用廣義算幾不等式才能得到結果, 使用 Muirhead 不等式能夠大量簡化所需的計算過程, 且能幫助我們更方便和有系統的處理相關的問題。對於數學競賽有關不等式的問題, Muirhead 不等式是一個有用的工具, 文中也提供相關的例題作說明。有關 Muirhead 不等式更進一步的介紹可參考 [1]、 [6] 和 [4]。

本文的安排如下: 第 2 節中, 由蓋、凸包及雙重隨機矩陣推導出 Muirhead 不等式, 並證明蓋具有遞移性與稠密性。除此之外, 也提出它在古典不等式中的重要應用。在第 3 節中, 利用 Muirhead 不等式的特殊形式衍生的兩個小技巧, 將齊次性的概念帶入不等式中, 拓展其能應用的範圍。

41

(2)

2. Muirhead 不等式

以下先看一個用廣義算幾不等式推導的問題:

例1: 設 x, y, z 為非負實數, 試證

x²y³+ x²z³+ y²x³ + y²z³+ z²x³+ z²y³ ≤ xy⁴+ xz⁴+ yx⁴+ yz⁴+ zx⁴ + zy⁴ (1) 當我們考慮兩個齊次性多項式間的關係時, 我們經常使用算幾不等式幫助我們處理問題。若此處我們希望以相同的手法, 則我們需要證明式 (1) 不等式左邊的各項可以表達為右邊各項的加權幾何平均數。經過一些試驗後, 我們觀察到對任意非負實數 a, b 皆有 a²b³ = (ab⁴)²³(a⁴b)¹³, 則利用廣義算幾不等式可推導

a²b³ = (ab⁴)²³(a⁴b)¹³ ≤ 2

3ab⁴ +1 3a⁴b 接著我們以此式證明例 1。

證明: 利用上述觀察到的關係式, 可知

x²y³+ x³y² ≤ xy⁴+ x⁴y

接著利用相同的方式處理 x²z³, x³z² 與 y²z³, y³z², 可得兩條類似的不等式 x²z³+ x³z² ≤ xz⁴+ x⁴z 與 y²z³+ y³z² ≤ yz⁴+ y⁴z, 最後將三式相加, 即可得證。設 f (x1, x2, x3, . . . , xn) 為變數 x1, x2, . . . , xn 的函數, f (x1, x2, x3, . . . , xn) 的 n 項循環和定義如下:

X

cyc

f (x1, x2, x3, . . . , xn) = f (x1, x2, x3, . . . , xn) + f (x2, x3, . . . , xn, x1)

+ f (x3, . . . , xn, x1, x2) + · · · + f(xⁿ, x1, x2, . . . , xn−1) 例 1 中考慮的是變數兩兩相乘的情況, 為了觀察更廣義的結果, 我們嘗試想將類似式 (1) 的不等式推廣到更多變數相乘的情形。可是當我們考慮到三變數相乘的情況, 例如考慮 P

cycx²y² ≥ P

cycx²yz 時, 情形就變得不這麼簡單了。

我們嘗試從幾何的角度出發。觀察圖 1, 從中可發現 (2, 3) = ²₃(1, 4) +¹₃(4, 1), 這與我們之前觀察到的式子 a²b³ = (ab⁴)²³(a⁴b)¹³ ≤ ²₃(ab⁴) + ¹₃(a⁴b) 十分類似, 可知我們或許可利用幾何的方法描述此種次方的分解。因此若我們希望能將不等式 (1) 推廣到更多變數的情形, 我們可嘗試在多變數的情況下建構出類似於圖 1 的圖形。

為了推廣到多變數的情形, 我們使用分析的名稱描述圖 1, 即 (2, 3) 落在 (1, 4) 及其排序 (4, 1) 的凸包中, 其中凸包的定義可參照定義 1。

(3)

b

b b

(4, 1) (2, 3) =²₃(1, 4) +¹₃(4, 1) (1, 4)

1 :

2

圖_1: 二維空間中, 共線三點的比例關係

定義 1: 在一個實數向量空間 V 中, 對於給定集合 X, 所有包含 X 的凸集合的交集 S 被稱為 X 的凸包 (convex hull)。

S := \

X⊆K⊆V

K, K 是凸集合

例如在二維平面中, 任意非共線三點所形成的凸包, 即為連接此三點所成的三角形, 任意 n 點所形成的凸包, 則為能包含此 n 點的最小凸 k 多邊形 (k ≤ n)。

因此, 考慮類似於圖 1 的形狀及凸包的定義, 給定任意 n-維向量 α = (α1, α2, . . . , αn) 及 β = (β1, β2, . . . , βn), 我們考慮 α 落在由

βτ (1), βτ (2), . . . , βτ (n) | τ ∈ Sn 所組成的凸包 H(β) 中, 其中 Sⁿ 代表集合 {1, 2, . . . , n} 中元素的所有 n! 種排列所成的集合, τ(i), i = 1, 2, . . ., n 表示集合 Sⁿ 之中元素的第 i 個分量。例如在 n = 3 的情況下,

S³ = {(1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1)}

即為集合 {1, 2, 3} 的所有可能排序, 考慮其中元素 (2, 3, 1), 其 τ(1)=2, τ(2)=3, τ(3)=1。

圖 2 為三維空間中, 凸包的示意圖。有了幾何圖形的引導及幫助, 我們能將例 1 的不等式推廣至多變數的情況。

為了底下書寫的方便, 此處引進一些新的符號。

定義2: 給定 n 維向量 a = (a1, a2, . . . , an), 定義 a[j], 1 ≤ j ≤ n 為此 n 維向量中對各分量由大至小做排序後的第 j 項, 亦即 a_[1] ≥ a^[2] ≥ · · · ≥ a^[n], 並定義 a↓ = (a[1], a[2], . . . , a[n])。

定理 3: (Muirhead Inequality) 給定 α = (α1, α2, . . . , αn), β = (β1, β2, . . . , βn) ∈ Rⁿ, 且 α ∈ H(β), 對所有正數 x¹, x2, . . ., xn 有

X

σ∈Sn

x^α_σ(1)¹ x^α_σ(2)² · · · x^ασ(n)ⁿ ≤ X

σ∈Sn

x^β_σ(1)¹ x^β_σ(2)² · · · x^βσ(n)ⁿ

(4)

b

O

b

b b bb

b b b b

y= (β1, β2, β3) α∈ H(β)

x2

x1

x3

圖2: 三維空間中, 凸包的關係圖等號成立若且唯若 α↓ = β↓ 或 x1 = x2 = · · · = xⁿ。

證明: 因為有 α ∈ H(β), 其等價於 (α1, α2, . . . , αn) = X

τ ∈Sn

pτ(β_{τ (1)}, β_{τ (2)}, . . . , β_{τ (n)}) 且 pτ ≥ 0,X

τ ∈Sn

pτ = 1

現在, 若我們利用上述等式表示 x^α_σ(j)^j , 則我們可得 x^α_σ(1)¹ x^α_σ(2)² · · · x^α_σ(n)ⁿ = Y

τ ∈Sn

x^β_σ(1)^τ⁽¹⁾x^β_σ(2)^τ(2)· · · x^β_σ(n)^τ(n)pτ

(2) 接著, 利用廣義算幾不等式有

X

σ∈Sn

x^α_σ(1)¹ x^α_σ(2)² · · · x^ασ(n)ⁿ ≤ X

σ∈Sn

X

τ ∈Sn

pτx^β_σ(1)^τ⁽¹⁾x^β_σ(2)^τ⁽²⁾· · · x^βσ(n)^τ⁽ⁿ⁾ (根據 (2) 及算幾不等式)

= X

τ ∈Sn

pτ

X

σ∈Sn

x^β_σ(1)^τ(1)x^β_σ(2)^τ(2)· · · x^βσ(n)^τ(n)

= X

τ ∈Sn

pτ

X

σ^′∈Sn

x^β_σ¹^′₍₁₎x^β_σ²^′₍₂₎· · · x^βσⁿ^′(n)

= X

σ^′∈Sn

x^β_σ¹^′₍₁₎x^β_σ²^′₍₂₎· · · x^βσⁿ^′(n)

= X

σ∈Sn

x^β_σ(1)¹ x^β_σ(2)² · · · x^βσ(n)ⁿ (3)

因為重排的重排依然為重排, 所以式 (3) 成立。舉例來說, 當 n = 2 時 p1

x^β₁¹x^β₂² + x^β₂¹x^β₁²

+ (1 − p¹)

x^β₁²x^β₂¹ + x^β₂²x^β₁¹

= x^β₁¹x^β₂²(p1+ (1 − p¹)) + x^β₂¹x^β₁²(p1+ (1 − p¹))

(5)

= x^β₁¹x^β₂² + x^β₂¹x^β₁²

故得證。

註: 一般我們稱 α ∈ H(β) 為 Muirhead 條件 (Muirhead’s condition)。

然而, 在我們使用 Muirhead 不等式時, 有一個條件需要先滿足, 即我們要先確定條件 α ∈ H(β) 是否成立, 而檢查此條件有一個很有效的方法, 即考慮蓋的觀念。

定義 4 (蓋 (majorization)): 給定兩組向量 α = (α1, α2, . . . , αn), β = (β1, β2, . . . , βn) ∈ Rⁿ, 若滿足條件

(i) α[1]+ α[2]+ · · · + α^[j] ≤ β^[1]+ β[2] + · · · + β^[j], 1 ≤ j < n (ii) α[1]+ α[2]+ · · · + α^[n] = β[1] + β[2]+ · · · + β^[n]

則我們稱 α 被 β 蓋住, 記做 α ≺ β 或 β ≻ α。

為了更瞭解關於”蓋”的定義, 以下我們舉一個簡單的例子:

(1, 1, 1, 1) ≺ (2, 1, 1, 0) ≺ (3, 1, 0, 0) ≺ (4, 0, 0, 0) (4) 關係式 (4) 可經由簡單的計算得到。因為 α ≺ β 的關係只與 α 與 β 排序後的向量有關, 故 (4) 也可寫成

(1, 1, 1, 1) ≺ (0, 1, 1, 2) ≺ (0, 1, 3, 0) ≺ (0, 4, 0, 0) 定理 5 (蓋的遞移性): 設 α, β, γ ∈ Rⁿ, 若 α ≺ β, 且 β ≺ γ, 則 α ≺ γ。

證明: 因為

(i) α_[1]+ α_[2]+ · · · + α[j]≤ β[1]+ β_[2]+ · · · + β[j] ≤ γ[1]+ γ_[2]+ · · · + γ[j], 1 ≤ j < n (ii) α[1]+ α[2]+ · · · + α^[n] = β[1] + β[2]+ · · · + β^[n] = γ[1]+ γ[2]+ · · · + γ^[n]

故得證。

有了蓋的基本觀念後, 接著說明兩向量 α, β ∈ Rⁿ, α ∈ H(β) 與 α ≺ β 間的關係, 以瞭解 Muirhead 不等式使用的時機。

定理 6: 設向量 α, β ∈ Rⁿ, 且 α ∈ H(β), 則 α ≺ β。

(6)

證明: 對於 α ∈ H(β), 我們可表達為

(α1, α2, . . . , αn) = X

τ ∈Sn

pτ β_{τ (1)}, β_{τ (2)}, . . . , β_{τ (n)}

若只考慮第 j 個分量, 則有以下等式 αj = X

τ ∈Sn

pτβτ (j)=

n

X

k=1

n X

τ :τ (j)=k

pτ

o βk =

n

X

k=1

djkβk (5)

式 (5) 中, 為了簡化式子, 我們設定

djk = X

τ :τ (j)=k

pτ

可發現 d_jk≥ 0, 且因為對 djk 的下標 j 或 k 求和皆相當於 Sn 中所有 p_τ 的總和, 故有

n

X

j=1

djk= 1,

n

X

k=1

djk= 1 (6)

對一個非負實係數的矩陣 D = {d^jk} 若能滿足 (6), 則我們稱此矩陣為雙重隨機矩陣 (doubly stochastic matrix)。因此, 若我們將 α, β 視為行向量, 則由 (5) 有

α ∈ H(β) ⇒ α = Dβ 因此, 接下來我們只需證明 α = Dβ ⇒ α ≺ β。

因為 α ∈ H(β) 及 α ≺ β 皆不受 α, β 向量內排序的影響, 因此不失一般性我們可假設 α₁ ≥ α2 ≥ · · · ≥ αn 且 β₁ ≥ β2 ≥ · · · ≥ βn。接著, 我們將 (5) 對 j 做加總, 可得

k

X

j=1

αj =

k

X

j=1 n

X

t=1

djtβt =

n

X

t=1 k

X

j=1

djt

! βt =

n

X

t=1

ctβt 其中 c_t=

k

X

j=1

djt (7)

因為 c_t 為 D 中第 t 行的前 k 個元素的加總, 且 D 為雙重隨機矩陣, 故我們有 0 ≤ c^t ≤ 1, 1 ≤ t ≤ n 且

n

X

j=1

cj = k 最後, 根據蓋的定義, 觀察以下等式

∆k =

k

X

j=1

αj −

k

X

j=1

βj =

n

X

j=1

cjβj−

k

X

j=1

βj+ βk k −

n

X

j=1

cj

!

=

k

X

j=1

(βk− β^j) (1 − c^j) +

n

X

j=k+1

cj(βj − β^k)

(7)

因為當 1 ≤ j ≤ k 時, βj ≥ β^k, 而當 k < j ≤ n 時, β^j ≤ β^k, 所以 ∆k ≤ 0, 1 ≤ k < n, 且由 (7) 可知 ∆_n = 0, 滿足蓋的定義, 故 α ≺ β 得證。蓋的起源來自於兩個向量間, 其分量總和固定之下, 比較哪一個向量較為分散, 或是較為平均的現象? 這樣子的議題, 在各個領域中被研究著。在 20 世紀初, 經濟學家開始對衡量收入或財富的不等式感興趣, 為了要去衡量這件事情, 我們希望能夠說明在收入或財富的分佈上, 何謂一個收入 (財富) 的分佈較另一個平均。 [3] 所提出的羅倫斯曲線 (Lorenz Curve) 為最早針對此議題所發展出的理論, 其他還有許多不同解釋的角度, 最著名的便是蓋的觀念了。

一個有趣的例子是假設觀察甲與乙兩個國家的人民收入狀況, 設定 α1 為甲國前 10% 收入者的收入占甲國全國總收入的比例, α2 則為接下來 10% 收入者的收入占甲國全國總收入的比例, 依此類推, α10 為甲國最後 10% 收入者的收入占甲國全國總收入的比例。接著以 β1, β2, . . ., β10 對乙國做相同的定義。則 α ≺ β 在經濟學上可被視為乙國的人民收入分佈比甲國來得不平均。

很直覺的, 我們可聯想到是否 α ≺ β, 亦可推得 α = Dβ, 使得乙國人民的收入分佈能藉由雙重隨機矩陣的轉換慢慢的與甲國類似。這樣縮小貧富差距的觀念也不禁使人聯想到羅賓漢-劫富濟貧的故事。這也是在許多文章中, 將蓋理論翻譯為優化理論的重要原因。

定理 7: 設向量 α, β ∈ Rⁿ, 且 α ≺ β, 則存在一雙重隨機矩陣 D 使得 α = Dβ。

證明: 首先, 我們考慮最簡單的情況, 當 n = 2 時, 令 α = (α1, α2) = (ρ + σ, ρ − σ) 且 β = (β₁, β2) = (ρ + τ, ρ − τ)。不失一般性, 我們可假設 α¹ ≥ α², β1 ≥ β², 且 α1+ α2 = β1+ β2。因此, 若 σ ≤ τ, 則相當於說明 α ≺ β, 因此, 剩下的工作只需找出一雙重隨機矩陣 D 使得 α = Dβ, 利用分點公式求 D 可得

Dβ =

"

τ +σ 2τ

τ −σ 2τ τ −σ

2τ τ +σ

2τ

# "

ρ + τ ρ − τ

#

=

"

ρ + σ ρ − σ

#

= α (8)

故此定理在 n = 2 的情況成立。

雖然上述的情況很簡單, 但我們可以利用上述的結果, 推廣到 n 維的情況, 並且說明 n × n 的雙重隨機矩陣 D 為由有限個每次改變兩個分量的雙重隨機矩陣相乘而得。

考慮向量 α, β 有 α ≺ β, 且 α¹ ≥ α² ≥ · · · ≥ αⁿ, β1 ≥ β² ≥ · · · ≥ βⁿ, 已知其中有 N 個分量不相等。考慮 N ≥ 2, 則根據蓋的定義可知, 必定存在整數 1 ≤ j < k ≤ n, 使得

βj > αj, βk < αk, 且 βs= αs, ∀j < s < k (9) 考慮類似 n = 2 的情況, 取 ρ = (βj + βk) /2, τ = βj− ρ, 故 β^j = ρ + τ , βk= ρ − τ, 接著取 σ = max{|α^k− ρ|, |α^j− ρ|}, 如圖 3。然後令 T 為能將 β = (β¹, β2, . . . , βn) 送到

(8)

|

• • | |

|

•

• | |

|

β_j^′ = ρ + σ β_k^′ = ρ − σ

αk αj α2 α1

αn

βj= ρ + τ

βk= ρ − τ β2 β1

βn

β^′ 值 β 值

α 值

| {z }

ρ

ρ− σ ρ ρ+ σ σ

圖_3: 將 β 做一次轉換為 β^′ β^′ = (β₁^′, β₂^′, . . . , β_n^′) 的 n × n 的雙重隨機矩陣, 其中 β^′ 滿足

β_k^′ = βk+ τ − σ, β_j^′ = βj − τ + σ, β_t^′ = βt, ∀t 6= j, t 6= k

T 的表示式可將 n = 2 時所推導出的雙重隨機矩陣的係數分別對應放置於矩陣 T 的 (j, j), (j, k), (k, j), (k, k) 四點上, 接著將對角線上的空位補滿 1, 其他空位則補滿 0, 如 (10)。值得注意的是, 轉換後的 β^′ 滿足 β^′ ≺ β。







1 . ..

1

τ +σ

2τ · · · ^{τ −σ}_2τ ... . .. ...

τ −σ

2τ · · · ^{τ +σ}_2τ

1 . ..

1







(10)

我們利用簡單的觀察及計算可以檢查 α ≺ β^′, 因此, 藉由矩陣 T 將 β 轉換成 β^′, 可將 α 與 β^′ 間不相等的分量縮小為至多 N − 1 個。最後, 利用歸納法, 假設存在雙重隨機矩陣 D^′ 使得 α = D^′β^′, 因為 β^′ = T β, 故有 α = D^′(T β) = (D^′T )β, 且知兩個雙重隨機矩陣的乘積依然

為雙重隨機矩陣, 故得證。

觀察圖 4, 其中 (1) 與 (2) 已經在定理 6 說明, 而 (3) 跟 (4) 的證明則可由定理 7 得到,

(9)

α ∈ H(β) α = Dβ α ≺ β

α = T

1

T

2

· · · T

n

β

(1) (2)

(4) (3) 伯克霍夫定理

(5)

圖_4: 蓋與凸包的關係

若我們能證明最後一件事情, 即 α = Dβ ⇒ α ∈ H(β), 則我們可瞭解 α ≺ β 與 α ∈ H(β) 兩件事為等價的。要證明 (5), 我們需要證明伯克霍夫定理, 這個定理又被稱為是雙重隨機矩陣的基本定理。此處我們採用一個較有趣的證明方式, 更詳細的介紹可參考 [6]。

定理 8 (結婚問題): 設 S₁, S₂, . . ., S_n⊂ S, 則對一集合 R = {x1, x₂, . . . , x_n} ⊂ S, 若其中元素皆不相同且 xk ∈ S^k, k = 1, 2, . . ., n, 則稱 R 為一相異代表系 (system of distinct representatives) (又稱 SDR)。證明 SDR 存在若且唯若滿足以下條件

|A| ≤

[

j∈A

Sj

其中 A ⊂ {1, 2, . . . , n} (11)

此處符號 |C| 代表集合 C 中的元素個數。

這個理論由 [2] 提出, 而 [7] 的文章中將其介紹為結婚問題 (marriage theorem), 也是現在大家所熟知的名字。原本的題目為考慮一群男孩及一群女孩, 若每個女孩只能嫁給自己認識的男孩, 則順利將所有女孩嫁出的充分必要條件是: 任意 k 個女孩至少認識 k 個男孩。

證明: 明顯可知, 若 SDR 存在, 則條件必定滿足。考慮另一個方向的證明, 利用 Weyl 的題意, 即第 j 個女孩認識的男孩為集合 S_j, 所以給定女孩的集合 A, 則集合S

j∈ASj 中的男孩必定有某個 A 中的女孩認識。考慮下列兩種狀況:

情況一: 假設 (11) 中的不等號為嚴格小於(即無等號成立的情況發生), 且已知 |A| < n。將第 n 個女孩配對給她所認識的任一個男孩 b。因為條件 (11) 依然在集合 A ⊂ {1, 2, . . . , n − 1}

及每個 S_j, 1 ≤ j ≤ n − 1 皆被替換成 S^j\{b} 的情況下成立, 因此其餘的女孩可依相同的方法配對給其餘的男孩們。

情況二: 假設對某個集合 A₀ 考慮條件 (11), 發現等號成立, 且已知 |A⁰| < n。我們令 B = [

j∈A0

Sj 且 S_j^′ = Sj\B 對所有 j ∈ A^c0

(10)

則根據歸納法, A₀ 中的女孩必可配對給 B 中的男孩, 因此我們只需證明在 A^c₀ 中的女孩也可適當的配對給 B^c 中的男孩。我們取任意的 A ⊂ A^c0 可發現

[

j∈A0∪A

Sj

≥ |A⁰∪ A| = |A| + |A⁰|

又我們有等式

[

j∈A0∪A

Sj

=

( [

j∈A0

Sj

) [

( [

j∈A

S_j^′ )

= |A⁰| +

[

j∈A

S_j^′ 因此, 可發現對所有 A ⊂ A^c0 皆可導出

[

j∈A

S_j^′

≥ |A|

即對任意 A^c₀ 中取 k 個女孩的集合皆至少認識 k 個 B^c 中的男孩。根據數學歸納法, 可知 A^c₀

中的女孩必可適當地配對給 B^c 中的男孩。

定理 9 (伯克霍夫定理 (Birkhoff Theorem)): 給定排列 σ ∈ Sⁿ, 對應 σ 的置換矩陣為一 n × n 的矩陣 P^σ = (Pσ(j, k)) , 1 ≤ j, k ≤ n 其中元素為

Pσ(j, k) =







1 若 σ(j) = k 0 其他

證明若 D 為一 n × n 的雙重隨機矩陣, 則存在非負權重 {wσ : σ ∈ Sn} 使得 X

σ∈Sn

wσ = 1 且 X

σ∈Sn

wσPσ = D 即所有的雙重隨機矩陣皆可表示為置換矩陣的加權平均。

證明: 此處, 我們利用結婚問題 8 的結果推導伯克霍夫定理。給定雙重隨機矩陣 D, 考慮 1 ≤ j ≤ n, 我們令 S^j 為能使得 d_jk> 0 的所有 k 所成的集合, 則對任意集合 A ⊂ {1, 2, . . . , n}

必有

|A| =X

j∈A

X

k∈Sj

djk ≤ X

k∈∪j∈ASj

X

1≤j≤n

djk =

[

j∈A

Sj

根據定理 8, 必存在 {S¹, S2, . . . , Sn} 的 SDR, 所以我們可以定義排列 σ 藉由設定 σ(j) 為 Sj 中的代表值 (representative), 以 Weyl 的例子說明則相當於將向量中的第 j 個分量取為第 j 個女生所配對到的男生。接下來, 令 Pσ 為 σ 的置換矩陣並令 α = min d_jσ(j) > 0。可

(11)

知, 若 α = 1 則 D 為一置換矩陣, 故得證。但若 α < 1, 則考慮定義一個新的矩陣 D^′ = (1 − α)⁻¹(D − αP^σ), 可改寫為

D = αPσ+ (1 − α)D^′

觀察可知 D^′ 依然為一雙重隨機矩陣, 且矩陣中含有比 D 中更多的 0。最後, 可利用數學歸納法完成此定理的證明。

至此, 我們完整證明了 α ∈ H(β) 與 α ≺ β 之間的關係。下面, 我們將介紹幾個例子, 來示範 Muirhead 不等式的功用。但此之前, 我們先介紹蓋的稠密性, 以及為了使得計算的式子更簡化, 我們定義一個新的符號使我們能更輕易地運用 Muirhead 不等式。

定理 10 (蓋的稠密性): 設向量 α, β ∈ Rⁿ, α ≺ β 且 α^↓ 6= β^↓, 則必定存在 γ ∈ Rⁿ, 使得 α ≺ γ ≺ β。

證明: 不失一般性考慮向量 α, β 有 α ≺ β, 且 α¹ ≥ α² ≥ · · · ≥ αⁿ, β1 ≥ β² ≥ · · · ≥ βⁿ, 假設其中有 N 個分量不相等。考慮 N ≥ 2, 則根據蓋的定義可知, 必定存在整數 1 ≤ j <

k ≤ n, 使得

βj > αj, βk< αk, βs = αs, ∀j < s < k (12) 考慮類似定理 7 的證明方式, 取 ρ = (β_j + βk) /2, τ = βj− ρ, 故 β^j = ρ + τ , βk = ρ − τ, 接著取 σ = max{|αk− ρ|, |α^j − ρ|}, 如圖 3。接著取 γ 滿足

γk= βk+ c(τ − σ), γ^j = βj − c(τ − σ), γ^t= βt, t 6= j, t 6= k 其中 c ∈ (0, 1), 故 γ 6= α, γ 6= β。接著我們驗證此 γ 是否符合我們的需求

t

X

i=1

αi ≤

t

X

i=1

γi =

t

X

i=1

βi, 1 ≤ t < j

t

X

i=1

αi ≤

t

X

i=1

γi ≤

t

X

i=1

βi, j ≤ t < k

t

X

i=1

αi ≤

t

X

i=1

γi =

t

X

i=1

βi, k ≤ t < n

n

X

i=1

αi =

n

X

i=1

γi =

n

X

i=1

βi

故有 α ≺ γ ≺ β, 得證。

(12)

例 2 (內斯比特不等式 (Nesbitt’s Inequality)): 對於正實數 a, b, c 有 a

b + c+ b

c + a + c

a + b ≥ 3 2 證明: 通分並交叉相乘可得

2X

cyc

a(a + b)(a + c) ≥ 3(a + b)(b + c)(c + a) ⇐⇒ X

sym

a³ ≥X

sym

a²b

因為 (3, 0, 0) ≻ (2, 1, 0), 故可利用 Muirhead 不等式得證。為了使得計算的式子更為簡化, 底下我們定義一個新的符號使我們能更輕易的運用 Muir- head 不等式。

定義 11: 令 [a] = [a1, a2, . . . , an] = 1 n!

X

σ∈Sn

xâ_σ(1)¹ xâ_σ(2)² · · · xâσ(n)ⁿ 。

例 3 (算幾不等式): 對任意正數 y₁, y₂, . . ., y_n, 試證 y1+ y2+ · · · + yⁿ

n ≥ √ⁿy1y2· · · yⁿ 解法 1: 取 x_i = √ⁿy_i, 將上述算幾不等式寫成

1 n

n

X

i=1

xⁿ_i ≥ x1x₂· · · xn

現在, 我們可利用定義 11 觀察到 1

n

X

i=1

xⁿ_i = [n, 0, . . . , 0] 且 x1x2· · · xⁿ= [1, 1, . . . , 1]

因為 (1, 1, . . . , 1) ≺ (n, 0, . . . , 0), 故根據 Muirhead 不等式有 X

σ∈Sn

x¹₁x¹₂· · · x¹n ≤ X

σ∈Sn

xⁿ₁x⁰₂· · · x⁰n ⇒ [1, 1, . . . , 1] ≤ [n, 0, . . . , 0]

故可完成算幾不等式的證明。

解法 2: 接著, 我們提供算幾不等式的另一個證明。

1 n

n

X

i=1

xⁿ_i − (x¹x2· · · xⁿ) = [n, 0, . . . , 0] − [1, 1, . . . , 1]

(13)

= ([n, 0, . . . , 0] − [n − 1, 1, 0 . . . , 0]) + ([n − 1, 1, 0, . . . , 0] − [n − 2, 1, 1, 0 . . . , 0]) + · · · + ([2, 1, . . . , 1, 0] − [1, 1, . . . , 1])

=1 n!

X

σ∈Sn

xⁿ⁻¹_σ(1)− xⁿ⁻¹σ(2)

(x_σ(1)− xσ(2)) + X

σ∈Sn

xⁿ⁻²_σ(1)− xⁿ⁻²σ(2)

(x_σ(1)− xσ(2))x_σ(3)

+ X

σ∈Sn

xⁿ⁻³_σ(1)− xⁿ⁻³σ(2)

(xσ(1)− x^σ(2))xσ(3)xσ(4)+ · · ·

+ X

σ∈Sn

x^n−(n−1)_σ(1) − x^n−(n−1)σ(2)

(xσ(1)− x^σ(2))xσ(3)· · · x^σ(n)

!

當 x1 = x2 = · · · = xⁿ 時, 等號成立。

註: 觀察例 3 的解法一可發現, 我們是利用 (1, 1, . . . , 1) ≺ (n, 0, . . . , 0) 此種蓋的關係完成證明。故我們可利用定理 10 中蓋的稠密性將算幾不等式寫得更加精鍊, 即對任意 n 維向量 (γk), k = 1, 2, . . ., 若滿足 (1, 1, . . . , 1) ≺ (γ¹) ≺ (γ²) ≺ · · · ≺ (γ^k) ≺ · · · ≺ (n, 0, . . . , 0), 則對任意正數 x1, x2, . . ., xn 有

x1x2· · · xⁿ = [1, 1, . . . , 1] ≤ [γ¹] ≤ [γ²] ≤ · · · ≤ [γ^k] ≤ · · · ≤ [n, 0, 0, . . . , 0] = 1 n

n

X

i=1

xⁿ_i 舉例而言:

(1, 1, . . . , 1) ≺ (n − 1, 1, 0, . . . , 0) ≺ (n, 0, 0, . . . , 0)

⇒ [1, 1, . . . , 1] ≤ [n − 1, 1, . . . , 0] ≤ [n, 0, 0, . . . , 0]

⇒ x1x₂· · · xn ≤ 1 n!

X

σ∈Sn

xⁿ⁻¹_σ(1)x_σ(2)≤ 1 n

n

X

i=1

xⁿ_i

3. 兩個有用的技巧

這一節中, 我們將介紹兩個使用 Muirhead 不等式時有用的技巧。

定理 12: 在運用 Muirhead 不等式時, 若有條件 x1x2· · · xⁿ= 1, 則對任意實數 r 有 [α1, α2, . . . , αn] = [α1− r, α²− r, . . . , αⁿ− r]

證明:

[α1− r, α²− r, . . . , αⁿ− r] = 1 n!

X

σ∈Sn

x^α_σ(1)¹^−rx^α_σ(2)²^−r· · · x^ασ(n)ⁿ^−r

(14)

= 1 n!

X

σ∈Sn

x^α_σ(1)¹ x^α_σ(2)² · · · x^ασ(n)ⁿ

x^r_σ(1)x^r_σ(2). . . x^r_σ(n) = 1 n!

X

σ∈Sn

x^α_σ(1)¹ x^α_σ(2)² · · · x^ασ(n)ⁿ

= [α₁, α₂, . . . , α_n]

觀察定理 12 可發現其相當於將式子改為齊次性不等式, 這樣的技巧能幫助我們更方便的處理不等式的問題。

例 4 (1995 IMO): 對任意實數 a, b, c ≥ 0 且 abc = 1, 試證 1

a³(b + c) + 1

b³(c + a) + 1

c³(a + b) ≥ 3 2 證明: 通分並整理後可得

2(a⁴b⁴+ b⁴c⁴+ c⁴a⁴) + 2(a⁴b³c + a⁴c³b + b⁴c³a + b⁴a³c + c⁴a³b + c⁴b³a) + 2(a³b³c² + b³c³a²+ c³a³b²)

≥ 3(a⁵b⁴c³+ a⁵c⁴b³+ b⁵c⁴a³+ b⁵a⁴c³+ c⁵a⁴b³ + c⁵b⁴a³) + 6a⁴b⁴c⁴ 此式可寫成

[4, 4, 0] + 2[4, 3, 1] + [3, 3, 2] ≥ 3[5, 4, 3] + [4, 4, 4]

此處我們發現 4 + 4 + 0 = 4 + 3 + 1 = 3 + 3 + 2 = 8, 但是 5 + 4 + 3 = 4 + 4 + 4 = 12。

運用定理 12, 我們可選擇 r = ⁴₃, 可知 [5, 4, 3] = ₁₁

3,⁸₃,⁵₃ 且 [4, 4, 4] = ⁸₃,⁸₃,⁸₃。觀察到 (4, 4, 0) ≻ ¹¹3,⁸₃,⁵₃, (4, 3, 1) ≻ ¹¹₃,⁸₃,⁵₃ 且 (3, 3, 2) ≻ ⁸₃,⁸₃,⁸₃。故接下來我們只需應用 Muirhead 不等式, 即有

[4, 4, 0] + 2[4, 3, 1] + [3, 3, 2] ≥ 11 3 ,8

3,5 3

+ 2 11 3 ,8

3,5 3

+ 8

3,8 3,8

3

= 3 11 3 ,8

3,5 3

+ 8

3,8 3,8

3

= 3[5, 4, 3] + [4, 4, 4] 例 5 (1998 Short list IMO): 設 a, b, c 為正實數且 abc = 1, 試證

a³

(1 + b)(1 + c) + b³

(1 + c)(1 + a)+ c³

(1 + a)(1 + b) ≥ 3 4 解: 通分並整理後可得

4(a⁴+ b⁴ + c⁴+ a³+ b³+ c³) ≥ 3(1 + a + b + c + ab + bc + ca + abc)

(15)

此式等價於

4[4, 0, 0] + 4[3, 0, 0] ≥ [0, 0, 0] + 3[1, 0, 0] + 3[1, 1, 0] + [1, 1, 1]

運用定理 12 及 Muirhead 不等式

[4, 0, 0] ≥ 4 3,4

3,4 3

= [0, 0, 0]

3[4, 0, 0] ≥ 3[2, 1, 1] = 3[1, 0, 0]

3[3, 0, 0] ≥ 3 4 3,4

3,1 3

= 3[1, 1, 0]

[3, 0, 0] ≥ [1, 1, 1]

將得到的四個結果相加, 即可得證所需之不等式。

定理 13: 在使用 Muirhead 不等式時, 若有條件 x1x2· · · xⁿ≥ 1, 則對任意實數 r ≥ 0 有 [α1, α2, . . . , αn] ≥ [α¹− r, α²− r, . . . , αⁿ− r]

證明:

[α1 − r, α²− r, . . . , αⁿ− r] = 1 n!

X

σ∈Sn

x^α_σ(1)¹^−rx^α_σ(2)²^−r· · · x^ασ(n)ⁿ^−r

= 1 n!

X

σ∈Sn

x^α_σ(1)¹ x^α_σ(2)² · · · x^α_σ(n)ⁿ x^r_σ(1)x^r_σ(2). . . x^r_σ(n)

≤ 1 n!

X

σ∈Sn

x^α_σ(1)¹ x^α_σ(2)² · · · x^ασ(n)ⁿ

= [α1, α2, . . . , αn] 例 6 (2005 IMO): 對任意實數 x, y, z ≥ 0 且 xyz ≥ 1, 試證

x⁵− x²

x⁵ + y²+ z² + y⁵− y²

y⁵+ z²+ x² + z⁵− z²

z⁵ + x²+ y² ≥ 0 證明: 通分並整理後可得

[9, 0, 0] + 4[7, 5, 0] + [5, 2, 2] + [5, 5, 5] ≥ [6, 0, 0] + [5, 5, 2] + 2[5, 4, 0] + 2[4, 2, 0] + [2, 2, 2]

欲證明此式, 我們觀察以下幾點 (i) [9, 0, 0] ≥ [7, 1, 1] ≥ [6, 0, 0]

(16)

(ii) [7, 5, 0] ≥ [5, 5, 2]

(iii) 2[7, 5, 0] ≥ 2[6, 5, 1] ≥ 2[5, 4, 0]

(iv) [7, 5, 0] + [5, 2, 2] ≥ 2[6,⁷2, 1] ≥ 2₁₁

2,⁷₂,³₂ ≥ 2[4, 2, 0]

(v) [5, 5, 5] ≥ [2, 2, 2]

其中 (i), (iii) 可由 Muirhead 不等式及定理 13 得到, (ii) 為 Muirhead 不等式所得, (iv) 為運用算幾不等式、 Muirhead 不等式及定理 13 得到, (v) 則由定理 13 得到。將觀察到的五個

不等式相加, 即可得到所求的不等式。

習題

7: (i) 設 a, b, c 為非負實數, 試證

8abc ≤ (a + b)(b + c)(c + a) (ii) 設 aj, 1 ≤ j ≤ n 為實數, 試證

2 X

1≤j<k≤n

ajak≤ (n − 1)

n

X

j=1

a²_j

(iii) 設 aj, 1 ≤ j ≤ n 為非負實數, 試證

(a1a2· · · aⁿ)^1/n ≤ 2 n(n − 1)

X

1≤j<k≤n

√ajak

8 (2004 Moldova): 證明對於所有 a, b, c > 0, 皆滿足 a³+ b³+ c³ ≥ a²√

bc + b²√

ca + c²√ ab 9: 設 x, y, z 為正實數且滿足 xyz = 1, 試證

x² + y²+ z² ≤ x³+ y³+ z³

10: 對正實數 xk, 1 ≤ k ≤ n, 定義函數 S^m(x) = x^m₁ + x^m₂ + · · · + x^mn, 試證 S_m²(x) ≤ S^m−1(x)Sm+1(x), m = 1, 2, . . .

11: 為正實數, 試證

ra² b +

rb² a ≥√

a +√ b

(17)

12: 設 a, b, c 為非負實數, 試證

a³+ b³+ c³+ abc ≥ 1

7(a + b + c)³ 13: 設 a, b, c 為非負實數, 試證

a + b + c ≤ a²+ b²

2c + b²+ c²

2a + c²+ a² 2b ≤ a³

bc + b³ ca + c³

ab 14: 設 a, b, c 為正實數, 試證

a

(a + b)(a + c) + b

(b + c)(b + a) + c

(c + a)(c + b) ≤ 9 4(a + b + c) 15 (2004 Croatia): 設 a, b, c 為正實數, 試證

a²

(a + b)(a + c) + b²

(b + a)(b + c) + c²

(c + a)(c + b) ≥ 3 4 16 (2003 Short list Iberoamerican): 設 a, b, c 為正實數, 試證

a³

b²− bc + c² + b³

c²− ca + a² + c³

a²− ab + b² ≥ a + b + c 17: 設 x, y, z 為非負實數且 xy + yz + zx = 1, 試證

1

x + y + 1

y + z + 1

z + x ≥ 5 2

18 (1961 IMO): 令 a, b, c 為三角形三邊長, 並令 S 為其面積。試證 4√

3S ≤ a²+ b²+ c² 19 (1964 IMO): 設 a, b, c 為正實數, 試證

a³+ b³+ c³+ 3abc ≥ ab(a + b) + bc(b + c) + ca(c + a) 20 (2002 Canada): 設 a, b, c 為正實數, 試證

a³ bc + b³

ca+ c³

ab ≥ a + b + c 等號何時成立?

21 (2008 Serbia): 設 a, b, c 為滿足 a + b + c = 1 的正實數, 證明 a² + b²+ c²+ 3abc ≥ 4

9

(18)

參考資料

1. 楊重駿、楊照崑 (1982), 蓋理論 (Theory of majorization) 及其在不等式上的應用。數學傳播, 第 6 卷, 第 4 期, 13-19。

2. Hall, P. (1935). On Representatives of Subsets. J. London Math. Soc. 10, 26-30.

3. Lorenz, M.O. (1905). Methods of measuring the concentration of wealth. Publications

of the American Statistical Association 9

(70): 209-219.

4. Manfrino, R.B., Ortega, J.A.G., and Delgado, R.V. (2009). Inequalities: A Mathemat-

ical Olympiad Approach. Boston: Birkh¨auser.

5. Muirhead, R.F. (1903). Some methods applicable to identities and inequalities of sym- metric algebraic functions of n letters. Proc. Edinburgh Math. Soc 21, 144-157.

6. Steele, J.M. (2004). The Cauchy-Schwarz Master Class: An Introduction to the Art of

Mathematical Inequalities. Cambridge: Cambridge University Press.

7. Weyl, H. (1949). Almost periodic invariant vector sets in a metric vector space. Amer.

J. Math. 71, 178-205.

—本文作者陳柏宇任教新北市樹林區三多國中, 張福春任教國立中山大學應用數學系—

Sinica-NCTS/TPE Mini-course in Geometry

日期 : 2014 年 07 月 09 日 (星期三) 、 2014 年 07 月 11 日 (星期五) 地點 : 台北市大安區羅斯福路四段 1 號天文數學館 722研討室詳見中研院數學所網頁 http://www.math.sinica.edu.tw

不等式

Muirhead 不 等式

陳柏宇 · 張福春

1. 前言

2. Muirhead 不等式

α ∈ H(β) α = Dβ α ≺ β

α = T

T

· · · T

β

(1) (2)

(4) (3) 伯克 霍夫定理

(5)

3. 兩個有用的技巧

習題

參考資料

of the American Statistical Association 9

ical Olympiad Approach. Boston: Birkh¨auser.

Mathematical Inequalities. Cambridge: Cambridge University Press.

J. Math. 71, 178-205.

Sinica-NCTS/TPE Mini-course in Geometry

Muirhead 不等式

陳柏宇 · ^張福春

(4) (3) 伯克霍夫定理