Muirhead 不 等式
陳柏宇 · 張福春
摘要: 本文首先探討蓋、 雙重隨機矩陣及凸包之間的等價關係, 並介紹由這些概念所 得到的 Muirhead 不等式, 及其在古典不等式和數學競賽不等式問題中的應用。
美國數學會 2010 年分類索引: 主要 26D。
關鍵詞: 凸包、 Muirhead 條件、 Muirhead 不等式、 羅倫斯曲線、 蓋、 雙重隨機矩 陣、 相異代表系、 伯克霍夫定理。
1. 前言
不等式是數學中重要的分支, 不論是在日常生活中或是在數學的領域裡, 我們常會希望能 夠對我們有興趣的量探討其最大值或最小值, 或是對某些無法確切計算的數值給出一個最大或 最小的界, 以便我們對其性質能做更深入的瞭解。
[5] 探討 n 變數對稱代數函數的等式及不等式, 以及其相關代數方法的應用, 其中特別探 討了有關 n 維向量中特定排序及其中包含形如 xa11xa22· · · xann 的對稱冪次式。 Muirhead 想要 將這類型的對稱冪次式的值做排序, 因而發展了 Muirhead 不等式。 原本需要反覆使用廣義算 幾不等式才能得到結果, 使用 Muirhead 不等式 能夠大量簡化所需的計算過程, 且能幫助我們 更方便和有系統的處理相關的問題。 對於數學競賽有關不等式的問題, Muirhead 不等式是一 個有用的工具, 文中也提供相關的例題作說明。 有關 Muirhead 不等式更進一步的介紹可參考 [1]、 [6] 和 [4]。
本文的安排如下: 第 2 節中, 由蓋、 凸包及雙重隨機矩陣推導出 Muirhead 不等式, 並證 明蓋具有遞移性與稠密性。 除此之外, 也提出它在古典不等式中的重要應用。 在第 3 節中, 利用 Muirhead 不等式的特殊形式衍生的兩個小技巧, 將齊次性的概念帶入不等式中, 拓展其能應 用的範圍。
41
2. Muirhead 不等式
以下先看一個用廣義算幾不等式推導的問題:
例1: 設 x, y, z 為非負實數, 試證
x2y3+ x2z3+ y2x3 + y2z3+ z2x3+ z2y3 ≤ xy4+ xz4+ yx4+ yz4+ zx4 + zy4 (1) 當我們考慮兩個齊次性多項式間的關係時, 我們經常使用算幾不等式幫助我們處理問題。 若此 處我們希望以相同的手法, 則我們需要證明式 (1) 不等式左邊的各項可以表達為右邊各項的加 權幾何平均數。 經過一些試驗後, 我們觀察到對任意非負實數 a, b 皆有 a2b3 = (ab4)23(a4b)13, 則利用廣義算幾不等式可推導
a2b3 = (ab4)23(a4b)13 ≤ 2
3ab4 +1 3a4b 接著我們以此式證明例 1。
證明: 利用上述觀察到的關係式, 可知
x2y3+ x3y2 ≤ xy4+ x4y
接著利用相同的方式處理 x2z3, x3z2 與 y2z3, y3z2, 可得兩條類似的不等式 x2z3+ x3z2 ≤ xz4+ x4z 與 y2z3+ y3z2 ≤ yz4+ y4z, 最後將三式相加, 即可得證。 設 f (x1, x2, x3, . . . , xn) 為變數 x1, x2, . . . , xn 的函數, f (x1, x2, x3, . . . , xn) 的 n 項 循環和定義如下:
X
cyc
f (x1, x2, x3, . . . , xn) = f (x1, x2, x3, . . . , xn) + f (x2, x3, . . . , xn, x1)
+ f (x3, . . . , xn, x1, x2) + · · · + f(xn, x1, x2, . . . , xn−1) 例 1 中考慮的是變數兩兩相乘的情況, 為了觀察更廣義的結果, 我們嘗試想將類似式 (1) 的不等 式推廣到更多變數相乘的情形。 可是當我們考慮到三變數相乘的情況, 例如考慮 P
cycx2y2 ≥ P
cycx2yz 時, 情形就變得不這麼簡單了。
我們嘗試從幾何的角度出發。 觀察圖 1, 從中可發現 (2, 3) = 23(1, 4) +13(4, 1), 這與我們 之前觀察到的式子 a2b3 = (ab4)23(a4b)13 ≤ 23(ab4) + 13(a4b) 十分類似, 可知我們或許可利用 幾何的方法描述此種次方的分解。 因此若我們希望能將不等式 (1) 推廣到更多變數的情形, 我 們可嘗試在多變數的情況下建構出類似於圖 1 的圖形。
為了推廣到多變數的情形, 我們使用分析的名稱描述圖 1, 即 (2, 3) 落在 (1, 4) 及其排序 (4, 1) 的凸包中, 其中凸包的定義可參照定義 1。
b
b b
(4, 1) (2, 3) =23(1, 4) +13(4, 1) (1, 4)
1 :
2
圖1: 二維空間中, 共線三點的比例關係
定義 1: 在一個實數向量空間 V 中, 對於給定集合 X, 所有包含 X 的凸集合的交集 S 被稱 為 X 的 凸包 (convex hull)。
S := \
X⊆K⊆V
K, K 是凸集合
例如在二維平面中, 任意非共線三點所形成的凸包, 即為連接此三點所成的三角形, 任意 n 點所形成的凸包, 則為能包含此 n 點的最小凸 k 多邊形 (k ≤ n)。
因此, 考慮類似於圖 1 的形狀及凸包的定義, 給定任意 n-維向量 α = (α1, α2, . . . , αn) 及 β = (β1, β2, . . . , βn), 我們考慮 α 落在由
βτ (1), βτ (2), . . . , βτ (n) | τ ∈ Sn 所組成的 凸包 H(β) 中, 其中 Sn 代表集合 {1, 2, . . . , n} 中元素的所有 n! 種排列所成的集合, τ(i), i = 1, 2, . . ., n 表示集合 Sn 之中元素的第 i 個分量。 例如在 n = 3 的情況下,
S3 = {(1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1)}
即為集合 {1, 2, 3} 的所有可能排序, 考慮其中元素 (2, 3, 1), 其 τ(1)=2, τ(2)=3, τ(3)=1。
圖 2 為三維空間中, 凸包的示意圖。 有了幾何圖形的引導及幫助, 我們能將例 1 的不等式 推廣至多變數的情況。
為了底下書寫的方便, 此處引進一些新的符號。
定義2: 給定 n 維向量 a = (a1, a2, . . . , an), 定義 a[j], 1 ≤ j ≤ n 為此 n 維向量中對各分量 由大至小做排序後的第 j 項, 亦即 a[1] ≥ a[2] ≥ · · · ≥ a[n], 並定義 a↓ = (a[1], a[2], . . . , a[n])。
定理 3: (Muirhead Inequality) 給定 α = (α1, α2, . . . , αn), β = (β1, β2, . . . , βn) ∈ Rn, 且 α ∈ H(β), 對所有正數 x1, x2, . . ., xn 有
X
σ∈Sn
xασ(1)1 xασ(2)2 · · · xασ(n)n ≤ X
σ∈Sn
xβσ(1)1 xβσ(2)2 · · · xβσ(n)n
b
O
b
b b bb
b b b b
y= (β1, β2, β3) α∈ H(β)
x2
x1
x3
圖2: 三維空間中, 凸包的關係圖 等號成立若且唯若 α↓ = β↓ 或 x1 = x2 = · · · = xn。
證明: 因為有 α ∈ H(β), 其等價於 (α1, α2, . . . , αn) = X
τ ∈Sn
pτ(βτ (1), βτ (2), . . . , βτ (n)) 且 pτ ≥ 0,X
τ ∈Sn
pτ = 1
現在, 若我們利用上述等式表示 xασ(j)j , 則我們可得 xασ(1)1 xασ(2)2 · · · xασ(n)n = Y
τ ∈Sn
xβσ(1)τ(1)xβσ(2)τ(2)· · · xβσ(n)τ(n)pτ
(2) 接著, 利用廣義算幾不等式有
X
σ∈Sn
xασ(1)1 xασ(2)2 · · · xασ(n)n ≤ X
σ∈Sn
X
τ ∈Sn
pτxβσ(1)τ(1)xβσ(2)τ(2)· · · xβσ(n)τ(n) (根據 (2) 及算幾不等式)
= X
τ ∈Sn
pτ
X
σ∈Sn
xβσ(1)τ(1)xβσ(2)τ(2)· · · xβσ(n)τ(n)
= X
τ ∈Sn
pτ
X
σ′∈Sn
xβσ1′(1)xβσ2′(2)· · · xβσn′(n)
= X
σ′∈Sn
xβσ1′(1)xβσ2′(2)· · · xβσn′(n)
= X
σ∈Sn
xβσ(1)1 xβσ(2)2 · · · xβσ(n)n (3)
因為重排的重排依然為重排, 所以式 (3) 成立。 舉例來說, 當 n = 2 時 p1
xβ11xβ22 + xβ21xβ12
+ (1 − p1)
xβ12xβ21 + xβ22xβ11
= xβ11xβ22(p1+ (1 − p1)) + xβ21xβ12(p1+ (1 − p1))
= xβ11xβ22 + xβ21xβ12
故得證。
註: 一般我們稱 α ∈ H(β) 為 Muirhead 條件 (Muirhead’s condition)。
然而, 在我們使用 Muirhead 不等式時, 有一個條件需要先滿足, 即我們要先確定條件 α ∈ H(β) 是否成立, 而檢查此條件有一個很有效的方法, 即考慮蓋的觀念。
定義 4 (蓋 (majorization)): 給定兩組向量 α = (α1, α2, . . . , αn), β = (β1, β2, . . . , βn) ∈ Rn, 若滿足條件
(i) α[1]+ α[2]+ · · · + α[j] ≤ β[1]+ β[2] + · · · + β[j], 1 ≤ j < n (ii) α[1]+ α[2]+ · · · + α[n] = β[1] + β[2]+ · · · + β[n]
則我們稱 α 被 β 蓋住, 記做 α ≺ β 或 β ≻ α。
為了更瞭解關於”蓋”的定義, 以下我們舉一個簡單的例子:
(1, 1, 1, 1) ≺ (2, 1, 1, 0) ≺ (3, 1, 0, 0) ≺ (4, 0, 0, 0) (4) 關係式 (4) 可經由簡單的計算得到。 因為 α ≺ β 的關係只與 α 與 β 排序後的向量有關, 故 (4) 也可寫成
(1, 1, 1, 1) ≺ (0, 1, 1, 2) ≺ (0, 1, 3, 0) ≺ (0, 4, 0, 0) 定理 5 (蓋的遞移性): 設 α, β, γ ∈ Rn, 若 α ≺ β, 且 β ≺ γ, 則 α ≺ γ。
證明: 因為
(i) α[1]+ α[2]+ · · · + α[j]≤ β[1]+ β[2]+ · · · + β[j] ≤ γ[1]+ γ[2]+ · · · + γ[j], 1 ≤ j < n (ii) α[1]+ α[2]+ · · · + α[n] = β[1] + β[2]+ · · · + β[n] = γ[1]+ γ[2]+ · · · + γ[n]
故得證。
有了蓋的基本觀念後, 接著說明兩向量 α, β ∈ Rn, α ∈ H(β) 與 α ≺ β 間的關係, 以 瞭解 Muirhead 不等式使用的時機。
定理 6: 設向量 α, β ∈ Rn, 且 α ∈ H(β), 則 α ≺ β。
證明: 對於 α ∈ H(β), 我們可表達為
(α1, α2, . . . , αn) = X
τ ∈Sn
pτ βτ (1), βτ (2), . . . , βτ (n)
若只考慮第 j 個分量, 則有以下等式 αj = X
τ ∈Sn
pτβτ (j)=
n
X
k=1
n X
τ :τ (j)=k
pτ
o βk =
n
X
k=1
djkβk (5)
式 (5) 中, 為了簡化式子, 我們設定
djk = X
τ :τ (j)=k
pτ
可發現 djk≥ 0, 且因為對 djk 的下標 j 或 k 求和皆相當於 Sn 中所有 pτ 的總和, 故有
n
X
j=1
djk= 1,
n
X
k=1
djk= 1 (6)
對一個非負實係數的矩陣 D = {djk} 若能滿足 (6), 則我們稱此矩陣為雙重隨機矩陣 (doubly stochastic matrix)。 因此, 若我們將 α, β 視為行向量, 則由 (5) 有
α ∈ H(β) ⇒ α = Dβ 因此, 接下來我們只需證明 α = Dβ ⇒ α ≺ β。
因為 α ∈ H(β) 及 α ≺ β 皆不受 α, β 向量內排序的影響, 因此不失一般性我們可假設 α1 ≥ α2 ≥ · · · ≥ αn 且 β1 ≥ β2 ≥ · · · ≥ βn。 接著, 我們將 (5) 對 j 做加總, 可得
k
X
j=1
αj =
k
X
j=1 n
X
t=1
djtβt =
n
X
t=1 k
X
j=1
djt
! βt =
n
X
t=1
ctβt 其中 ct=
k
X
j=1
djt (7)
因為 ct 為 D 中第 t 行的前 k 個元素的加總, 且 D 為雙重隨機矩陣, 故我們有 0 ≤ ct ≤ 1, 1 ≤ t ≤ n 且
n
X
j=1
cj = k 最後, 根據蓋的定義, 觀察以下等式
∆k =
k
X
j=1
αj −
k
X
j=1
βj =
n
X
j=1
cjβj−
k
X
j=1
βj+ βk k −
n
X
j=1
cj
!
=
k
X
j=1
(βk− βj) (1 − cj) +
n
X
j=k+1
cj(βj − βk)
因為當 1 ≤ j ≤ k 時, βj ≥ βk, 而當 k < j ≤ n 時, βj ≤ βk, 所以 ∆k ≤ 0, 1 ≤ k < n, 且由 (7) 可知 ∆n = 0, 滿足蓋的定義, 故 α ≺ β 得證。 蓋的起源來自於兩個向量間, 其分量總和固定之下, 比較哪一個向量較為分散, 或是較為 平均的現象? 這樣子的議題, 在各個領域中被研究著。 在 20 世紀初, 經濟學家開始對衡量收入 或財富的不等式感興趣, 為了要去衡量這件事情, 我們希望能夠說明在收入或財富的分佈上, 何 謂一個收入 (財富) 的分佈較另一個平均。 [3] 所提出的羅倫斯曲線 (Lorenz Curve) 為最早針 對此議題所發展出的理論, 其他還有許多不同解釋的角度, 最著名的便是蓋的觀念了。
一個有趣的例子是假設觀察甲與乙兩個國家的人民收入狀況, 設定 α1 為甲國前 10% 收 入者的收入占甲國全國總收入的比例, α2 則為接下來 10% 收入者的收入占甲國全國總收入的 比例, 依此類推, α10 為甲國最後 10% 收入者的收入占甲國全國總收入的比例。 接著以 β1, β2, . . ., β10 對乙國做相同的定義。 則 α ≺ β 在經濟學上可被視為乙國的人民收入分佈比甲國來 得不平均。
很直覺的, 我們可聯想到是否 α ≺ β, 亦可推得 α = Dβ, 使得乙國人民的收入分佈能藉由雙 重隨機矩陣的轉換慢慢的與甲國類似。 這樣縮小貧富差距的觀念也不禁使人聯想到羅賓漢-劫富 濟貧的故事。 這也是在許多文章中, 將蓋理論翻譯為優化理論的重要原因。
定理 7: 設向量 α, β ∈ Rn, 且 α ≺ β, 則存在一雙重隨機矩陣 D 使得 α = Dβ。
證明: 首先, 我們考慮最簡單的情況, 當 n = 2 時, 令 α = (α1, α2) = (ρ + σ, ρ − σ) 且 β = (β1, β2) = (ρ + τ, ρ − τ)。 不失一般性, 我們可假設 α1 ≥ α2, β1 ≥ β2, 且 α1+ α2 = β1+ β2。 因此, 若 σ ≤ τ, 則相當於說明 α ≺ β, 因此, 剩下的工作只需找出一雙 重隨機矩陣 D 使得 α = Dβ, 利用分點公式求 D 可得
Dβ =
"
τ +σ 2τ
τ −σ 2τ τ −σ
2τ τ +σ
2τ
# "
ρ + τ ρ − τ
#
=
"
ρ + σ ρ − σ
#
= α (8)
故此定理在 n = 2 的情況成立。
雖然上述的情況很簡單, 但我們可以利用上述的結果, 推廣到 n 維的情況, 並且說明 n × n 的 雙重隨機矩陣 D 為由有限個每次改變兩個分量的雙重隨機矩陣相乘而得。
考慮向量 α, β 有 α ≺ β, 且 α1 ≥ α2 ≥ · · · ≥ αn, β1 ≥ β2 ≥ · · · ≥ βn, 已知其中有 N 個 分量不相等。 考慮 N ≥ 2, 則根據蓋的定義可知, 必定存在整數 1 ≤ j < k ≤ n, 使得
βj > αj, βk < αk, 且 βs= αs, ∀j < s < k (9) 考慮類似 n = 2 的情況, 取 ρ = (βj + βk) /2, τ = βj− ρ, 故 βj = ρ + τ , βk= ρ − τ, 接著取 σ = max{|αk− ρ|, |αj− ρ|}, 如圖 3。 然後令 T 為能將 β = (β1, β2, . . . , βn) 送到
|
|
• • | |
|
•
• | |
|
βj′ = ρ + σ βk′ = ρ − σ
αk αj α2 α1
αn
βj= ρ + τ
βk= ρ − τ β2 β1
βn
β′ 值 β 值
α 值
| {z }
ρ
ρ− σ ρ ρ+ σ σ
圖3: 將 β 做一次轉換為 β′ β′ = (β1′, β2′, . . . , βn′) 的 n × n 的雙重隨機矩陣, 其中 β′ 滿足
βk′ = βk+ τ − σ, βj′ = βj − τ + σ, βt′ = βt, ∀t 6= j, t 6= k
T 的表示式可將 n = 2 時所推導出的雙重隨機矩陣的係數分別對應放置於矩陣 T 的 (j, j), (j, k), (k, j), (k, k) 四點上, 接著將對角線上的空位補滿 1, 其他空位則補滿 0, 如 (10)。 值 得注意的是, 轉換後的 β′ 滿足 β′ ≺ β。
1 . ..
1
τ +σ
2τ · · · τ −σ2τ ... . .. ...
τ −σ
2τ · · · τ +σ2τ
1 . ..
1
(10)
我們利用簡單的觀察及計算可以檢查 α ≺ β′, 因此, 藉由矩陣 T 將 β 轉換成 β′, 可將 α 與 β′ 間不相等的分量縮小為至多 N − 1 個。 最後, 利用歸納法, 假設存在雙重隨機矩陣 D′ 使得 α = D′β′, 因為 β′ = T β, 故有 α = D′(T β) = (D′T )β, 且知兩個雙重隨機矩陣的乘積依然
為雙重隨機矩陣, 故得證。
觀察圖 4, 其中 (1) 與 (2) 已經在定理 6 說明, 而 (3) 跟 (4) 的證明則可由定理 7 得到,
α ∈ H(β) α = Dβ α ≺ β
α = T
1T
2· · · T
nβ
(1) (2)
(4) (3) 伯克 霍夫定理
(5)
圖4: 蓋與凸包的關係
若我們能證明最後一件事情, 即 α = Dβ ⇒ α ∈ H(β), 則我們可瞭解 α ≺ β 與 α ∈ H(β) 兩件事為等價的。 要證明 (5), 我們需要證明伯克霍夫定理, 這個定理又被稱為是雙重隨機矩陣 的基本定理。 此處我們採用一個較有趣的證明方式, 更詳細的介紹可參考 [6]。
定理 8 (結婚問題): 設 S1, S2, . . ., Sn⊂ S, 則對一集合 R = {x1, x2, . . . , xn} ⊂ S, 若其 中元素皆不相同且 xk ∈ Sk, k = 1, 2, . . ., n, 則稱 R 為一 相異代表系 (system of distinct representatives) (又稱 SDR)。 證明 SDR 存在若且唯若滿足以下條件
|A| ≤
[
j∈A
Sj
其中 A ⊂ {1, 2, . . . , n} (11)
此處符號 |C| 代表集合 C 中的元素個數。
這個理論由 [2] 提出, 而 [7] 的文章中將其介紹為結婚問題 (marriage theorem), 也是 現在大家所熟知的名字。 原本的題目為考慮一群男孩及一群女孩, 若每個女孩只能嫁給自己認 識的男孩, 則順利將所有女孩嫁出的充分必要條件是: 任意 k 個女孩至少認識 k 個男孩。
證明: 明顯可知, 若 SDR 存在, 則條件必定滿足。 考慮另一個方向的證明, 利用 Weyl 的題意, 即第 j 個女孩認識的男孩為集合 Sj, 所以給定女孩的集合 A, 則集合S
j∈ASj 中的男孩必定 有某個 A 中的女孩認識。 考慮下列兩種狀況:
情況一: 假設 (11) 中的不等號為嚴格小於(即無等號成立的情況發生), 且已知 |A| < n。 將第 n 個女孩配對給她所認識的任一個男孩 b。 因為條件 (11) 依然在集合 A ⊂ {1, 2, . . . , n − 1}
及每個 Sj, 1 ≤ j ≤ n − 1 皆被替換成 Sj\{b} 的情況下成立, 因此其餘的女孩可依相同的方 法配對給其餘的男孩們。
情況二: 假設對某個集合 A0 考慮條件 (11), 發現等號成立, 且已知 |A0| < n。 我們令 B = [
j∈A0
Sj 且 Sj′ = Sj\B 對所有 j ∈ Ac0
則根據歸納法, A0 中的女孩必可配對給 B 中的男孩, 因此我們只需證明在 Ac0 中的女孩也可 適當的配對給 Bc 中的男孩。 我們取任意的 A ⊂ Ac0 可發現
[
j∈A0∪A
Sj
≥ |A0∪ A| = |A| + |A0|
又我們有等式
[
j∈A0∪A
Sj
=
( [
j∈A0
Sj
) [
( [
j∈A
Sj′ )
= |A0| +
[
j∈A
Sj′ 因此, 可發現對所有 A ⊂ Ac0 皆可導出
[
j∈A
Sj′
≥ |A|
即對任意 Ac0 中取 k 個女孩的集合皆至少認識 k 個 Bc 中的男孩。 根據數學歸納法, 可知 Ac0
中的女孩必可適當地配對給 Bc 中的男孩。
定理 9 (伯克霍夫定理 (Birkhoff Theorem)): 給定排列 σ ∈ Sn, 對應 σ 的置換矩陣為一 n × n 的矩陣 Pσ = (Pσ(j, k)) , 1 ≤ j, k ≤ n 其中元素為
Pσ(j, k) =
1 若 σ(j) = k 0 其他
證明若 D 為一 n × n 的雙重隨機矩陣, 則存在非負權重 {wσ : σ ∈ Sn} 使得 X
σ∈Sn
wσ = 1 且 X
σ∈Sn
wσPσ = D 即所有的雙重隨機矩陣皆可表示為置換矩陣的加權平均。
證明: 此處, 我們利用結婚問題 8 的結果推導伯克霍夫定理。 給定雙重隨機矩陣 D, 考慮 1 ≤ j ≤ n, 我們令 Sj 為能使得 djk> 0 的所有 k 所成的集合, 則對任意集合 A ⊂ {1, 2, . . . , n}
必有
|A| =X
j∈A
X
k∈Sj
djk ≤ X
k∈∪j∈ASj
X
1≤j≤n
djk =
[
j∈A
Sj
根據定理 8, 必存在 {S1, S2, . . . , Sn} 的 SDR, 所以我們可以定義排列 σ 藉由設定 σ(j) 為 Sj 中的代表值 (representative), 以 Weyl 的例子說明則相當於將向量中的第 j 個分量取為 第 j 個女生所配對到的男生。 接下來, 令 Pσ 為 σ 的置換矩陣並令 α = min djσ(j) > 0。 可
知, 若 α = 1 則 D 為一置換矩陣, 故得證。 但若 α < 1, 則考慮定義一個新的矩陣 D′ = (1 − α)−1(D − αPσ), 可改寫為
D = αPσ+ (1 − α)D′
觀察可知 D′ 依然為一雙重隨機矩陣, 且矩陣中含有比 D 中更多的 0。 最後, 可利用數學歸納 法完成此定理的證明。
至此, 我們完整證明了 α ∈ H(β) 與 α ≺ β 之間的關係。 下面, 我們將介紹幾個例子, 來 示範 Muirhead 不等式的功用。 但此之前, 我們先介紹蓋的稠密性, 以及為了使得計算的式 子 更簡化, 我們定義一個新的符號使我們能更輕易地運用 Muirhead 不等式。
定理 10 (蓋的稠密性): 設向量 α, β ∈ Rn, α ≺ β 且 α↓ 6= β↓, 則必定存在 γ ∈ Rn, 使得 α ≺ γ ≺ β。
證明: 不失一般性考慮向量 α, β 有 α ≺ β, 且 α1 ≥ α2 ≥ · · · ≥ αn, β1 ≥ β2 ≥ · · · ≥ βn, 假設其中有 N 個分量不相等。 考慮 N ≥ 2, 則根據蓋的定義可知, 必定存在整數 1 ≤ j <
k ≤ n, 使得
βj > αj, βk< αk, βs = αs, ∀j < s < k (12) 考慮類似定理 7 的證明方式, 取 ρ = (βj + βk) /2, τ = βj− ρ, 故 βj = ρ + τ , βk = ρ − τ, 接著取 σ = max{|αk− ρ|, |αj − ρ|}, 如圖 3。 接著取 γ 滿足
γk= βk+ c(τ − σ), γj = βj − c(τ − σ), γt= βt, t 6= j, t 6= k 其中 c ∈ (0, 1), 故 γ 6= α, γ 6= β。 接著我們驗證此 γ 是否符合我們的需求
t
X
i=1
αi ≤
t
X
i=1
γi =
t
X
i=1
βi, 1 ≤ t < j
t
X
i=1
αi ≤
t
X
i=1
γi ≤
t
X
i=1
βi, j ≤ t < k
t
X
i=1
αi ≤
t
X
i=1
γi =
t
X
i=1
βi, k ≤ t < n
n
X
i=1
αi =
n
X
i=1
γi =
n
X
i=1
βi
故有 α ≺ γ ≺ β, 得證。
例 2 (內斯比特不等式 (Nesbitt’s Inequality)): 對於正實數 a, b, c 有 a
b + c+ b
c + a + c
a + b ≥ 3 2 證明: 通分並交叉相乘可得
2X
cyc
a(a + b)(a + c) ≥ 3(a + b)(b + c)(c + a) ⇐⇒ X
sym
a3 ≥X
sym
a2b
因為 (3, 0, 0) ≻ (2, 1, 0), 故可利用 Muirhead 不等式得證。 為了使得計算的式子更為簡化, 底下我們定義一個新的符號使我們能更輕易的運用 Muir- head 不等式。
定義 11: 令 [a] = [a1, a2, . . . , an] = 1 n!
X
σ∈Sn
xaσ(1)1 xaσ(2)2 · · · xaσ(n)n 。
例 3 (算幾不等式): 對任意正數 y1, y2, . . ., yn, 試證 y1+ y2+ · · · + yn
n ≥ √ny1y2· · · yn 解法 1: 取 xi = √nyi, 將上述算幾不等式寫成
1 n
n
X
i=1
xni ≥ x1x2· · · xn
現在, 我們可利用定義 11 觀察到 1
n
n
X
i=1
xni = [n, 0, . . . , 0] 且 x1x2· · · xn= [1, 1, . . . , 1]
因為 (1, 1, . . . , 1) ≺ (n, 0, . . . , 0), 故根據 Muirhead 不等式有 X
σ∈Sn
x11x12· · · x1n ≤ X
σ∈Sn
xn1x02· · · x0n ⇒ [1, 1, . . . , 1] ≤ [n, 0, . . . , 0]
故可完成算幾不等式的證明。
解法 2: 接著, 我們提供算幾不等式的另一個證明。
1 n
n
X
i=1
xni − (x1x2· · · xn) = [n, 0, . . . , 0] − [1, 1, . . . , 1]
= ([n, 0, . . . , 0] − [n − 1, 1, 0 . . . , 0]) + ([n − 1, 1, 0, . . . , 0] − [n − 2, 1, 1, 0 . . . , 0]) + · · · + ([2, 1, . . . , 1, 0] − [1, 1, . . . , 1])
=1 n!
X
σ∈Sn
xn−1σ(1)− xn−1σ(2)
(xσ(1)− xσ(2)) + X
σ∈Sn
xn−2σ(1)− xn−2σ(2)
(xσ(1)− xσ(2))xσ(3)
+ X
σ∈Sn
xn−3σ(1)− xn−3σ(2)
(xσ(1)− xσ(2))xσ(3)xσ(4)+ · · ·
+ X
σ∈Sn
xn−(n−1)σ(1) − xn−(n−1)σ(2)
(xσ(1)− xσ(2))xσ(3)· · · xσ(n)
!
當 x1 = x2 = · · · = xn 時, 等號成立。
註: 觀察例 3 的解法一可發現, 我們是利用 (1, 1, . . . , 1) ≺ (n, 0, . . . , 0) 此種蓋的關係完成證 明。 故我們可利用定理 10 中蓋的稠密性將算幾不等式寫得更加精鍊, 即對任意 n 維向量 (γk), k = 1, 2, . . ., 若滿足 (1, 1, . . . , 1) ≺ (γ1) ≺ (γ2) ≺ · · · ≺ (γk) ≺ · · · ≺ (n, 0, . . . , 0), 則 對任意正數 x1, x2, . . ., xn 有
x1x2· · · xn = [1, 1, . . . , 1] ≤ [γ1] ≤ [γ2] ≤ · · · ≤ [γk] ≤ · · · ≤ [n, 0, 0, . . . , 0] = 1 n
n
X
i=1
xni 舉例而言:
(1, 1, . . . , 1) ≺ (n − 1, 1, 0, . . . , 0) ≺ (n, 0, 0, . . . , 0)
⇒ [1, 1, . . . , 1] ≤ [n − 1, 1, . . . , 0] ≤ [n, 0, 0, . . . , 0]
⇒ x1x2· · · xn ≤ 1 n!
X
σ∈Sn
xn−1σ(1)xσ(2)≤ 1 n
n
X
i=1
xni
3. 兩個有用的技巧
這一節中, 我們將介紹兩個使用 Muirhead 不等式時有用的技巧。
定理 12: 在運用 Muirhead 不等式時, 若有條件 x1x2· · · xn= 1, 則對任意實數 r 有 [α1, α2, . . . , αn] = [α1− r, α2− r, . . . , αn− r]
證明:
[α1− r, α2− r, . . . , αn− r] = 1 n!
X
σ∈Sn
xασ(1)1−rxασ(2)2−r· · · xασ(n)n−r
= 1 n!
X
σ∈Sn
xασ(1)1 xασ(2)2 · · · xασ(n)n
xrσ(1)xrσ(2). . . xrσ(n) = 1 n!
X
σ∈Sn
xασ(1)1 xασ(2)2 · · · xασ(n)n
= [α1, α2, . . . , αn]
觀察定理 12 可發現其相當於將式子改為齊次性不等式, 這樣的技巧能幫助我們更方便的 處理不等式的問題。
例 4 (1995 IMO): 對任意實數 a, b, c ≥ 0 且 abc = 1, 試證 1
a3(b + c) + 1
b3(c + a) + 1
c3(a + b) ≥ 3 2 證明: 通分並整理後可得
2(a4b4+ b4c4+ c4a4) + 2(a4b3c + a4c3b + b4c3a + b4a3c + c4a3b + c4b3a) + 2(a3b3c2 + b3c3a2+ c3a3b2)
≥ 3(a5b4c3+ a5c4b3+ b5c4a3+ b5a4c3+ c5a4b3 + c5b4a3) + 6a4b4c4 此式可寫成
[4, 4, 0] + 2[4, 3, 1] + [3, 3, 2] ≥ 3[5, 4, 3] + [4, 4, 4]
此處我們發現 4 + 4 + 0 = 4 + 3 + 1 = 3 + 3 + 2 = 8, 但是 5 + 4 + 3 = 4 + 4 + 4 = 12。
運用定理 12, 我們可選擇 r = 43, 可知 [5, 4, 3] = 11
3,83,53 且 [4, 4, 4] = 83,83,83。 觀察到 (4, 4, 0) ≻ 113,83,53, (4, 3, 1) ≻ 113,83,53 且 (3, 3, 2) ≻ 83,83,83。 故接下來我們只需應用 Muirhead 不等式, 即有
[4, 4, 0] + 2[4, 3, 1] + [3, 3, 2] ≥ 11 3 ,8
3,5 3
+ 2 11 3 ,8
3,5 3
+ 8
3,8 3,8
3
= 3 11 3 ,8
3,5 3
+ 8
3,8 3,8
3
= 3[5, 4, 3] + [4, 4, 4] 例 5 (1998 Short list IMO): 設 a, b, c 為正實數且 abc = 1, 試證
a3
(1 + b)(1 + c) + b3
(1 + c)(1 + a)+ c3
(1 + a)(1 + b) ≥ 3 4 解: 通分並整理後可得
4(a4+ b4 + c4+ a3+ b3+ c3) ≥ 3(1 + a + b + c + ab + bc + ca + abc)
此式等價於
4[4, 0, 0] + 4[3, 0, 0] ≥ [0, 0, 0] + 3[1, 0, 0] + 3[1, 1, 0] + [1, 1, 1]
運用定理 12 及 Muirhead 不等式
[4, 0, 0] ≥ 4 3,4
3,4 3
= [0, 0, 0]
3[4, 0, 0] ≥ 3[2, 1, 1] = 3[1, 0, 0]
3[3, 0, 0] ≥ 3 4 3,4
3,1 3
= 3[1, 1, 0]
[3, 0, 0] ≥ [1, 1, 1]
將得到的四個結果相加, 即可得證所需之不等式。
定理 13: 在使用 Muirhead 不等式時, 若有條件 x1x2· · · xn≥ 1, 則對任意實數 r ≥ 0 有 [α1, α2, . . . , αn] ≥ [α1− r, α2− r, . . . , αn− r]
證明:
[α1 − r, α2− r, . . . , αn− r] = 1 n!
X
σ∈Sn
xασ(1)1−rxασ(2)2−r· · · xασ(n)n−r
= 1 n!
X
σ∈Sn
xασ(1)1 xασ(2)2 · · · xασ(n)n xrσ(1)xrσ(2). . . xrσ(n)
≤ 1 n!
X
σ∈Sn
xασ(1)1 xασ(2)2 · · · xασ(n)n
= [α1, α2, . . . , αn] 例 6 (2005 IMO): 對任意實數 x, y, z ≥ 0 且 xyz ≥ 1, 試證
x5− x2
x5 + y2+ z2 + y5− y2
y5+ z2+ x2 + z5− z2
z5 + x2+ y2 ≥ 0 證明: 通分並整理後可得
[9, 0, 0] + 4[7, 5, 0] + [5, 2, 2] + [5, 5, 5] ≥ [6, 0, 0] + [5, 5, 2] + 2[5, 4, 0] + 2[4, 2, 0] + [2, 2, 2]
欲證明此式, 我們觀察以下幾點 (i) [9, 0, 0] ≥ [7, 1, 1] ≥ [6, 0, 0]
(ii) [7, 5, 0] ≥ [5, 5, 2]
(iii) 2[7, 5, 0] ≥ 2[6, 5, 1] ≥ 2[5, 4, 0]
(iv) [7, 5, 0] + [5, 2, 2] ≥ 2[6,72, 1] ≥ 211
2,72,32 ≥ 2[4, 2, 0]
(v) [5, 5, 5] ≥ [2, 2, 2]
其中 (i), (iii) 可由 Muirhead 不等式及定理 13 得到, (ii) 為 Muirhead 不等式所得, (iv) 為 運用算幾不等式、 Muirhead 不等式及定理 13 得到, (v) 則由定理 13 得到。 將觀察到的五個
不等式相加, 即可得到所求的不等式。
習題
7: (i) 設 a, b, c 為非負實數, 試證
8abc ≤ (a + b)(b + c)(c + a) (ii) 設 aj, 1 ≤ j ≤ n 為實數, 試證
2 X
1≤j<k≤n
ajak≤ (n − 1)
n
X
j=1
a2j
(iii) 設 aj, 1 ≤ j ≤ n 為非負實數, 試證
(a1a2· · · an)1/n ≤ 2 n(n − 1)
X
1≤j<k≤n
√ajak
8 (2004 Moldova): 證明對於所有 a, b, c > 0, 皆滿足 a3+ b3+ c3 ≥ a2√
bc + b2√
ca + c2√ ab 9: 設 x, y, z 為正實數且滿足 xyz = 1, 試證
x2 + y2+ z2 ≤ x3+ y3+ z3
10: 對正實數 xk, 1 ≤ k ≤ n, 定義函數 Sm(x) = xm1 + xm2 + · · · + xmn, 試證 Sm2(x) ≤ Sm−1(x)Sm+1(x), m = 1, 2, . . .
11: 為正實數, 試證
ra2 b +
rb2 a ≥√
a +√ b
12: 設 a, b, c 為非負實數, 試證
a3+ b3+ c3+ abc ≥ 1
7(a + b + c)3 13: 設 a, b, c 為非負實數, 試證
a + b + c ≤ a2+ b2
2c + b2+ c2
2a + c2+ a2 2b ≤ a3
bc + b3 ca + c3
ab 14: 設 a, b, c 為正實數, 試證
a
(a + b)(a + c) + b
(b + c)(b + a) + c
(c + a)(c + b) ≤ 9 4(a + b + c) 15 (2004 Croatia): 設 a, b, c 為正實數, 試證
a2
(a + b)(a + c) + b2
(b + a)(b + c) + c2
(c + a)(c + b) ≥ 3 4 16 (2003 Short list Iberoamerican): 設 a, b, c 為正實數, 試證
a3
b2− bc + c2 + b3
c2− ca + a2 + c3
a2− ab + b2 ≥ a + b + c 17: 設 x, y, z 為非負實數且 xy + yz + zx = 1, 試證
1
x + y + 1
y + z + 1
z + x ≥ 5 2
18 (1961 IMO): 令 a, b, c 為三角形三邊長, 並令 S 為其面積。 試證 4√
3S ≤ a2+ b2+ c2 19 (1964 IMO): 設 a, b, c 為正實數, 試證
a3+ b3+ c3+ 3abc ≥ ab(a + b) + bc(b + c) + ca(c + a) 20 (2002 Canada): 設 a, b, c 為正實數, 試證
a3 bc + b3
ca+ c3
ab ≥ a + b + c 等號何時成立?
21 (2008 Serbia): 設 a, b, c 為滿足 a + b + c = 1 的正實數, 證明 a2 + b2+ c2+ 3abc ≥ 4
9
參考資料
1. 楊重駿、 楊照崑 (1982), 蓋理論 (Theory of majorization) 及其在不等式上的應用。 數學傳播, 第 6 卷, 第 4 期, 13-19。
2. Hall, P. (1935). On Representatives of Subsets. J. London Math. Soc. 10, 26-30.
3. Lorenz, M.O. (1905). Methods of measuring the concentration of wealth. Publications
of the American Statistical Association 9
(70): 209-219.4. Manfrino, R.B., Ortega, J.A.G., and Delgado, R.V. (2009). Inequalities: A Mathemat-
ical Olympiad Approach. Boston: Birkh¨auser.
5. Muirhead, R.F. (1903). Some methods applicable to identities and inequalities of sym- metric algebraic functions of n letters. Proc. Edinburgh Math. Soc 21, 144-157.
6. Steele, J.M. (2004). The Cauchy-Schwarz Master Class: An Introduction to the Art of
Mathematical Inequalities. Cambridge: Cambridge University Press.
7. Weyl, H. (1949). Almost periodic invariant vector sets in a metric vector space. Amer.
J. Math. 71, 178-205.
—本文作者陳柏宇任教新北市樹林區三多國中, 張福春任教國立中山大學應用數學系—
Sinica-NCTS/TPE Mini-course in Geometry
日 期 : 2014 年 07 月 09 日 (星期三) 、 2014 年 07 月 11 日 (星期五) 地 點 : 台北市大安區羅斯福路四段 1 號 天文數學館 722研討室 詳見中研院數學所網頁 http://www.math.sinica.edu.tw