Mordell 的一個問題
林開亮
1958 年 Birch 提出以下 猜想: 設複數 z1, . . . , zn 滿足
|z1|2+ · · · + |zn|2 = n 則
∆ = Y
1≤i<j≤n
|zi− zj|2 單位圓的內接正 n 邊形的頂點 z1, . . . , zn 取得最大值 nn。
在 1960 年 Mordell [3] 對 n = 3 肯定了猜想成立, J. H. H. Chalk 對 n ≥ 6 否定了 猜想, 他給出的反例是 z1 = 0 而 z2, . . . , zn−1 構成半徑為 p n
n−1 的圓的內接正 n − 1 邊形 的頂點, 對這些 zi 容易算出 ∆ = (n−1n )n(n−1)2 (n − 1)n−1, 當 n ≥ 6 時它比 nn 大; 唯獨留下 n = 4, 5 的情形沒有解決。
本文有兩個目標, 首先對 n = 3 的情形給出一個簡單的證明, Mordell 原來的證明用到 二元函數的微積分, 我們這裏只用到均值不等式和一個關於複數的粧等式 (見 (1) 式)。 接下來, 也就是本文的主要結果, 我們肯定地解決了 n = 4 的猜想。
首先, 我們驗證上述猜想對 n = 3 成立。 也就是來證明下述結果。
定理: 若複數 z1, z2, z3 滿足
|z1|2+ |z2|2+ |z3|2 = 3 則
∆ = |z1− z2|2|z2− z3|2|z3− z1|2 ≤ 33 = 27 等號成立當且僅當 z1, z2, z3 為內接於單位圓的正三角形的三個頂點。
證明: 由餘弦定理 (複數形式)
|z1− z2|2 = |z1|2+ |z2|2− z1z2− z2z1
51
有
∆ = |z1− z2|2· |z2− z3|2· |z3− z1|2
≤ (|z1− z2|2+ |z2− z3|2+ |z3− z1|2
3 )3
≤ (2(|z1|2+ |z2|2+ |z3|2) − (z2 + z3)z1 + (z1+ z3)z2+ (z1+ z2)z3
3 )3
= (3(|z1|2+ |z2|2+ |z3|2) − |z1+ z2+ z3|2
3 )3 ≤ 33
等號成立當且僅當 z1+ z2+ z3 = 0 且 |z1− z2| = |z2− z3| = |z1− z3|, 即 z1, z2, z3 為內 接於單位圓的正三角形的三個頂點。
注意到這個證明中其實只用到一個關鍵的等式(正是這個等式使得我們可以大大簡化 Mordell 原 來的證明)
|z1− z2|2+ |z2− z3|2+ |z3− z1|2 = 3(|z1|2+ |z2|2+ |z3|2) − |z1 + z2 + z3|2 (1) 這個等式可以推廣到 n 個複數的情形, 這就是下述
X
1≤ i<j≤ n
|zi− zj|2 = n
n
X
i=1
|zi|2− |z1+ · · · + zn|2 (2) 這個式子不僅對複數 zi 成立, 對任意維數為 d 的向量空間 Rd 的 n 個向量 z1, . . . , zn 都成 立, 只要把 |zi| 理解為向量 zi 的長度。 這個一般的等式曾作為練習出現在 J. Dieudonn´e [2]
中 p.126 問題 5。
如前所述, Birch 的猜想只剩下 n = 4 或 n = 5 的情形待解決, 作者新近解決了 n = 4 的情形, 得到了肯定的結論, 也就是證明了下述
命題: 設複數 z1, z2, z3, z4 滿足
|z1|2+ |z2|2+ |z3|2+ |z4|2 = 4 (3) 則
∆ = |z1− z2|2|z1− z3|2|z1− z4|2|z2− z3|2|z2− z4|2|z3− z4|2 ≤ 44 = 256 (4) 等號成立當且僅當 z1, z2, z3, z4 為內接於單位圓的正方形的四個頂點。
證明: 首先我們證明, ∆ 的最大值僅在 z = 14(z1+ z2+ z3+ z4) = 0 時取得。 原因是以 下等式粧成立 (可展開直接驗證)
4
X
i=1
|zi− z|2 =
4
X
i=1
|zi|2−1
4|z1+ z2+ z3+ z4|2 (5)
當 z 6= 0 時, 以 wi = zi− z 代替 zi 得到的 ∆ 的值不變, 但它們的模長平方和更小, 所以將 各個 wi 放大一個適當的倍數1 會得到更大的 ∆ 值。
所以不妨設
z4 = −(z1+ z2+ z3), (6) 於是約束條件 (3) 成為
|z1|2+ |z2|2+ |z3|2+ |z1+ z2+ z3|2 = 4. (7) 注意到
|z1|2+ |z2|2+ |z3|2+ |z1 + z2+ z3|2 = |z1+ z2|2+ |z2+ z3|2+ |z1+ z3|2 (8) 於是 (7) 又可以進一步寫成
|z1+ z2|2+ |z2+ z3|2+ |z1+ z3|2 = 4 (9) 現在作變數替換
z2+ z3 = λ1, z1+ z3 = λ2, z1+ z2 = λ3 (10) 則約束條件 (9) 就成為
|λ1|2+ |λ2|2+ |λ3|2 = 4 (11) 在變數替換 (10) 下,
z1− z2 = λ2− λ1, (12) z1− z3 = λ3− λ1, (13) z2− z3 = λ3− λ2, (14) 又由 (6) 有
z1− z4 = z1+ (z1+ z2+ z3) = (z1+ z3) + (z1+ z2) = λ2+ λ3, (15) z2− z4 = z2+ (z1+ z2+ z3) = (z1+ z2) + (z2+ z3) = λ1+ λ3, (16) z3− z4 = z3+ (z1+ z2 + z3) = (z1+ z3) + (z2+ z3) = λ1+ λ2. (17)
1 說得更詳細些, 這個倍數就是 λ = r
P4
i=1|zi|2 P4
i=1|zi−z|2 。
所以目標函數 (4) 化為
∆ = |z1− z2|2|z1− z3|2|z1 − z4|2|z2− z3|2|z2 − z4|2|z3− z4|2
= |λ2− λ1|2|λ3− λ1|2|λ2+ λ3|2|λ3− λ2|2|λ1+ λ3|2|λ1+ λ2|2 (18)
= |λ21− λ22|2|λ22− λ23|2|λ21− λ23|2 注意到如果我們進一步作變數代換
λ21 = w1, λ22 = w2, λ23 = w3 (19) 則約束條件 (11) 和目標函數 (18) 分別有下述簡單形式
|w1| + |w2| + |w3| = 4 (20)
∆ = |w1− w2|2|w2− w3|2|w3− w1|2 (21) 於是我們只需要證明下面的引理就完成了證明。
引理1: 設複數 w1, w2, w3, 滿足 (20), 則由 (21) 定義的函數 ∆ 的最大值為 256, 最大 值點僅在 w1, w2, w3 中某一個為零而其他兩個互為相反數時取得。
引理 1 的證明: 首先指出, ∆ 的最大值點 w1, w2, w3 滿足以下必要條件: 對任意的複數 w,
|w1| + |w2| + |w3| ≤ |w1− w| + |w2− w| + |w3− w| (22) 這個推理跟定理中的證明類似, 我們重復如下。 不然, 設存在某個 w0 使得
|w1| + |w2| + |w3| > |w1− w0| + |w2− w0| + |w3− w0| 則
µ = |w1| + |w2| + |w3|
|w1− w0| + |w2− w0| + |w3− w0| > 1 令 wi′ = µ(wi− w0), i = 1, 2, 3, 則 w′1, w2′, w′3 滿足約束條件 (20), 但是
∆(w′1, w2′, w3′) = µ6∆(w1, w2, w3) > ∆(w1, w2, w3) 這與 w1, w2, w3 為 ∆ 的最大值點矛盾!
(22) 式的幾何含義是, 平面上任意一點 w 到 w1, w2, w3 的距離之和都大於等於原點 w = 0 到 w1, w2, w3 的距離之和。 借助於我們將要介紹的 Fermat 點的定義, 則這個結論可 以表述為, 0 是平面關於 z1, z2, z3 的 Fermat 點。
我們所需要的關於 Fermat 點的著名事實概括在下述 Fermat 定理 (參見 [1], pp.288- 289) 中:
定理: 對一個給定的三角形, 平面上存在唯一的一點 (稱為此三角形的 Fermat 點) 到它的 三個頂點的距離之和最短, 這個點或者在三角形的一個頂點或者與三個頂點兩兩張成 120 度, 取決於所給三角形是否有一個大於等於 120 度的內角。
據此, 我們只需分別討論以下兩個可能。
在第一種情形, 若 w1, w2, w3 構成的三角形 (也可以是退化的直線段) 中有一個角比如說 w3 處的角大於等於 120 度, 於是由上述定理 w3 = 0。 此時 |w1| + |w2| = 4, 容易求得
∆ = |w1|2|w2|2|w1− w2|2 ≤ [(|w1| + |w2|
2 )2(|w1| + |w2|)]2 = 162 = 256 等號僅在 w1, w2 互為相反數時取得。
在第二種情形, 0 與 w1, w2, w3 各點之間的連線兩兩張成 120 度, 由餘弦定理, 問題轉化 為2估計函數
δ(x, y, z) = (x2 + y2+ xy)(y2+ z2+ yz)(x2+ z2+ xz) (23) 在區域
x, y, z ≥ 0, x + y + z = 4 (24) 的上界。
我們通過下面的引理 2看到, 總有 δ(x, y, z) < 256. 從而在第二種情形引理 1也得證。
引理2: 設實數 x, y, z 滿足 (24), 則由 (23) 定義的函數 δ 的最大值為 192, 最大值點僅 在 x, y, z 中某一個為零而其他兩個都等於 2 時取得。
證明: 將 z = 4 − (x + y) 代入 δ(x, y, z) 的運算式, 函數 δ 成為兩個變數 x, y 的函 數, 略作化簡我們得到:
f (x, y) = δ(x, y, 4−(x+y))
= (x2+y2+xy)[(x2+y2+xy+16)−(8x+4y)][(x2+y2+xy+16)−(4x+8y)]
= (x2+y2+xy)[(x2+y2+xy+16)2−12(x+y)(x2+y2+xy+16) +16(2x2+2y2+5xy)]
= (x2+y2+xy){(x2+y2+xy+16)2−12(x+y)(x2+y2+xy+16)
+16[3(x+y)2−(x2+y2+xy)]} (25)
2 x, y, z 分別表示 w1, w2, w3 的模長。 建議讀者在此處畫一個圖。
這裏 (x, y) 的定義域為
Ω = {(x, y) ∈ R2|x ≥ 0, y ≥ 0, 4 − (x + y) ≥ 0}.
我們先考慮 Ω 內部的可能最大值點, 按照微積分, 它一定是函數 f (x, y) 的臨界點。 下麵就來 尋求 f 的臨界點。
注意到, 在變數替換
u = x + y,
v = x2+ y2+ xy,
(26)
下, 函數 f (x, y) 進一步轉變為 u, v 的函數
g(u, v) = v[(v + 16)2− 12u(v + 16) + 16(3u2− v)] (27) 設 Ω 內部一點 (x0, y0) 為 f (x, y) 的臨界點, 則對應的 (u0, v0) 為 g(u, v) 的臨界點, 只要 變換 (26) 在 (x0, y0) 的雅可比行列式不等於零。 易算出 (26) 的雅可比行列式為 y − x, 所以 只要 f 的臨界點 (x0, y0) 滿足 x0 6= y0, 對應的 (u0, v0) 為 g(u, v) 的臨界點。 我們先來求 g(u, v) 的臨界點, 也就是下述方程組
∂ g(u, v)
∂ u = v(−12v + 96u) = 0
∂ g(u, v)
∂ u = (v + 16)2− 12u(v + 16) + 16(3u2− v) + v[2(v + 16) − 12u − 16] = 0 從第一式解得 v = 8u 代入第二式並化簡得到
3u2+ 16u + 16 = 0
這個方程僅有負根, 而當 (x, y) ∈ Ω 時, u = x + y ≥ 0. 這說明 f(x, y) 在 Ω 內部的臨界點 只可能位於直線 x = y 上. 回到原來的函數 δ(x, y, z) 及約束條件, 因為它們關於 x, y, z 三 個變數都是對稱的, 所以 δ(x, y, z) 唯一可能的內部極值點 (x0, y0, z0) 滿足 x = y = z, 也就 是 (x0, y0, z0) = (4/3, 4/3, 4/3), 易算出
δ(4 3,4
3,4
3) = (16 3 )3.
下面我們來求 δ(x, y, z) 在 Ω 的邊界上的最大值。 Ω 的邊界分為三部分, 是在 (24) 中 分別附加限制 x = 0, y = 0, z = 0 得到的。 由 x, y, z 的對稱性, 不妨設 y = 0。 此 時 δ(x, y, z) 化簡為
δ(x, 0, z) = x2z2(x2+ z2 + xz) = (xz)2((x + z)2 − xz) = (xz)2(16 − xz)
令 t = xz, 則上述函數化簡為
h(t) = t2(16 − t)
由於 xz ≤ (x + z)2/4 = 42/4 = 4, 所以 t 的取值範圍為 [0, 4]。 對 h(t) 求導容易看 到 h′(t) 在 [0, 4] 非負, 所以 h(t) 在 [0, 4] 上單調遞增, 從而 h(t) 的最大值為 h(4) = 42(16 − 4) = 192.
簡單的計算表明 192 ≥ (16/3)3, 所以 δ(x, y, z) 的最大值為 192, 並且容易確定等號成 立條件如引理 2 所述.
從引理 1 的等號成立條件推導命題的等號成立條件這一過程留給有興趣的讀者。
評注: 筆者最近從另一個角度考慮了 n = 5 時的問題, 得到了部分結果, 這些結果在某種程度 上支持了 Birch 的猜想。 因為這個想法實際上很簡單, 我們將在此處作一介紹。
基本的想法是將運算式
∆ = |z1−z2|2|z1−z3|2|z1−z4|2|z1−z5|2|z2−z3|2|z2−z4|2|z2−z5|2|z3−z4|2|z3−z5|2|z4−z5|2 (28) 中的十個因數分成兩組, 指標間隔為 1的差為一組, 指標間隔為 2的差為另一組, 令
A(z) = |z1− z2|2+ |z2− z3|2+ |z3− z4|2+ |z4 − z5|2+ |z5 − z1|2 B(z) = |z1− z3|2+ |z2− z4|2+ |z3− z5|2+ |z4 − z1|2+ |z5 − z2|2 於是, 由均值不等式有:
∆ = (τ |z1− z2|2)(τ |z2− z3|2)(τ |z3− z4|2)(τ |z4− z5|2)(τ |z5− z1|2)
·(τ−1|z1− z3|2)(τ−1|z2− z4|2)(τ−1|z3− z5|2)(τ−1|z4− z1|2)(τ−1|z5− z2|2)
≤ (τ A(z) + τ−1B(z) 10 )10
容易求出 Hermite 型 A(z), B(z) 的譜分解為
A(z) = λ1|w1|2+ λ2|w2|2+ λ3|w1|2+ λ4|w4|2
B(z) = (5 − λ1)|w1|2+ (5 − λ2)|w2|2+ (5 − λ3)|w1|2+ (5 − λ4)|w4|2
其中 wk為向量 z = (z1, · · · , z5) 在基底 {ξk}4k=0下的座標分量, 而 ξk= √15(1, εk, ε2k, ε3k, ε4k), 此 處 εk = cos 2kπ5 + i sin2kπ5 ; 而 λk = 2(1 − cos2kπ5 )。 利用三倍角公式和二倍角公式容易算 出 cos2π5 = √5+14 , 從而確定出 λ1 = λ4 = 5−2√5, λ2 = λ3 = 5+2√5。
現在我們想選擇適當的正參數 τ 使得
τ A(z) + τ−1B(z) 10
10
≤ 55, 這只需
τ A(z) + τ−1B(z) 10
≤√ 5.
注意到
τ A(z) + τ−1B(z) = τ (λ1|u|2+ λ2|v|2) + τ−1(λ2|u|2+ λ1|v|2)
其中 u, v 為向量 z 在子空間 U = Cξ1 ⊕ Cξ4 與 V = Cξ2⊕ Cξ3 上的正交投影。 所以我們 有 |u|2+ |v|2 ≤ |z|2 = 5。
現在如果 z 的取值範圍在 U 或 V 中我們立即可以選擇適當的 τ 使得 (τ A(z) + τ−1B(z)
10 ) ≤√ 5.
例如, 如果 z 在子空間 U 中變化, 則對於 τ = λ2/√
5 = √5+12 有 τ A(z) + τ−1B(z) = τ λ1|u|2+ τ−1λ2|u|2 = 2√
5|u|2 = 10√ 5.
很遺憾, 這個簡單的技巧不能進一步應用到一般情況的討論。
致謝: 本文中引理 2 的證明是與劉雲朋與傅小虎討論得出的, 特表感謝。