華羅庚關於矩陣標準型的工作介紹

(1)

華羅庚關於矩陣標準型的工作介紹

林開亮

華羅庚的矩陣技巧使得邀請他1946年去普林斯頓高等研究院訪問的 H. Weyl 十分賞識, Weyl 曾說:「華羅庚玩矩陣就如玩數字一樣。」

陸啟鏗, [48, p. 52]

緣起

華羅庚 (1910∼1985), 江蘇金壇人, 二十世紀中國最有影響力的數學家之一。華羅庚是自 學成才的大數學家, 他的故事曾激勵了一代又一代的學生走上數學研究的道路。作為一名學者, 他對後人特別是華人的影響是無法估量的。

關於華羅庚的傳奇人生, 他的學生王元曾經寫過一本很好的傳記 [62], 這本書為我們瞭解華羅庚提供了一盞明燈。 (這本書榮獲首屆“吳大猷科學普及著作獎”金簽獎。) 王元與楊德莊還合寫了另一本書 [63], 正如標題所表明的, 這本書側重於介紹華羅庚的數學成就。筆者也正是從這兩本書入手, 逐漸對華先生的數學工作有了粗淺的瞭解。本文就是筆者這些年來積累下來的、

特別想與讀者們分享的一點心得, 也可以說是一個學習報告。

對於華羅庚的數學工作, 已經有了許多介紹, 特別的, 可見華羅庚的論文選集[28]中由他的弟子王元、萬哲先、陸啟鏗、龔昇所寫的專門介紹。這裏我們主要介紹華羅庚在矩陣論方面的工作。在華羅庚的所有工作中, 代數方面的工作並不是最有影響的 (根據丘成桐[81]的看法¹,華羅庚先生的最大成就在多元複變函數論); 即便是在華羅庚的所有代數工作中來看, 矩陣論方面的工作也不是最有影響的, 華羅庚關於體的半自同構的工作與在典型群方面的工作具有基本的重要性; 相對而言, 華羅庚在矩陣論方面的工作並非如此重要 — 後繼者已經在比較一般的域 (而不限於華羅庚通常所考慮的複數域與實數域) 上推廣了這些結果甚至簡化了其證明。但是, 對於

1丘成桐指出: 中國近代數學能超越西方或與之並駕齊驅的主要有三個, 當然我不是說其他工作不存在, 主要是講能夠在數學歷史上很出名的有三個: 一個是陳省身教授在示性類方面的工作; 一個是華羅庚在多複變函數方面的工作; 一個是馮康在有限元計算方面的工作。

我為什麼單講華先生在多複變函數方面的工作, 這是我個人的偏見。華先生在數論方面的貢獻是大的, 可是華先生在數論方面的工作不能左右全世界在數論方面的發展, 他在這方面的工作基本上是從外面引進的觀點和方法。可是他在多複變函數方面的貢獻比西方至少早了十年, 海外的數學家都很尊重華先生在這方面的成就。

66

(2)

華羅庚本人而言, 他在矩陣方面的貢獻對他之後工作的影響是不容低估的, 正如他的學生徐利治[74]在總結華羅庚的治學與研究經驗時所一語道破的:

華先生很重視做學問需要有“看家功夫”。所謂看家功夫指的是做科研時必不可少的最基本而有用的本事。據他所說, 他扎實的看家功夫主要來源於三部經典著作。一是 G. Chrystal 的《代數學》, 二是 E. Landau 的《數論教程》 (三大卷), 三是 W.

H. Turnbull 與 A. C. Aitken 合著的《矩陣標準型理論引論》。他說, 《代數學》使他學會了計算技巧, 《數論教程》使他獲得了從事數學研究的分析功底, 而《矩陣標準型理論引論》雖是一本薄薄的書, 卻是幫助他後來完成矩陣幾何和複分析巨大研究成果的基本工具。

需要補充的是, 對華羅庚後來的工作影響至深的還有 H. Weyl 的經典著作《古典群》[65]。² 這在他的兩本專著《典型群》 (與萬哲先合著) 與《多複變數函數論中的典型域的調和分析》中深有體現。事實上, 正如華羅庚的學生馮克勤在[13]中所透露的:

華羅庚在討論班和日常談話中有許多觀點是大家熟知的, 例如他把“班門弄斧”反其道而行之, 主張 “弄斧一定到班門”, 即研究工作一定要與大師交手, 才會有所提高。

他主張讀書要“從薄變厚, 再從厚變薄”, 並舉例說他花了兩年的功夫念 Weyl 的群表示論的書, 終於弄懂了其中的精髓。我們在他的著作《多複變數函數論中的典型域的調和分析》中看到他是如何把群表示加以消化, 用自己獨特的矩陣技巧表達出來。

由此我們應該認識到, 對於作為數學家的華羅庚來說, 他最重要的才能之一是他在運用矩陣技巧方面的精深造詣。如果不瞭解這一點, 就無法理解華羅庚 (及其學派) 在多元複變函數論上的成功。³

華羅庚對矩陣論有許多貢獻, 本文主要討論他在矩陣的標準型方面的工作。萬哲先在華羅庚的論文選集[28]的介紹中用寥寥幾筆概括了華羅庚在這方面的貢獻:

華羅庚關於矩陣幾何和多元複變函數論的研究, 還促使他研究矩陣的分類問題, 例如, 複對稱矩陣和斜對稱矩陣在酉群相合下的分類, 一對 Hermite 矩陣在相合下的分類, 以及 Hermite 矩陣在正交群相合下的分類。

這個概括是不完全的, 特別是, 沒有提到華羅庚在 1960 年代初用中文發表 (但結果早在 1940 年代就已經得到) 的兩篇工作[29][30]。 (當然, 這兩篇中文文章也沒有收入到[28]中。)

2無獨有偶, 陳省身先生對 Weyl 的《古典群》也推崇備至。根據吳文俊[72]的回憶, 陳先生在中央研究院數學所主持工作的三年期間, 曾對數學所的年輕人指出:要進入近代數學之門, 應該好好學習三本書: L. Pontrjagin 的《連續群》, C. Chevalley 的《李群論》, 以及 H. Weyl 的《古典群》。而且事實上, 陳先生曾在一篇重要的文章[4]中指出了 K¨ahler 流形上的 Lefschetz 定理實質上有著深刻的群論根源 (對此有興趣的讀者可以參見伍鴻熙[73]第77-80 頁), 做出這樣的洞察顯然與他熟悉 Weyl 的《古典群》是分不開的。

3正如馮克勤在[13]中回憶的: 曾肯成 (1927∼2004) 曾對 1970 年代的中國科技大學的情景有這樣的概括, “龍生龍, 鳳生鳳, 華羅庚的學生會打洞。” 所謂打洞, 就是通過變換將方陣化成某種類型的稀疏方陣 (大部分元素為 0)。

(3)

華羅庚在 1940 年代的西南聯大完成了這些工作, 這期間他還獨立於 C. L. Siegel 開展了多元複變函數自守函數論的研究, 並從中進一步開創了矩陣幾何學這一新領域。這些研究正是華羅庚關於矩陣標準型工作的背景與動機所在。事實上, 華羅庚在矩陣標準型方面的工作主要包含在多元複變函數論與矩陣幾何的文章中, 見[23][24][26]。

1940年恰好也是華羅庚數學研究生涯中的一個分水嶺。 1940年以前, 他 (追隨德國、英國與俄國學派) 從事當時熱門的解析數論研究; 1940年以後, 他獨立地開展了多元複變函數論與矩陣幾何學的研究。借助于徐利治的上述總結, 也許可以這樣簡單地概括: 在1940年以前, 華羅庚的數學研究主要是受到 Landau 《數論教程》的影響; 在1940年以後, 對華羅庚影響越來越深的是 Turnbull 與 Aitken 的《矩陣標準型理論引論》。我們要介紹的就是, 後一影響在華羅庚的工作[23][24][25][26][29][30]中的具體表現。

內容介紹

在具體介紹華羅庚的數學工作之前, 我們先來瞭解一下他在1940年以前的數學生涯以及 當時的整個時代背景 (注意到 1937∼1945 在中國近代史上的特殊烙印), 這就是第一節的主要 內容。華羅庚自學成才的故事應該是家喻戶曉的, 但筆者深為觸動以至於在此忍不住想要舊事重提。相信這一則小故事必定會引起讀者 (特別是在學學生) 的反省與深思。對於這一故事已經熟悉的讀者可以直接跳過。

在第二節我們將回顧一下矩陣標準型方面的經典結果, 這也相當於提供了另一個觀點來看待本科線性代數的主要結果。這裏我們特別要介紹 K. Weierstrass 與 G. Frobenius 的重要貢獻, 從某種意義上說, 正是他們的工作一起奠定了現在的線性代數之基礎, 這一點也許很值得瞭解 (參見[16][17])。

在第三節我們將用七個小節分別詳細介紹華羅庚論文 [23][24][25] [26][29][30]中關於矩陣標準型方面的代表性工作。我們的論述不可能面面俱到, 因而將注意力集中於那些陳述起來比較簡潔明瞭的結果以及那些或多或少被忽略了的重要結果, 例如華羅庚重新發現的 Takagi 定理 (定理1)、重新發現的屬於 Williamson 的關於复辛矩陣在辛相似下的標準型 (定理12) 等等。我們特別強調了在華羅庚的工作中反覆出現的一個關於實矩陣的平方根的存在性引理 (見 引理4與引理5) 及其代數基礎 (引理1)。特別的, 第 §3.5 節將介紹華羅庚在[26]中得到的關於 辛對合矩陣的標準型以及它的一個漂亮應用 (引理2)。事實上, 向讀者介紹這個漂亮結果正是本文的一個主要目的。⁴

在第四節我們將要介紹 J. Williamson, 這個名字在第三節中反覆出現, 因為華羅庚在矩陣標準型方面的許多工作都曾被 Williamson 研究過。從某種意義上說, Williamson 是華羅

4據說, Dieudonn´e 習慣說, 數學家希望因為他們最難的定理而被人們記住, 但是大多數時候, 正是他們最簡單的結果在後人中流傳。筆者期望, 在華羅庚先生關於矩陣的標準型的諸多工作中, 引理 2 至少能因其簡單性和優美性而流傳下去。

(4)

庚在矩陣標準型工作方面的一個潛在對手, 每當我們提及華羅庚在矩陣標準型方面的諸多工作時, 就必定要反覆提到 Williamson 的早期工作, 正如每當我們討論華羅庚在多元複變函數論方面的開創性工作時就必定要提到 Siegel 的著名論文辛幾何 (見[53]) 一樣。

1. 插入:1940年以前的華羅庚

如王元、楊德莊《華羅庚的數學生涯》一書開篇所說的:

華羅庚是一個自學成才的數學家。他在初中畢業後僅念了半年職業高中, 即在家自學數學。他在家鄉江蘇金壇所能見到的數學書籍只有一本《大代數》⁵ 一本《解析幾何》, 以及一本約五十頁的《微積分》。此外還有兩本與數學有點關係的雜誌《科學》

與《學藝》。華羅庚在家一邊自學, 一邊寫過幾篇文章, 都屬於初等數學範圍。

很難想像, 受教育如此之少的華羅庚後來竟憑藉自己的勤奮與天才而成為中國數學的一根頂樑柱。華羅庚的人生轉折點出現在1930年。那一年他在《科學》上發表了他的第二篇數學論文蘇家駒之代數的五次方程式解法不能成立之理由, 在這篇論文中, 華羅庚找出了蘇家駒1926 年發表在《學藝》上的論文代數的五次方程式之解法的錯誤。⁶華羅庚因此而得到清華大學算學 系 (後稱數學系) 主任熊慶來 (1893∼1969) 的賞識, 得到在清華大學工作的機會: 算學系聘他 為圖書管理員。對於這段時期的華羅庚, 當時在清華就讀研究生院的陳省身 (1911∼2004) 在 學算四十年 (見[5]) 一文中有敏銳的觀察和生動的回憶:

那時清華數學系最引人注意的人物, 當數華羅庚。羅庚江蘇金壇人, 和培經同鄉。

羅庚初中畢業後輟學在家, 就自修數學, 因為同鄉關係, 他與培經通信, 咨詢數學問題。有一期《學藝》雜誌上一位先生“證明”五次方程式可解, 編者竟登載了。羅庚能把錯誤找出, 因此數學系決定聘他為圖書管理員。他1931年來清華, 辦公桌放在系主任熊先生辦公室外面, 不久就成了系裏的中心人物。羅庚是一個十分活躍的人, 凡數學討論, 系內人事, 他無不參與。他是確有數學天才的, 每天工作十幾個小時, 所以短期內便有文章在國外雜誌發表。他的腿因幼時患傷寒症而跛, 又因沒有上過大學, 和大家出身不同, 以致有高度的不安全感。他在數論、代數、多元複變函數論, 都有重要的貢獻。關於他的故事很多。記得有一次, 他的一篇文章, 經某德國雜誌接受, 他站在科學館前, 逢人握手, 告此喜信。

在清華期間, 華羅庚一邊工作一邊學習。當時算學系的教授有: 研究單複變函數論的熊慶 來, 研究數論的楊武之 (1896∼1973), 研究微分幾何的孫光遠 (1900∼1979) 以及主要擔任基 礎課教學的鄭桐蓀 (1887∼1963), 教員有周鴻經 (1902∼1957), 唐培經 (1903∼1988)。

5 這裡的《大代數》當指後來在國內普遍採用的《范氏大代數》, 這是他1926 年在上海參加珠算比賽獲得冠軍後用獎金所買的。

6關於華羅庚這篇論文的創作過程, 見李文林[43]。

(5)

學生中亦不乏佼佼者, 除了研究生陳省身與吳大任 (1908∼1997) 之外, 還有本科生莊圻 泰 (1909∼1997), 許寶騄 (1910∼1970), 柯召 (1910∼2002), 徐賢修 (1912∼2002) 等。華 羅庚與這些精英一起聽課學習, 切磋琢磨, 受益良多。因為他更多地得到了楊武之的指導, 所以他在此期間的興趣主要在數論。

楊武之, 1923∼1928 年在芝加哥大學師從於美國代數與數論大家 L. E. Dickson (1874

∼1954)。學成歸來後, 在中國播灑下近世代數與數論的種子。在 Dickson 的指導下, 楊武之在 1928 年的博士論文中證明了這樣的結果: 每個正整數都是九個金字塔數之和⁷。所謂金字塔數, 就是形如 (_n+1

3

) = (n³ − n)/6 (n = 1, 2, 3, . . .) 的數。這個結果是著名的 Lagrange 四平 方和定理 (即每個正整數都是四個完全平方數之和) 的一個變體。楊武之的這一堪與 Lagrange 定理相媲美的結果一定深深地打動了華羅庚, 這將他引向更一般的華林問題 (Waring’s problem)。華羅庚在清華讀到了 E. Laudau (1877∼1938) 的一些優秀數論著作 (參照前面所引 徐利治的話), 並對 Hardy-Littlewood-Ramanujan 的圓法與堆壘數論做了深刻的分析。此 外, 1935∼1936年, 清華還邀請到法國數學家 J. Hadamard (1865∼1963) 與美國數學家 N.

Wiener (1894∼1964) 來校講學, 這使華羅庚受益良深。

1936年, 中國文化基金會資助華羅庚去英國劍橋大學進修, 由於資金有限, 他不是正式的研究生, 而是一個訪問學者。⁸ 在此期間, 他與年輕的數論學家 H. Davenport (1907∼1969), T. Estermann (1909∼1991), H. Heilbronn (1908∼1975), E. C. Titchmarsh (1899∼

1963)以及 A. C. Oﬀord (1906∼2000), R. A. Rankin (1915∼2001) 交往頻繁, 受益匪淺。

他對華林問題做出了重要的改進, 發表了多篇文章。

1937年7月7日, 日本對中國發動全面的侵華戰爭。 1938年4月, 清華、北大、南開三校遷 往雲南昆明, 合併創立西南聯大。 1938年, 華羅庚從英國回國, 任西南聯大數學系教授。 1938∼

1940年, 華羅庚將自己關於華林問題及其推廣的主要工作系統整理, 寫成專著《堆壘素數論》。

由於時值戰亂, 付梓艱難, 他將書稿寄給蘇聯科學出版社出版。由於第二次世界大戰的影響, 該書推遲至1947年才由蘇聯出版, 而中文修訂版則遲至1957年才出版。中文版之後又被譯成匈牙利文、德文、英文, 該書是華羅庚的第一本數學專著, 也是華羅庚最有影響的數論工作之一。

1940 年前後, 華羅庚將工作重點從數論轉移到分析、代數與幾何, 具體地說, 即多元複變函數論與矩陣幾何學。注意到, 華羅庚此前完全沒有涉足這些領域。事實上, 矩陣幾何學是華羅庚從多元複變函數論的研究中單獨開闢出來的新領域, 而當時從事多元複變函數論的數學家屈 指可數, ´E. Cartan (1869∼1951) 與 C. L. Siegel (1896∼1981) 是其中最有影響的人物, 但

7參見林開亮、張愛仙, 楊武之的九金字塔數定理,《數學傳播》, 2014 年, 38 卷 4 期, 42-52。

8華羅庚選擇劍橋也許是因為受到 G. H. Hardy (1877∼1947) 的吸引與 Wiener 的舉薦。 Hardy 與牛津大學的數論專家 J. E.

Littlewood (1885∼1977) 由於給出了 Hilbert-Waring 定理的定量化證明, 一起成為解析數論的領軍人物。 Hardy 一生最得意 的發現不是某個數學結果, 而是印度的傳奇數學家 S. Ramanujan (1887∼1920)。 Wiener 希望, 華羅庚作為中國的傳奇數學家也 能得到 Hardy 的賞識。可惜華羅庚去劍橋的那兩年 Hardy 恰不在劍橋。另外, 根據陳省身先生的看法, 華羅庚去劍橋追隨 Hardy 未必是最好的選擇, 陳省身認為, 如果華先生到漢堡跟隨 E. Artin 搞代數數論, 日後的成就也許會更大。見張奠宙[83, p. 204]。

(6)

由於時值戰亂消息閉塞, 華羅庚對他們的工作知之甚少。然而, 他憑藉深厚的矩陣功底在這一領域開拓出重要成果 (見[23][24], 詳細介紹可見陸啟鏗[48])。而這也就是本文所討論的華羅庚在矩陣標準型方面的工作的研究背景與動機。

2. 矩陣的標準型之概論

矩陣的標準型這一課題由來已久, 揭開這一課題研究的是矩陣論的奠基人: 德國數學家 K.

Weierstrass (1815∼1897)。第一次聽說這句話 — 矩陣論的奠基人是 Weierstrass 而不是 A.

Cayley (1821∼1895) — 的讀者也許會非常驚訝, 筆者第一次從 Thomas Hawkins 那裏聽到這個說法時也有同樣的感受。沒錯! Hawkins 正是這麼說的 (見[16, p. 156] ):

通常 Cayley 被認為是矩陣論的奠基者。然而, 我在1977年的一篇文章中提議道, 雖然 Cayley 在1858年之前通過引進這一理論 (矩陣代數) 的一個方面確實發揮了特殊的作用, 但是對 Cayley 的工作如此定性則是一種歷史誤導。在賦予任何人這樣一個名稱的時候存在著一個顯然的危險, 因為它採取的是一種過分簡單化了的歷史解釋。銘記這一警告, 我將提議, 就配得上矩陣論奠基人這一稱號的人來說, 這個人是 Weierstrass。

Hawkins 將 Weierstrass 對矩陣論的貢獻概括為以下兩點: 第一, Weierstrass 在矩陣的初等因子理論 (也就是我們通常所說的 Jordan 標準型理論) 的基本性貢獻, 而這是矩陣論的基石。第二, Weierstrass 通過引入分析的技巧 (攝動法) 處理退化 (不可逆) 矩陣, 從而使得對矩陣論做嚴格的數學研究成為可能。

Hawkins 進一步指出, 從某種程度上說, 雖然 C. Jordan (1838∼1922) 也取得了與 Weierstrass同樣的成就, 但是就各自的工作對後世的影響來說, 作為十九世紀數學發展的核心 人物的 Weierstrass, 其影響 (特別是在矩陣論方面通過他的學生 Frobenius (1849∼1917)⁹ 的推進) 要大得多。因此, 他認為 Weierstrass 是當之無愧的矩陣論之父。

牽扯到歷史的話題總難免有一點沉重和不肯定, 我們還是來考慮更為輕鬆易懂的具體數學吧!

先來復習一下線性代數中關於矩陣的標準型方面的一些經典結果, 我們從 Jordan 標準型 開始。 Jordan 標準型考慮的是一個複方陣 A 在相似變換 A → P⁻¹AP 下的標準型, 如前所述, 這裏的基本結果屬於 Weierstrass 與 Jordan, 我們表述如下¹⁰:

基本結果1: 設複方陣 A 的初等因子為 (λ − λ1)^m¹, . . . , (λ− λr)^m^r, 則 A 相似於一個下述

9關於 Frobenius 的數學工作的一個全面介紹, 可以參見 Hawkins 的新著, The Mathematics of Frobenius in Context, Springer, 2013.

10這個定理幾乎可見於所有的線性代數或矩陣論的教材, 特別的, 見華羅庚[33]中 p. 57 定理1, 那裏沒有給出證明, 對此我們推薦 [14]一書在附錄A2 中給出的證明。

(7)

形式的准對角矩陣¹¹

J = J_m₁(λ₁)⊕ · · · ⊕ Jmr(λ_r), 這裏

Jm(λ) =







λ 1 0 · · · 0 0 λ 1 · · · 0 ... ... . .. ... 0 ... ... λ 1 0 0 · · · 0 λ







∈ M(m, C),

而且 J 由 A 唯一確定, 至多在對角塊之間相差一個置換。

J_m(λ) 稱為 Jordan 塊, 這些 Jordan 塊是由 A 唯一確定的。

定理1有一個實數版本, 即實 Jordan 標準型, 見華羅庚[33]中 p. 58 定理 2。

需要指出的是, 方陣之間的相似關係實際上有著極其自然的幾何背景: 基本的洞察是, 方陣 (或一般的矩陣) 其實是作用在向量空間之間的線性變換的代數描述。因此, 從幾何的觀點來看, 線性空間與線性變換才是第一位的, 而線性變換在線性空間給定的一組基下的矩陣表示是第二位的 — 因為前者是內蘊的, 而後者則依賴於所參考的那組基的選取。這個依賴關係就體現為, 同一個線性變換在兩組基底之下對應的方陣是相似的。因此, 當我們將方陣視為線性變換 (方陣 A 對列向量的乘法給出一個線性變換) 時, 必須考慮方陣之間的相似關係。這也就是相似 關係之所以特別重要的原因。

另一方面, 方陣還可以視為雙線性型。對於方陣 A, 我們可以定義雙線性型 fA(x, y) = x^′Ay, 其中 x, y 為列向量, x^′ 表示 x 的轉置。容易看出, 方陣 A 與 B 決定的雙線性型 fA

與 fB 等價 (雙線性之間的等價如何定義是自然的) 當且僅當存在可逆矩陣 P , 使得 P^′AP = B。這就引出了矩陣相合的定義: 兩個方陣 A 與 B 稱為相合的, 如果存在可逆矩陣 P , 使得 P^′AP = B。因此, 當我們將方陣視為雙線性型時, 一個頭等重要的問題就是確定矩陣在相合 變換 A → P^′AP 下的標準型。通常我們只考慮對稱的或反對稱的雙線性型¹²。所以, 對應的問題就一分為二: 分別確定對稱矩陣與反對稱矩陣在相合下的標準型。在反對稱的情形, 結果比較簡單, 我們有下述一般結果:

基本結果2: 設 A 為複 (或實) 反對稱矩陣, 則 A 複 (或實) 相合於一個下述形式的准對角矩 陣

J₂⊕ · · · ⊕ J2

| {z }

k

⊕0,

11我們用記號 A¹⊕ · · · ⊕ Aⁿ表示對角塊依次為 A¹, . . . , An的准對角陣。

12一般問題由 V. V. Sergeichuk 在 Classification problems for system of forms and linear mappings, Math. USSR, Izvestiya 31 (3) (1988), 481-501中解決。

(8)

這裏

J₂ = (

0 1

−1 0 )

, 而 k 由 A 唯一確定。

在對稱矩陣的情形, 複矩陣與實矩陣的情形有所不同, 對應的結果分別為:

基本結果3: 設 A 為複對稱矩陣, 則 A 相合於一個對角陣 [1, . . . , 1| {z }

r

, 0, . . . , 0], 這裏 r 由 A 唯一確定。

基本結果4: 設 A 為實對稱矩陣, 則 A 實相合於一個對角陣 [1, . . . , 1| {z }

p

,−1, . . . , −1| {z }

q

, 0, . . . , 0], 這裏 p, q 由 A 唯一確定。

上述兩個結果實際上是關於複 (或實) 的二次型在等價關係下的標準型結果, 而且後一結 果就是著名的 Sylvester 慣性定理 (其中p, q 分別稱為正、負慣性指數), 它是解析幾何中討論 二次曲線與二次曲面的仿射分類的代數基礎。

為了進一步研究的需要, 我們需要獲得矩陣在某種特定的變換下的標準型。實際上, 這樣的問題極為常見。例如, 如果給定的空間 (不妨設是實的) 帶有一個度量因而成為了歐幾里得空間, 那麼我們所考慮的相似與相合應分別代之以實正交相似與實正交相合, 例如, 此時的基本結果 4 應代之以下述 :

基本結果5: 設 A 為實對稱矩陣, 則 A 實正交相合於一個對角陣 [λ1, . . . , λ_n],這裏 λ1, . . . , λ_n 由 A 唯一確定, 至多相差一個置換。

用二次型的語言, 上述結果相當於給出了實二次型的所謂的規範型, 這一結果是解析幾何中討論二次曲線與二次曲面的歐幾里得分類的代數基礎。

注意到, 因為一個矩陣為正交矩陣當且僅當 P⁻¹ = P^′, 因此上述結果又可以表為下述等價形式:

基本結果6: 設 A 為實對稱矩陣, 則 A 實正交相似於一個對角陣 [λ1, . . . , λ_n],這裏 λ1, . . . , λ_n 由 A 唯一確定, 至多相差一個置換。

基本結果6即關於實對稱矩陣的譜定理, 這是線性代數中最重要的一個定理。同樣的, 對實反對稱矩陣有一個類似的譜定理, 我們敘述如下:

基本結果7: 設 A 為實反對稱矩陣, 則 A 實正交相似於一個下述形式的准對角矩陣 µ₁J₂⊕ · · · ⊕ µkJ₂ ⊕ 0,

這裏 µ1, . . . , µ_k 由 A 唯一確定, 至多相差一個置換。

(9)

同樣的, 我們可以將基本結果7用正交相合的語言表述 (只需在基本結果7中的相似替換為相合), 從略。

如果我們考慮的不是實歐幾里得空間而是複的歐幾里得空間 (即酉空間), 則考慮複矩陣在酉相似與酉相合下的標準型是自然的。事實上, 關於酉相似, 我們有下述極為重要的結果 (正規矩陣的譜定理):

基本結果8: 設 A 是正規矩陣, 則 A 酉相似於一個對角陣 [λ1, . . . , λn], 這裏 λ1, . . . , λn 由 A 唯一確定, 至多相差一個置換。

回憶起, 一個方陣 A 稱為正規的, 如果 A 與其共軛轉置 A^′ 可交換。特別的, Hermite 矩 陣 (A^′ = A)與酉矩陣 (A^′ = A⁻¹)都是正規矩陣, 因此基本結果8事實上包含了 Hermite 矩 陣與酉矩陣的譜定理作為特例。注意, 斜 Hermite 矩陣 (A^′ =−A) 與 Hermite 矩陣之間僅 僅相差一個虛數單位因子 i, 因此我們只需考慮 Hermite 矩陣。 Hermite 矩陣的譜定理在量 子力學中具有基本的重要性。¹³

Hermite 矩陣與酉矩陣事實上與複數域 C 的共軛自同構密切關聯。事實上, 對於一個複 矩陣 A, 我們可以有兩種方式¹⁴將它視為作為線性空間上的幾何變換 (或二元函數): 一種是視為線性變換 (或雙線性型), 一種是視為共軛線性變換 (或線性-共軛線性型)。在後一種觀點下, 矩陣 A 所代表的幾何變換與二元函數分別是 x → Ax 與 gA(x, y) = x^′Ay; 特別的, Hermite 矩陣對應著 Hermite 型。

因此, 對於一個複矩陣, 除了相似與相合兩類變換以外, 還有可以稱之為共軛相似與共軛 相合的兩類變換:A → P⁻¹AP 與 A → P^′AP。

對於共軛相合變換, 如果僅限制於考慮 Hermite 矩陣, 則我們有一個類似 (於實對稱矩陣) 的慣性定理:

基本結果9: 設 A 為 Hermite 矩陣, 則 A 共軛相合於對角陣[1, . . . , 1| {z }

p

,−1, . . . , −1| {z }

q

, 0, . . . , 0], 這裏 p, q 由 A 唯一確定。

關於複矩陣在共軛相似變換下的標準型的結果, 在通常的線性代數教科書甚至矩陣論的專著中都交代得很少, 但相關的結果對於幾何學的研究非常有用 (例如, 見[9])。這一標準型結果 實際上直到1937∼1938年才為 Jacobson, T. Nakayamana (部分工作是與 K. Asano 合作 完成), J. Haantijes 等得到。後來, 許寶騄 (1955年)¹⁵與 Y. P. Hong (1984年) 又重新發現

13這在量子力學發展初期給人的印象是極為深刻的, 正如量子理論的偉大先驅 N. Bohr 在 1925 年的題為原子理論和力學的演講 (見[3, p.310])中所說的: 將使數學界感興趣的是, 由高等代數學創立的那些數學工具在新量子力學的合理表述中起到了如此重要的作用。

例如, 由 Born 和 Jordan 得出的 Heisenberg 理論中那些守恆定律的普遍證明, 是建立在可以追溯到 Cayley 並由 Hermite 特別發展了的矩陣論的基礎上的。可以期望, 力學和數學相互促進的一個新時代已經開始了。

14這個觀點從射影幾何學的角度來看是自然的, 廣義的射影變換實質上同時包含線性變換與共軛線性變換。

15實際上, 這一標準型結果在許以超[79]第7 章第 4 節中有詳細的表述, 作者相當於改編了許寶騄的論文。

(10)

了這些結果。這一結果本身當然具有基本的重要性, 但考慮到這些工作發生的時間, 可以看出這一結果對華羅庚的研究工作沒有影響, 因此我們略去不提。

有必要指出的是, 矩陣的相似 (similarity) 與相合 (congruence) 概念是 Frobenius 首次提出的, 而且是標準的。共軛相似在許寶騄那裏稱為複相似 (而 Y. P. Hong 稱之為餘相似 (consimilar)), 我們堅持用共軛相似這個稱謂。共軛相合在華羅庚那裏 ([33, p.141]) 稱為相聯(conjunctive) 相合, 遵循華羅庚, 往後我們改稱共軛相合為相聯。

最後, 我們還要介紹一個在矩陣論的發展過程中起著重要作用的關鍵性結果。該結果屬於 Frobenius, 他當時利用這一個結果解決了歷史上著名的相合變換問題 (congruent transfor- mation problem)。下面我們對這一問題做簡要的介紹。

我們知道, 事實上, 對於一般的矩陣 (不必是方陣), 還有一類更簡單的變換, 即相抵 (Frobe- nius 稱之為等價) 變換: A → P AQ, 其中 P, Q 可逆。對此, 我們也有相當的標準型結果 (這 裏我們只考慮方陣)。

基本結果10: 設 A 是一個複 (或實) 矩陣, 則 A 相抵於一個對角陣 [1, . . . , 1| {z }

r

, 0, . . . , 0],這裏 r 由 A 唯一確定。

事實上, 結果中的 r 是矩陣 A 的秩。因此, 這一結果相當於說, 秩是矩陣在相抵變換下的 完全不變量。另一方面, 根據基本結果2與3, 對於複的對稱 (或反對稱) 矩陣, 秩也是在相合變換下的完全不變量。因此, 我們立即可以得出這樣的結論: 兩個複對稱 (或反對稱) 矩陣相抵當且僅當它們相合。注意到, 相合的概念比相抵強, 因此必要性是平凡的。而 Frobenius 在 1896 年提出的相合變換問題就是, 要直接論證充分性。即要從兩個複對稱矩陣相抵推出它們相合, 這就是相合變換問題這一名稱的由來。 Frobenius 以下述結果 (這一結果本質上不屬於矩陣的標準型結果, 以示區別, 我們稱之為基本引理) 為基礎對這一問題給出了一個漂亮的解答。

基本引理1: 設 A 是一個複方陣, 且 det A ̸= 0。設 A 的極小多項式的次數為 m, 則存在一個 m− 1 次的多項式 χ(z), 使得 [χ(A)]² = A。

Frobenius對上述結果的證明建立在一個關於多項式的結果上, 這個結果值得單獨提出來, 因為該結果 (以及上述基本引理1) 的一個實版本後來為華羅庚得到 (見 §3.2 引理1與 §3.5 引 理 4 以及 §3.6 引理5)。

基本引理2: 設 ψ(z) 是一個 m 次首一複係數多項式且 ψ(0) ̸= 0, 則存在一個 m − 1 次首一 多項式 χ(z) 使得 χ(z)²− z 被 ψ(z) 整除。

關於這兩個基本引理的證明以及對相合變換問題的應用, 我們提請有興趣的讀者參考[17], Hawkins 在那裏給出了完整的討論。

正如 Hawkins 所指出的, Frobenius 的相合變換問題源於 Weierstrass 與 L. Kronecker

(11)

(1823∼1891) 對於矩陣對的標準型的研究。例如, Weierstrass 研究了矩陣對 (A1, A2) 在相 抵變換 A1 → P A1Q, A₂ → P A2Q (其中 P, Q 為可逆矩陣) 下的標準型。雖然這個問題也具有基本的重要性, 但是我們就此打住不再展開。

對於矩陣對的標準型理論的歷史與現狀, 我們推薦 P. Lancaster 與 L. Rodman 最近合寫的兩篇文章[40]與 [41]以及他們與 I. Gohberg 合著的書 [14], 這些文獻同時表明了, 矩陣標準型是一個豐富的課題。從某種意義上來說, 這個課題正是華羅庚 (與我們將在第四節介紹的 Williamson) 工作的延續與開拓。

3. 華羅庚的標準型工作

之前我們已經介紹了關於標準型的一些經典結果, 這裏我們將介紹華羅庚本人在這方面的一些貢獻。

前面所述的經典工作理所當然地被 Turnbull-Aitken, MacDuﬀee 等作者收入到 1930 年代出版的矩陣論專著[49][59]中。作為 Turnbull-Aitken 的忠實讀者 (見前文所引徐利治的話), 華羅庚必定對這些經典工作瞭如指掌。事實上, 部分結果後來被華羅庚收入到他編寫的矩陣論教材[33, pp.168–171]中。在該書第173頁, 華羅庚寫道:

我們有了一批群: 正交群、辛群、酉群; 有了一批被分類的對象: 對稱方陣、反稱方陣、Hermite 方陣、正交方陣、辛方陣、酉方陣。因此出現了一系列的問題, 在某一個特定的群下, 把每種特定的方陣分類。例如, 對稱方陣的正交分類、辛分類、酉分類等。如果再加上 “數的範圍”, 就出現了種種問題。關於這些問題的專門研究, 我不在此一一列舉了。

事實上, 本節的主要內容就是對華羅庚的這段話的內容的一個充分發揮。華羅庚在這裏所謂的分類, 其實與標準型或典範型 (canonical form 或 normal form) 同義。

3.1. 複對稱矩陣與反對稱矩陣在酉相合下的標準型 [23]

在 1944 年發表的第一篇關於多元複變函數的論文[23]中, 華羅庚得到了複對稱矩陣與反對稱矩陣在酉相合下的標準型 (見[23]中 pp.480–481 定理 5 與定理 7):

定理1: 設 Z 是一個 n 階可逆複對稱矩陣, 則存在酉矩陣 U 使得 U^′ZU = [µ₁, . . . , µ_n], 這裏 µ1, . . . , µ_n 是矩陣 ZZ 的特徵值的正平方根。

定理2: 設 Z 是一個 n 階可逆複反對稱矩陣, 則存在酉矩陣 U 使得 U^′ZU = µ₁J₂⊕ · · · ⊕ µkJ₂,

(12)

其中 µ1, . . . , µk 為 −ZZ 的特徵值的正平方根。

事實上, 定理1是所謂的 Takagi 分解, 這個結果最早由日本數學家 T. Takagi (高木貞 治, 1875∼1960) 在 1924 年發現, 之後又相繼被 N. Jacobson (1910∼1999), Siegel, 華羅 庚, I. Schur (1875∼1941) 等重新發現, 關於其歷史可以參見[20]。特別值得一提的是, 楊振 寧在 1962 年的文章 [82] 中也獨立地發現了定理 2 並將它應用于量子統計力學。注意到定理1 與定理2中的 µi 實質上是矩陣 Z 的奇異值 (即 ZZ^′ 的各個特徵值的正平方根)。

我們只證明定理1, 定理2類似可證 (一個略微不同的幾何證明可見[73, pp.117–119])。華羅庚的證明比較麻煩, 下述簡單證明屬於 Siegel[53, pp.14–15]。

定理1的證明: 令 W = [µ1, . . . , µ_n]。因為 ZZ 為 Hermite 矩陣, 所以存在酉矩陣 U1 使 得 U1ZZU₁^′ = W²。於是矩陣 U1ZU₁^′ = F 是對稱矩陣, 而且 F F = W²。設 F1, F2 分別 是矩陣 F = F1 + iF₂ 的實部與虛部。因為 W 是實的, 所以我們得到 F1F₂ = F₂F₁; 即這 兩個實對稱矩陣 F1 與 F2 是可交換的。這就證明了存在一個實正交矩陣 D 使得 D^′F₁D 與 D^′F₂D 同時為對角陣。因此 D^′F D = R 也為對角陣 [r1, . . . , r_n], 而且 RR = D^′W²D。因 此數 rkr_k(k = 1, . . . , n)是 µ²1, . . . , µ²_n 的一個置換, 我們顯然可以假定 rkr_k = µ²_k。

令 U2 = [√

r1

µ1, . . . ,√

rn

µn], 則 U2 為酉矩陣而且 U₂^′W U₂ = R。令 U = U2D^′U₁,則有 U ZU^′ = U₂D^′U₁ZU₁^′DU₂^′ = U₂D^′F DU₂^′ = U₂RU₂^′ = W ; 證畢。

注記: 華羅庚在[23]中 p.481 的注記中指出, 定理1與定理2可以毫無任何本質困難地推廣到 Z 不可逆的情形。 Siegel 的上述證明只考慮了 Z 可逆的情形, 然而他的敘述 ([53]中 p.12 引理1) 卻沒有附加這個限制條件。很明顯, Siegel 也認為, 這個推廣是微不足道的。我們留給有興趣的讀者。

3.2. Hermite _{矩陣對的相聯標準型與} Hermite 矩陣在辛相聯下的標準型 [24]

在[23]的續篇[24]中華羅庚將一個原始的幾何問題化歸為下述代數問題 — Hermite 矩陣 在辛相聯下的標準型問題, 並解決了後一個問題。兩個 2n 階 Hermite 矩陣 H1 與 H2 稱為辛 相聯的, 如果存在辛矩陣 P 使得 P H1P^′ = H2。回憶起一個 2n 階矩陣 P 稱為辛矩陣, 如果 滿足 P JP^′ = J , 其中

J = (

0 I

−I 0 )

域 F 上所有 2n 階辛矩陣構成一個群, 稱為辛群¹⁶, 記為 Sp(2n, F )。

華羅庚通過解決另一個標準型問題 — 即一對 Hermite 矩陣在相合下的標準型 — 而求 出 Hermite 矩陣在辛相聯下的標準型。 Hermite 矩陣對 G1, G₂ 與 H1, H₂ 稱為相聯的, 如

16記得曾經聽老師說, 辛群的中譯名由華羅庚確定, 除此之外, 酉群的譯名也是華羅庚確定的。

(13)

果存在一個可逆矩陣 P , 使得 P G1P^′ = H₁, P G₂P^′ = H₂。關於 Hermite 矩陣對的分類問題的討論在此前確實有很多工作。例如, 華羅庚在[24]中 p.544 的腳註中就指明了他當時在國內見到一些相關文獻, 其中有 Dickson[6], MacDuﬀee[49], Turnbull-Aitken [59], 以及 Logsdon 與 Muth 的兩篇文章。他指出, 所有這些文獻中的處理都有錯誤, 有必要補救這個理論。¹⁷ 他的補救基於下述有趣引理 (見[24, p. 545], 請參照 §2 基本引理2):

引理1: 設 q(x) 是一個實係數首一多項式, 沒有小於等於零的根, 則存在一個實係數多項式 χ(x) 使得 χ(x)²− x 被 q(x) 整除。

由於這個引理本身的重要性, 我們在此錄出華羅庚的證明如下。¹⁸ 證明: 設

q(x) =

∏s i=1

(x− ai)^lⁱ

∏t j=1

((x− αj)(x− αj))mj

, 其中 ai > 0, α_j 是虛部不等於 0 的複數。

第一步首先證明引理對多項式

q(x) = (x− a)^l 成立。事實上, 引理對 l = 1 成立, 因為此時 χ(x) =√

a 是一個解。假定對 l − 1 ≥ 0 我們有 一個實係數多項式 χl−1(x) 使得

χ²_l₋₁(x)− x = (x − a)^l⁻¹λ(x), 這裏 λ(x) 是一個實係數多項式。顯然 χl−1(a)̸= 0。於是

χ_l(x) = χ_l₋₁(x)− 1 2

λ(a)

χl−1(a)(x− a)^l⁻¹ 滿足我們的要求, 因為

χ²_l(x)− x ≡ χ²l−1(x)− x − λ(a)

χ_l₋₁(a)χl−1(x)(x− a)^l⁻¹

≡(

λ(x)− λ(a)

χ_l₋₁(a)χ_l₋₁(x) )

(x− a)^l⁻¹

≡ 0 (mod (x − a)^l).

17根據 Turnbull [58]的說法, 早在1930 年代, Williamson 也發現了同樣的問題, 但是他把補救的任務留給他的學生 G. R. Trott 作為博士論文的主題, 參見[56]。此外, Turnbull 本人在 1935 年也發表了一篇文章[57]修正了他與 Aitken 合寫的《矩陣標準型理論引論》中的相關錯誤, 在文中 (見[57]中 p. 233 的腳註) 他曾對 Williamson 表示感謝。

18正如 H. Rademacher (1892∼1969) 在《數學評論》上指出的 (見 MR0011134 (6,124c)), 該文含有許多討厭的印刷錯誤 (The paper contains quite a number of bothersome misprints),此處我們已經修正。需要指出的是, 這裏所討論的華羅庚的文章基本上都是在抗日戰爭時期的西南聯大完成的, 當時條件艱苦, 華羅庚在飛機轟炸中甚至遭遇了死裏逃生 (見[62]中第29 節劫難), 所以即便華羅庚出現很多書寫錯誤, 也完全可以理解。

(14)

第二步證明引理對

q(x) =(

(x− α)(x − α))l

成立。事實上, 對 l = 1, 多項式

χ(x) = 1

√2|α| + α + α(x +|α|) 滿足條件, 因為 2|α| + α + α > 0 而且

χ²(x)− x = 1

2|α| + α + α(x²+ 2|α|x + |α|²)− x

= 1

2|α| + α + α(x− α)(x − α)

≡ 0 (mod (x − α)(x − α)).

假定對 l − 1 ≥ 0 我們有一個實係數多項式 χl−1(x)使得 χ²_l₋₁(x)− x =(

(x− α)(x − α))l−1

λ(x), 這裏 λ(x) 是一個實係數多項式。則可以直接驗證

χ_l(x) = χ_l₋₁(x) +(

(x− α)(x − α))l−1

(bx + c)^l

滿足我們的要求, 這裏實數 b, c 滿足 (b, c 的存在性很容易看出, 因為 α 不是實數且 χl−1(α)̸=

0。)

λ(α) + 2(bα + c)χ_l₋₁(α) = 0.

第三步設 q1(x)與 q2(x)是兩個互素的實係數多項式, 令實係數多項式 χ1(x)與 χ2(x)分別滿足

χ²₁(x)− x ≡ 0 (mod q1(x)) 與 χ²₂(x)− x ≡ 0 (mod q2(x)).

眾所周知, 存在兩個實係數多項式 h1(x) 與 h2(x) 使得 h₁(x)q₁(x) + h₂(x)q₂(x) = 1.

於是, 令

χ(x) = χ₁(x)h₂(x)q₂(x) + χ₂(x)h₁(x)q₁(x) 則有

χ²(x)− x ≡ 0 (mod q(x)).

反覆應用這一過程, 則我們得到了引理。證畢。

(15)

華羅庚將這一引理用於 Hermite 矩陣的特徵多項式 (注意到它是實係數的), 由此最終得到了 Hermite 矩陣對的相聯標準型結果, 即[24] 中 pp.549–550 定理 17 與定理 18。在華羅庚關於矩陣標準型方面的所有工作中, 這一結果的引用率是最高的, 為此我們將完整地敘述這一結果。由於華羅庚原文中的記號有些複雜, 這裏我們參考了I. Gohberg, P. Lancaster, L.

Rodman 在 [14]中 pp.96–97 的敘述:

定理3: 設 G1, G2 是兩個 n 階 Hermite 矩陣, 其中 G2 可逆。則 G⁻¹2 G1 的初等因子具有形 式 (λ−λ1)ⁿ¹, . . . , (λ−λα)ⁿ^α, (λ−λα+1)ⁿ^α+1, (λ−λα+1)ⁿ^α+1, . . . , (λ−λβ)ⁿ^β, (λ−λβ)ⁿ^β, 其中當 q = 1, . . . , α 時, λq 為實數, 而當 q = α + 1, . . . , β 時, λq 不是實數。而且存在一個 n 階可逆矩陣 T 使得 T G1T^′ 與 T G2T^′ 分別具有形式

T G1T^′ = ε1K1⊕ · · · ⊕ εαKα⊕ (

0 K_α+1 K_α+1 0

)

⊕ · · · ⊕ (

0 K_β K_β 0

)

, (1)

T G₂T^′ = ε₁P₁⊕ · · · ⊕ εαP_α⊕ (

0 P_α+1 P_α+1 0

)

⊕ · · · ⊕ (

0 P_β P_β 0

)

, (2)

其中 εq =±1(q = 1, . . . , α), 而

K_q =







0 0 λ_q 0 λ_q 1

0 1 0

0 λ_q 1 ... λ_q 1 0 · · · 0







, P_q =







0 0 1

0 1 0

0 0 0

0 1 0 ... 1 0 0 · · · 0







∈ M(nq,C).

表達式 (1)(2) 由 G1 與 G2 唯一決定, 任意兩個這樣的表達式僅僅相差 (1) 與 (2) 中的對角塊的一個同時置換。

此外, 作者在[14, p. 123]指出, 定理3早在十九世紀末就已經為 Kronecker, Weierstrass 所知, 而且為 Weierstrass 表述為上述形式, 二十世紀上半葉又陸續被 Trott, Williamson, 華羅庚等重新發現。

通過一種迂回的巧妙方式應用定理3, 華羅庚關於 Hermite 矩陣在辛相聯下的標準型結果, 此處不再贅述。需要補充的是, 華羅庚最後指出了, 定理3可直接應用於解決 Hermite 矩 陣 H 在變換 H → P^′HP 下的標準型, 其中 P^′J P = J。這是因為, 存在可逆矩陣 P 使得 P^′J P = J 且 P^′H₁P = H₂ 當且僅當存在可逆矩陣 P 使得 P^′iJ P = iJ 且 P^′H₁P = H₂, 即 Hermite 矩陣對 (H1, iJ ) 與 (H2, iJ ) 相聯。

注記: 華羅庚[24] (以及 Siegel[53]) 中的工作曾被馮康 (1920∼1993) 學派應用到他所開創的 Hamilton 體系的辛幾何算法理論 (見[12]) 中。

(16)

3.3. Hermite 矩陣在正交相聯下的標準型 [25]

在[25]一文中華羅庚解決了 Hermite 矩陣在正交相聯下的標準型問題。兩個 2n 階 Her- mite 矩陣 H1 與 H2 稱為正交相聯的, 如果存在正交矩陣 P 使得 P H1P^′ = H₂。華羅庚研究這個問題是很容易理解的, 因為正交群、辛群、酉群與線性群一起構成四類典型群。華羅庚既然在[24]中考慮了 Hermite 矩陣在辛相聯下的標準型, 那麼以正交群代替辛群考慮同樣的問題是自然的。華羅庚[25]中的主要結果 (該文定理5) 後來重新被 Y. P. Hong 在 1989 年的文章[18]中得到, Hong 的符號和敘述更清晰易懂, 有興趣的讀者可以參見此文。

最後, 我們要特別指出, 華羅庚將他的一般結果應用於確定正交反對合在正交關聯下的標 準型。一個方陣 A 稱為反對合, 如果滿足 AA = ±I, 進一步, 取正號的稱為第一類反對合, 取負號的稱為第二類反對合。如果 A 是第一類正交反對合, 則從條件 AA^′ = I (正交) 與 AA = I (第一類反對合) 立即推出 A 是 Hermite 矩陣, 因此可以對 A 利用 Hermite 矩陣 在正交關聯變換下的標準型結果。同理, 若 A 是第二類正交反對合, 則 iA 是 Hermite 矩陣。

這兩個小結果也許值得一提:

定理4:

(i) 設 A ∈ M(n, C) 是第一類正交反對合, 則存在正交矩陣 P 使得 P^′AP = P⁻¹AP = [1, . . . , 1| {z }

p

,−1, . . . , −1| {z }

q

],

其中 p, q 由 A 唯一確定。

(ii) 設 A ∈ M(n, C) 是第二類正交反對合, 則 n 是偶數, 且存在正交矩陣 P 使得 P^′AP = P⁻¹AP =

( 0 I

−I 0 )

.

注記: 我們之所以不在此敘述華羅庚關於 Hermite 矩陣的正交相聯與辛相聯的標準型, 除了篇幅的考慮以外, 還有一個重要的原因, 就是後來許寶騄[78]與嚴志達、陳雅深[80]分別對此給出了更好的表述與證明。

許寶騄在1957年發表的一篇長文[78]中從一個更一般的角度同時考慮了 Hermite 矩陣在正交相聯與辛相聯下的標準型, 完善了華羅庚結果 (事實上還更正了華羅庚[24][25]中的兩處錯誤)。許寶騄的處理基於 Turnbull[57] 以及他本人在1955年發表的兩篇關於矩陣的標準型的文章[76]與[77]。應該指出, 許寶騄的這些工作是極為重要的, 特別是[76], 這一工作給出了複方陣在共軛相似下的標準型。有一點也許值得一提, 許寶騄對 Turnbull-Aitken 中的《矩陣標準型理論引論》也非常推崇。根據江澤培[39]的回憶, 1947年許寶騄從美國回到北京大學曾用該書 為參考書講授矩陣論的課。如果瞭解到 Turnbull-Aitken 中的 Aitken (1895∼1967) 實際上

(17)

在統計方面作出了不少貢獻, 這就不難理解了。同樣值得指出的是, 許寶騄在矩陣論方面的深厚造詣使得他的統計工作具有獨樹一幟的風格。¹⁹

1958年, 嚴志達、陳雅深[80]採取了幾何化的觀點處理了某一類標準型問題, 包含了華羅庚的相關結果。嚴志達、陳雅深在緒言中寫道:

從代數的觀點來說, 這樣的問題屬於所謂二次型偶理論的一頁, 關於各種形式的二次型偶問題的討論, 由來已早。但是由於近代群論方面的發展, 尤其是所謂對稱黎曼空間的理論, 使得這些問題重新得到新的幾何學的意義。華羅庚先生在他的一系列關於“矩陣幾何”的重要工作中也曾對這樣的問題有過很多的貢獻。特別應該提出的是他的關於准酉空間對稱變換分類的研究 (按: 即[24][25])。 A. I. Mal’cev 在他的《線性代數基礎》一書中利用了所謂“幾何的方法”對於各種不同形式的二次型偶做了比較詳細的討論, 其中自然包括了華先生的一些結果。

3.4. 辛對合與辛反對合的標準型 [26]

在[26]中, 華羅庚給出了複辛矩陣在辛相似下的標準型。 H. Weyl (1885∼1955) 向他指 出, 這一結果已經為 J. Williamson 得到, 因此華羅庚只是簡要陳述了結果 (見 §3.5 定理10) 而沒有給出證明。出於幾何的考慮, 華羅庚將其應用于最簡單的辛矩陣 — 辛對合。按照定義, 一個矩陣 A 稱為對合, 如果滿足 A² =± I。取正號的稱為第一類對合, 取負號的稱為第二類 對合。華羅庚所得到的關於辛對合的下述標準型定理 (見[26]中 pp. 196∼197定理4與定理5):

定理5:

(i) 設 A 是第一類辛對合, 則辛相似於 (

H 0 0 H

) , 其中 H = [1, . . . , 1| {z }

p

,−1, . . . , −1| {z }

q

],這裏 p, q 由 A 唯一確定。

(ii) 任一第二類辛對合一定辛相似於 ( 0 I

−I 0 )

.

19從這一點來說, 與華羅庚、許寶騄一樣, 陳省身的工作中也體現了他扎實的代數功底。如徐利治所透露的 (見[75, p. 64]): 陳省身先生跟人講過, 他搞幾何之所以會比美國的幾何學家高明一點, 就是與他年輕時學過霍爾(H. S. Hall) 與奈特 (S. R. Knight) 合著的《高等代數》(Higher Algebra) 有關係。而美國的不少幾何學家青少年時代都沒有受過計算技巧方面很好的訓練。

(18)

華羅庚在[26]中 p.200 定理 7 還給出了辛反對合在辛共軛相似下的標準型:

定理6:

(i) 設 A 是第一類辛反對合, 則存在辛矩陣 P 使得 P⁻¹AP =

( 0 iI iI 0

) .

(ii) 設 A 是第二類辛反對合, 則存在辛矩陣 P 使得 P⁻¹AP =

(

0 iH

−iH 0 )

, 其中 H = [1, . . . , 1| {z }

p

,−1, . . . , −1| {z }

q

],這裏 p, q 由 A 唯一確定。

華羅庚將定理6的證明歸結為他早先的文章中關於 Hermite 矩陣的辛相聯標準型的一個 簡單應用。這裏基本的觀察有兩點: 第一, A 是第一類 (第二類) 辛反對合當且僅當 iJA (JA) 是 Hermite 矩陣; 第二, A 與 B 辛共軛相似當且僅當 JA 與 JB 辛關聯。因此, 可以先通過 應用 Hermite 矩陣的辛相聯標準型得出 iJA (JA) 的標準型, 再由此得到 A 在辛共軛相似 之下的標準型。

注記1: 華羅庚後來在關於典型群的文章[27] 中將定理 5(i) 推廣到一般的特徵不等於2的域, 也見於華羅庚與萬哲先合著的《典型群》第十二章 (那裏給出了定理5在任意域上的推廣)。應該指出, 定理 5(i) 之所以可以推廣到一般的域, 是因為本質上這個結果是幾何的。事實上, 在華羅庚之前, J. Dieudonn´e 就用幾何的方法證明了這一結果, 見[7] 中的敘述與所引的文獻。最近, S. Beigi 與 P. W. Shor[2]又重新發現了《典型群》中所述的關於特徵等於2的辛對合的標準型, 他們是將華羅庚[27] 中的方法 (針對特徵不等於2的域) 平移到特徵等於2的情形, 這實際上也就是《典型群》一書中所採用的方法。

注記2: Dieudonn´e 所應用的幾何方法的優越性在此值得重提。也許, 用 E. Artin 的一句話來評論 Dieudonn´e 與華羅庚的差異所在是合適的: 我的經驗是, 一個用矩陣進行的證明, 如果你拋開矩陣的話往往可以使這個證明縮短一半。至少在此處, 對於考慮對合這個具有幾何內涵的對象來說, 用幾何的方法更自然。事實上, 在矩陣的標準型工作方面, 幾何方法是極為有力的方 法, 這一方法首先由 A. I. Mal’cev (1909∼1967) 在他寫的教材[51]²⁰中普及, 其影響在二十世紀下半葉的關於矩陣的標準型的文獻中幾乎隨處可見, 例如[14]與[55]。

注記3: 華羅庚在 1945∼1947年以矩陣幾何為題發表了三篇文章, 其中這裏所討論的文章事 實上是幾何風味最濃的一篇。華羅庚在文章中提出的對辛對合的研究引發了兩個方面的幾何研

20該書譯者為柯召, 他還翻譯了蘇聯數學家 F. R. Gantmacher 的專著《矩陣論》。

(19)

究。一方面, 華羅庚曾指導孫本旺研究所有辛對合構成的流形的幾何, 孫本旺[54]得到了一些成果, 並與 ´E. Cartan 的幾何工作聯繫起來。另一方面, 華羅庚的這一工作影響了黃樹棠、吳大 任、楊淦等在姜立夫 (1890∼1978) 所開創的圓素與球素的幾何學方面的工作[34][35][36][37]。

3.5. 一對反交換的辛對合與正交對合的標準型及其應用 , _{兩兩反交換的辛對合集} 的標準型及其應用 [26]

華羅庚在文章[26]中還 (隱含地) 給出了一對反交換的第二類辛對合的標準型與一對反交換的第一類正交對合的標準型:

定理7: 設 A1, A₂ ∈ Sp(2m, C) 滿足

A²₁ = A²₂ =−I, A1A2 =−A2A1, 則存在 P ∈ Sp(2m, C) 使得

P A₁P⁻¹ = (

iI 0 0 −iI

)

且 P A₂P⁻¹ = (

0 I

−I 0 )

. 定理8: 設 B1, B₂ ∈ O(n, C) 滿足

B₁² = B₂² = I, B₁B₂ =−B2B₁, 則 n = 2m 且存在 P ∈ O(n, C) 使得

P B₁P⁻¹ =

( I 0 0 −I

)

且 P B₂P⁻¹ =

( 0 I I 0

) .

華羅庚是在求解一個有趣的矩陣問題的過程中獲得這些標準型結果的, 這個問題是:

對任意給定的正整數 n, 求 r 的最大值, 使得存在 r 個 n 階辛矩陣 A1, . . . , Ar 滿足下述關係:

A²_i =−I, A_iA_j =−AjA_i (i = 1, . . . , r).

因為計算上的疏忽, 華羅庚未能徹底解決上述問題。²¹ 但是, 按照華羅庚的思路, 不難完善這一工作。事實上, 為了解決他原先的問題, 只需要求出一對反交換的第二類正交對合與一對反交換的第二類辛對合的標準型²²:

21這一點首先由黃用諏 (1913∼2004) 在[71]中指出。

22此處定理 9 與定理 10 由筆者參照華羅庚的工作依葫蘆畫瓢給出。請讀者原諒, 在敘述華羅庚的這部分工作時, 我們事實上作了少量補充與修改。但是唯有如此, 才能使讀者對這一主題獲得較完整的認識。

(20)

定理9: 設 A1, A2 ∈ O(n, C) 滿足

A²₁ = A²₂ =−I, A₁A₂ =−A2A₁, 則 n = 4l 且存在 P ∈ O(n, C) 使得

P A₁P⁻¹ = (

0 I

−I 0 )

且 P A₂P⁻¹ = (

J 0 0 −J

) .

定理10: 設 B1, B2 ∈ Sp(2m, C) 滿足

B₁² = B₂² = I, B₁B₂ =−B2B₁, 則 m = 2l 且存在 P ∈ Sp(2m, C) 使得

P B₁P⁻¹ = (

0 iJ iJ 0

)

且 P B₂P⁻¹ = (

0 −J J 0

) .

一旦有了定理7−10, 就不難得到華羅庚論文[26]中 pp.220–221 定理35的下述修正:

定理11: 令 n = 2^qn₀, 這裏 n0 是奇數。設 P (n), R(n) 分別表示使得方程

A²_i =−I, AiAj =−AjAi, (i = 1, . . . , r) (3) 在 Sp(n, C) 與 O(n, C) 中有解的最大整數 r, 設 Q(n), S(n) 分別表示使得方程

B²_i = I, B_iB_j =−BjB_i, (i = 1, . . . , r) (4) 在 Sp(n, C) 與 O(n, C) 中有解的最大整數 r。則有

P (n) =











2q− 1 若 q ≡ 0 (mod 4) 2q + 1 若 q ≡ 1 (mod 4) 2q 若 q ≡ 2 (mod 4) 2q− 1 若 q ≡ 3 (mod 4)

Q(n) =











2q− 1 若 q ≡ 0 (mod 4) 2q− 1 若 q ≡ 1 (mod 4) 2q + 1 若 q ≡ 2 (mod 4) 2q 若 q ≡ 3 (mod 4)

R(n) =











2q 若 q ≡ 0 (mod 4) 2q− 1 若 q ≡ 1 (mod 4) 2q− 1 若 q ≡ 2 (mod 4) 2q + 1 若 q ≡ 3 (mod 4)

S(n) =











2q + 1 若 q ≡ 0 (mod 4) 2q 若 q ≡ 1 (mod 4) 2q− 1 若 q ≡ 2 (mod 4) 2q− 1 若 q ≡ 3 (mod 4) 事實上, 定理11是下述兩個引理 (它們一起補正了華羅庚 [26]中 p.221 的 (76)−(78) 與 (79)−(81)) 的簡單推論。

華羅庚關於矩陣標準型的工作介紹