• 沒有找到結果。

機率論為何要建立在機率空間上面

N/A
N/A
Protected

Academic year: 2022

Share "機率論為何要建立在機率空間上面"

Copied!
13
0
0

加載中.... (立即查看全文)

全文

(1)

機率論為何要建立在機率空間上面 ?

蔡聰明

一. 一些問題的提出

機率論是研究隨機現象的學問。 它要對 隨機現象建立機率模型, 並且求算有趣事件 的機率及推演出各種極限定理、 機率法則, 研 究隨機過程等等。

機 率 模 型 長 得 什 麼 模 樣? 它的 理 型 (ideas and forms) 是什麼?

今日大家都會說, 機率論的出發點是機 率空間 (Ω, F, P ), 其中 Ω 為樣本空間 (sample space), 代表隨機實驗的所有可 能發生結果; F 為事件 (events) 所構成 的 σ 代數 (σ-algebra); P 為一個機率測 度 (probability measure), 用來度量事件 發生的 「確定程度」 (the degree of cer- tainty)。「probability」 一詞日文翻譯成 「確 率」, 我國早先的譯名是 「或然率」、「概率」, 但 目前通行的譯名是更佳的 「機率」。

機率空間的理型是怎麼來的呢? 它當然 是長久演化與試誤 (trial and error) 的產物, 經過人為的選擇與創造才得到的。 從長期累 積的直觀經驗知識 (intuitions) 出發, 提煉

出概念 (concepts) 與公理, 最後結晶為理論 (theory)。 事實上, 任何概念或理論都是這樣 產生的, 用來承載或組織豐富的、 既有的經驗 知識, 進一步又可當作開拓新知的根據地。

機率論的公理化醞釀了約 30 年, 從 1900年到1993年, 正值現代數學公理化思潮 的高峰期。

機率的概念起源於賭局 (games of chance), 從盤古開天地以來就出現, 長 久不斷地累積經驗知識, 一直到 1713 年 J.Bernoulli 提出弱大數法則, 標誌著數學 機率論的誕生。 接著又有 De Moivre(1718 年) 與 Laplace(1801 年) 的中央極限定理, Gauss的誤差之正規分佈律 (1809 年) 以及 Poisson 極限定理 (1832 年) 等各種機率法 則 (the laws of chance) 之獲得, 其中也出 現了種種詭論 (paradoxes)。 到了 1900 年, 公理化的時機成熟, Hilbert提出著名的23個 問題, 其中第6個就是關於物理學與機率論的 公理化問題。 於是許多數學家開始嘗試解決 機率論的公理化問題, 一方面繼續開拓機率 論的領域, 一方面作各種試驗。 結果在 1933

56

(2)

年才由俄國偉大數學家 Kolmogorov(1903- 1987 年) 完成機率論的公理化 (幾乎跟 Von Neumann 的量子力學公理化同時完成), 提 出機率空間的理型作為機率論的基礎。 從此 機率論作為一個數學理論完全確立。 Kol- mogorov的機率空間模型, 普遍被數學家所 接受。 在這麼單薄的假設下, 居然開展出那麼 豐富的結果, 這是機率論的榮耀。

機率論為何要採用 「機率空間」 的理型?

這樣做有什麼優點? 不這樣做又有什麼缺 點? 還有沒有其它選擇? 取捨的標準何在?

這些問題都是初學公理化機率論的人最 易產生的困惑。 如果回答說, 這樣取的 「機率 空間」 是全測度為 1的特殊測度空間, 使得測 度與積分論的工具都可以搬過來用, 這只是 一個平凡的 (ordinary) 答案, 還是不能解 惑。

Lebesgue在 1902-1903 年就創立測度 與積分論, 為什麼要等到 1933 年 (相差 30 年) 機率論才完成公理化呢? 因此,「機率空 間」 的出現必有更深刻的道理存在, 不論是內 在的或外在的理由。 1900年到1933年之間正 是數學家找尋機率模型的試誤與演化階段。

機率空間的出現, 我們分成四個階段來 討論: (i) 隨機實驗與命題演算算, (ii) 翻 譯成集合論的語言得到初等機率空間之理型, (iii) 用各式各樣的例子來試驗初等機率空 間的理型是否合用, (iv) 最後抽取出 Kol- mogorov 的機率論公理系統。

本文我們要用一些具體的例子來闡明:

機率空間是公理化機率論的最佳選擇。

二. 初等機率空間的出現

甲 . 隨機實驗與命題演算

所謂 「隨機實驗」(random experi- ment) 是指其出現結果有種種可能之實驗, 事先完全無法預料。 例如丟一個銅板 100 次 就是一個隨機實驗。

對於一個隨機實驗, 我們想知道各種有 趣的事象發生的機會大小。 這些事象通常以

「命題」(propositions) 或 「敘述」 (state- ments) 的方式來出現, 例如令 p 表示 「正 面的次數介於 45 次到 58 次之間」, 這就是關 於丟 100 次銅板的隨機實驗之一個事象。 我 們稱 p 為一個隨機命題。

古典邏輯所研究的 「敘述」 都具有明確 的真假值, 不能時真時假或沒有真假值, 但是 在機率論中的敘述則不然。 作隨機試驗下來, 如果丟出 53次正面, 則 p 成立; 如果丟出 40 次正面, 則 p 不成立。 因此, 每一個事象都

「說不準」(uncertainty)。 衡量一個事象真確 的程度就叫做該事象的機率。

假設 p, q, r, · · · 為一族命題, 那麼我們 就可以談論命題的三個運算:

名稱 記號 意義

否定 ∼ ∼ p 表示 「p 的否定」

之命題

或 ∨ p∨ q 表示 「p 或 q」, 即 p、q 至少有一個成立之命題 且 ∧ p∧ q 表示 「p 且 q」, 即

p、q同時成立之命題 這三個運算顯然滿足下列運算律:

(3)

1. 交換律:

p∨ q = q ∨ p, p ∧ q = q ∧ p 2. 結合律:

(p∨ q) ∨ r = p ∨ (q ∨ r) (p∧ q) ∧ r = p ∧ (q ∧ r) 3. 分配律:

p∨ (q ∧ r) = (p ∨ q) ∧ (p ∨ r) p∧ (q ∨ r) = (p ∧ q) ∨ (p ∧ r) 4. 冪等律:

p∨ p = p, p ∧ p = p 5. De Morgan 定律:

∼ (p ∨ q) = (∼ p) ∧ (∼ q)

∼ (p ∧ q) = (∼ p) ∨ (∼ q) 6.雙否定律:

∼ (∼ p) = p 7. 兩值律:

p∨ (∼ p) = 1, p ∧ (∼ p) = 0 其中 1 表恆真命題,0 表恆假命題。

8. 0 與 1 的特性:

p∨ 0 = p, p ∧ 0 = 0 p∨ 1 = 1, p ∧ 1 = p

定義:一族命題 A 滿足上述八條運算律 就叫做一個 Boole 代數 (Boolean algebra), 記為 hA, ∼, ∨, ∧, 0, 1i。

註: Boole(1815-1864) 是自學成功的典範, 他在 1854年出版 “An investigation of the laws of thought”一書, 引入命題演算, 嘗試 將邏輯代數化。 B. Russell 稱譽說:「純數學 是 Boole 發明的。」

乙 . 翻譯成集合論的語言: 初等機率 空間

G. Cantor(1845-1918) 創立集合論, 堪稱為 「數學的法國大革命」。 這是他追究

「無窮」 的產物。 現代數學的特色之一, 就是 一切都要化成集合論的語言來表達。

對於任意非空集 Ω, 令 2 表示 Ω 的 所有子集全體, 將 ∼、∨、∧ 分別解釋為取補 集 c、 取聯集 ∪、 取交集 ∩ 之操作, 再取 0 = ∅, 1 = Ω, 則 h2, c,∪, ∩, ∅, Ωi 形 成一個 Boole 代數。 反過來, M.H. Stone (1963 年) 證明: 對於任何 Boole 代數 A, 必可找到一個集合 Ω, 使得 A 中的命題表現 為 Ω 的子集, 並且 ∼、∨、∧ 表現為集合運算 c、∪、∩, 而成為 2 的一個 Boole 子代數。

對於一個隨機實驗的一族隨機命題所成 的 Boole 代數 A, 令 Ω 表示實驗的所有可 能結果之集合, 將每個命題 p 表現成 Ω 的子 集 A , 亦即使 p 成立的元素所成之集, 叫做 p 的真值集 (truth set), 如下列的對照表:

(4)

命題 真值集

1 Ω

0 ∅

p A

q B

∼ p Ac p∨ q A ∪ B p∧ q A ∩ B

A A

顯然,A ⊂ 2 並且滿足下列性質:

(i) Ω∈ A

(ii) A∈ A ⇒ Ac ∈ A (iii) A, B ∈ A ⇒ A ∪ B ∈ A

亦即 A 包含有宇集 Ω, 並且在取補集與聯 集下具有封閉性。 我們稱這樣的 A 為一代數 (algebra), 其元素叫做事件 (events)。 如果 A∩B = ∅, 則稱 A、B 為互斥 (disjoint) 事 件。

接著是對每一個事件 A ∈ A 引入機率 P(A), 我們自然要求它滿足:

(i) 正性: 0≤ P (A) ≤ 1, ∀A ∈ A (ii) 歸一性: P (Ω) = 1

(iii) 加性: 若 A,B ∈ A 為互斥事件, 則 P (A∪ B) = P (A) + P (B) 我們稱 P 為一個初等機率測度 (an elemen- tary probability measure)。

定義: 一個初等機率空間 (an elemen- tary probability space) 是指三合一空間 (Ω,A, P ), 其中

(i) Ω 為一個非空集, 叫做樣本空間;

(ii) A ⊂ 2 為一個代數, 表事件全體;

(iii) P 為一個初等機率測度。

註: 此地的初等機率測度與初等機率空 間之用語, 我們根據的是 Itˆo [13]的書。 改採

「擬機率測度」與 「擬機率空間」, 也是很好的 用語。

初等機率空間是對一個隨機實驗去蕪存 菁後的初步總結, 是一個很自然的機率模型。

這個理型是否足以承載豐富的機率結果呢?

在既知的結果中, 最重要的是 Bernoulli 的 弱大數法則、De Moivre-Laplace 的中央極 限定理以及 Borel 的強大數法則。 這些都可 以生存在初等機率空間上面嗎?

三. 初等機率空間的試驗

Bernoulli的弱大數法則起源於要澄清:

「丟一個公正銅板, 出現正面的機率是 1/2」

這句話的意思。

為此, 考慮在相同狀況下, 獨立地丟一個 公正銅板 n 次之隨機實驗。 我們為其建立初 等機率空間 (Ωn,An, Pn) 如下:

n ={ω = (ω1, ω2, . . . , ωn) : ωk= H 或 T} 其中 H 表正面 (head),T 表反面 (tail);

An= 2n

由於每一樣本點的機會均等, 故對每一個 ω∈ Ωn, 指定

Pn(ω) = 1 2n

(5)

從而, 對 A ∈ An 指定 Pn(A) = #A

2n

其中 #A 表示事件 A 所含的樣本點個數。

定義 「隨機變數」(random variables) ξk: Ωn→ {0, 1}

如下: 對於 k = 1, 2, . . . , n, 令

ξk(ω) =

1, 當 ωk = H 時 0, 當 ωk = T 時

我們稱 ξ1, ξ2, . . . , ξn 為一個 (有限的) 銅板 序列。 再令

Sn= ξ1+ ξ2+· · · + ξn 則容易證得下面兩個定理:(參見 [2])

定理1: (Bernoulli弱大數法則) 對於任 意 ε > 0, 恆有

n→∞lim Pn(|Sn n − 1

2| ≤ ε) = 1 (1)

定理2: (De Moivre-Laplace 中央極 限定理) 對任意 x ∈ R , 恆有

n→∞lim Pn(Sn− n/2

√n/2 ≤ x)

= 1

√2π

Z

x

−∞

eu2/2du (2) 因此, 初等機率空間的理型可以承載 Ber- noulli 弱大數法則與 De Moivre-Laplace 中央極限定理。 初步看起來, 似乎很不錯。 這 會是我們所要追尋的理型嗎?

再試驗 Borel 的強大數法則, 這必須 涉及無窮多次丟銅板, 即銅板序列 (coin- tossing sequence)。

定義: 設 (Ω,A, P ) 為一個初等 機率空間。 如果 X1, X2, X3. . . 為定義在 (Ω,A, P ) 上, 取值 {0, 1} 的一列隨機變數, 滿足下列兩個性質:

(i) 同佈性: 對任意自然數n, P (Xn= 0) = 1

2 = P (Xn = 1) (ii) 獨立性: 對任意有限多個自然數 i1 <

i2 < · · · < im 與由 0, 1 所成的有限數列 j1, j2, . . . , jm

P (Xi1= j1, . . . , Xim = jm)

= P (Xi1= j1) . . . P (Xim= jm) 則稱 (Xn) 為一個銅板序列。

我們建造 「丟無窮多次銅板」 的初等機 率空間及銅板序列如下:

取樣本空間

={ω = (ω1, ω2, . . .) : ωk= H 或 T} 對於 A⊂ Ωn, 令

CA={ω ∈ Ω : (ω1, ω2, . . . , ωn)∈ A}

表示以 A 為底在 Ω 中的 「柱集」(cylinder set)。 令

A ={CA: A∈ A, n ∈ N}

表示柱集的全體, 這是一個代數。 對 CA ∈ A, 定義

P(CA) = Pn(A) = #A 2n

(6)

初等機率空間 (Ω,A, P) 之建構 只不過是將有窮多次丟銅板的一連串初等機 率空間 (Ωn,An, Pn), n∈ N 嵌入而已。

接著, 在 Ω∞上定義無窮多個隨機變數:

ξk(ω) =

1, 若 ωk= H , 0, 若 ωk= T ,

k = 1, 2, . . .。 容易驗知 (ξn) 為一個銅板序 列。 令

Sn= ξ1+ ξ2+· · · + ξn

所謂 Borel 的強大數法則是指 P( lim

n→∞

Sn

n = 1

2) = 1 (3) 這成立嗎? 讓我們作分析。 令事件

B ={ limn→∞Sn n = 1

2} 則

B =

\

ε>0

[

k=1

\

n=k

n

Sn

n − 1 2

< ε

o

=

\

m=1

[

k=1

\

n=k

{|Sn

n − 1 2| < 1

m} 再令

Blkm =

l

[

n=k

n

Sn

n − 1 2

< 1

m

o

Bnm =

n

Sn

n −1 2

< 1

m

o

則顯然有 Blkm l→∞

\

n=k

Bnm k→∞

[

k=1

\

n=k

Bnm

m→∞↓ B (4)

其中只有 Blkm ∈ A, 其餘的都經過了取單 調極限, 故都不屬於 A。 因此 (3) 式的左

項沒有意義, 亦即在 (Ω,A, P) 上無法 承載 Borel 強大數法則。 這顯示初等機率空 間的理型似乎不夠用, 尤其是涉及樣本空間 為無窮集的情形。

這並沒有十足的說服力, 因為對於一個 銅板序列, 初等機率空間的造法可以有各種 方式, 也許換個造法就可使 Borel 的強大數 法則成立。

下面我們舉一個奇妙的例子, 這是從 [3]一文中取出來的。 考慮從自然數集 N 中任 取出一數的隨機實驗。 我們可以造一個初等 機率空間, 並且在其上定義出各種銅板序列, 其中有的使 Borel 強大數法則不成立, 也有 的使 Borel 強大數法則成立。

從 N 中任取一數的隨機實驗, 原則上, 每一數被取到的機會均等, 但是由於 #N =

∞ , 故無法對每一點指定相等的機率。 我們 退而求其次, 造一個機率模型保住大家都接 受的常識就好了:

從 N 中任取一數, 那麼

(i) 取到偶數的機率是 12, 取到奇數的機率 也是 1

2;

(ii) 取到 5 的倍數之機率是 1/5;

(iii) 取到 99 的機率是 0;

(iv) 取到的數小於 1000 的機率是 0;

(v) 取到的數落在等餘類 (congruence class)

A(n, r) ={ω ∈ N : ω 除以 n 餘 r}

之中的機率是 1

n, 其中 n ∈ N, r = 0, 1, . . . , n− 1。

我們先造一個保住常識 (v) 的初等機率 空間:

(7)

取樣本空間 Ω = N, , 事件全體 R 為 有窮多個等餘類之聯集全體。 容易驗知 R 為 一個代數, 並且存在唯一的初等機率測度 P , 定義在 R 上, 使得

P (A(n, r)) = 1 n

因此, (Ω,R, P ) 為一個初等機率空間。

其次, 定義銅板序列: 對於 ω ∈ N, 用 二進位法唯一展開成

ω = α1· 20+ α2· 21+ α3· 22+· · · 上式右邊只含有限項, 其中 α1, α2, . . . 皆為 0或 1, 於是 ω 表成二進位法為

ω = · · · α3α2α1

定義隨機變數

Xn(ω) = αn, n ∈ N

設 i1, i2, . . . , in 為 0 或 1 所成的序列, 令 inin−1· · · i1 = i1·20+i2·21+· · ·+in·2n−1 則易驗知

{ ω ∈ N : X1(ω) = i1, . . . , Xn(ω) = in}

= A(2n, inin−1. . . i1)

從而 (Xn) 為定義在 (Ω,R, P ) 上的一個公 正的銅板序列。

對於任意 ω ∈ N , 存在自然數 k0, 使 得對所有 k ≥ k0。 粧有

αk = Xk(ω) = 0。

於是

P ( lim

n→∞

Sn

n = 0) = P (Ω) = 1

從而 Borel 強大數法則不成立, 事實上 {limn→∞ Snn = 12} = ∅。

更有趣的是, 在同樣的初等機率空間 (Ω,R, P ) 上, 定義隨機變數

Yn =

Xn, 當 n 為偶數時, 1− Xn, 當 n 為奇數時, 則易驗知 (Yn) 仍然為一個銅板序列, 並且 Borel 強大數法則成立:

P ( lim

n→∞

Sn n = 1

2) = P (Ω) = 1 進一步, 如果取 i1, i2, . . . 為 0 與 1 所 組成的數列, 使得極限 limn→∞i1+i2+···+in

n

不存在, 定義 Zn=

Xn, 若 in = 0, 1− Xn, 若 in = 1, 則 (Zn) 也是一個銅板序列, 並且

P ( lim

n→∞

Sn

n 不存在) = P (Ω) = 1 對於任何有理數 α, 0≤ α ≤ 1 都可以 在 (Ω,R, P ) 上造一個銅板序列, 使得

P ( lim

n→∞

Sn

n = α) = 1

初等機率空間 (N, R, P ) 雖然奇妙, 但 還是有所不足。 例如單身集等, {2}、{7} 等, 以及 N 的任何有限子集都不屬於R 。 因此, 它並沒有保住所有的常識。

一個改進之道是擴大 R, 並且延拓 P , 這就是下面要介紹的更重要的一個例子。

對於任意子集 A ⊂ N 及 m ∈ N, 令 A[m] ={k : 1 ≤ k ≤ m, k ∈ A}

(8)

如果極限 limm→∞#A[m]m 存在, 則記此極限 值為 P(A), 叫做 A 的算術密度 (arith- metical density)。 令

D = {A ⊂ N : limn→∞#A[m]

m 存在} 表示所有具有算術密度的子集全體。 於是得 到一個三合一空間 (N, D, P), 這是機率式 數論 ( probabilistic number theory) 的出 發點, 結果豐碩。

命題1: (i) N 中的單身集與有窮子集 皆屬於 D 且其機率為 0。

(ii) 等餘類A(n, r)∈ D 且 P(A(n, r)) = 1

n

因此,(N,D, P) 是 (N,R, P ) 的延拓。

證明: (i) 是顯然的。

(ii) 令 A = A(n, r) , 則 m

n − 1 < #A[m] = [m n]≤ m

n 所以1

n − 1

m < #A[m]

m ≤ 1 n

令 m → ∞, 得到 P(A(n, r)) = n1。 因 此,A(n, r) ∈ D。

因此, 上述在 (N,R, P ) 上所定義的 各式各樣的銅板序列都可搬到 (N, D, P ) 上 來, 仍然具有相同的奇異性質。

命題2:

(i) ∅, N ∈ D 且 P(∅) = 0,p(N) = 1,

(ii) A ∈ D ⇒ Ac ∈ D, 且 P(AC) = 1− P(A),

(iii) A, B ∈ D 且 A ⊂ B ⇒ B\A ∈ D, (iv) A1, A2, . . . , An ∈ D 且兩兩互斥 ⇒

S

n

k=1Ak ∈ D。

證明:(i) 與 (iv) 是顯然的。

(ii)A∈ D, 由於 #Ac[m] = m− #A[m], 故

m→∞lim

#Ac[m]

m = lim

m→∞

m− #A[m]

m

= 1− limm→∞#A[m]

m 今因 lim

m→∞

#A[m]

m 存在, 所以 lim

m→∞

#Ac[m]

m 也

存在, 並且

P(Ac) = 1− P (A)。

(iii) 設 A, B ∈ D 且 A ⊂ B 則

#(B\A)[m] = #B[m] − #A[m]

所以 lim

m→∞

#(B\A)[m]

m

= lim

m→∞

#B[m]

m − limn→∞#A[m]

m 存在,

於是 B\A ∈ D。 #

註: 上述命題中的 (iv),「兩兩互斥」 不能 放棄, 有限聯集也不能改為可列聯集。

命題3: D 不是一個代數, 更不是一個 σ 代數。

我們只需舉出 E, F ∈ D, 但是 E ∩ F 6∈ D 就好了。

取 E 為奇數集, 再取

F = {[22n, 22n+1] 中的奇數與

[22n+1, 22n+2] 中的偶數, n ≥ 0}

(9)

則 E = A(2, 1)∈ R ⊂ D 且 P(E) = P (E) = 12

其次證 F ∈ D。 首先觀察到, 對任 意 n ∈ N , 存在 n ∈ N 使得 m ∈ [22n, 22n+1], 並且當 m→ ∞ 時,n → ∞。

在 [1, 2] 中有一個奇數, 在 [22n, 22n+1] 中有 22n−1 個奇數, n = 1, 2, 3, . . .; 在 [22n, 22n+1] 中有 22n + 1 個偶數, n = 0, 1, 2, . . .。 於是

[1 + (20+ 1) + 21+ (22+ 1) +· · · +22n−3+ (22n−2+ 1)]/(22n+ 1)

≥ #F [m]

m

≥ [1 + (20+ 1) + 21+ (22+ 1) +· · · +22n−1+ (22n+ 1)]/(22n+2) 亦即

22n−1+ n + 2

22n ≥ 22n−1+ n + 2 22n+ 1

≥ #F [m]

m ≥ 22n−1+ n + 2 22n+2 1

2 +n + 2

22n ≥ #F [m]

m ≥ 1

2+ n + 2 22n+2 由夾擠原理知

m→∞lim

#F [m]

m = 1 2 因此 F ∈ D。

考慮 E ∩F ={[22n, 22n+1]} 中的奇數, n = 0, 1, . . .}。 我們要證明 limm→∞#(E∩F )[m]m 不存在。 利用歸謬法, 如果該極限存在, 則取 子序列也收歛到同一值。 今取 an = 22n+1, bn = 22n+2,

#(E ∩ F )[an] = #(E∩ F )[bn]

= 21+ 23+· · · + 22n−1, 所以

#(E ∩ F )[an] an

= 1

3− 1 3· 22n

#(E∩ F )[bn] bn

= 1

6− 1 3· 22n+1 從而

n→∞lim

#(E ∩ F )[an] an

= 1 3 6= 1

6

= #(E ∩ F )[bn] bn

, 矛盾。

於是 E ∩ F 6∈ D。 #

因此, (N,D, P) 既不是初等機率空 間, 更不是機率空間。 但是, 它依然可以承載 許多數論上的結果。 參見 Kac 的小書 [7]。

總結上述的例子:

甲、 在初等機率空間 (Ωn,An, Pn), n = 1, 2, . . . , 上可承載 Bernoulli弱大數法則與 De Moivre-Laplace 中央極限定理 。

乙、 在初等機率空間 (Ω,A, P) 上 { limn→∞Sn

n = 1

2} 6∈ A

丙、 在初等機率空間 (N, R, P ) 或非初 等機率空間 (N, D, P) 上可以定義各式各 樣的銅板序列, 使得

{ limn→∞Sn n = 1

2} = ∅; { limn→∞Sn n = 1

2} = Ω;

(10)

{ limn→∞Sn

n = α} = Ω, ∀α 為有理數, 0≤ α ≤ 1;

{ limn→∞Sn

n 不存在} = Ω.

Borel的強大數法則可以成立, 也可以不成 立, 堪稱 「百花齊放」, 結果繁多。

四. Lebesgue 空間上的機率論 之試驗

自從 Lebesgue 創立測度與積分論 後,Lebesgue 空間 ((0, 1], L, µ) 就一直被當 作是開發機率論 (乃至分析學) 的絕佳空間, 其中L 為 (0, 1] 中 Lebesgue 可測集全體,µ 為 Lebesgue 測度。

首先是定義出銅板序列。 對於任意 ω ∈ (0, 1], 作二進位法展開。

ω = 0.ξ1(ω)ξ2(ω)ξ3(ω)· · ·

其中每個 ξn(ω) 都是 0 或 1。 有的數有兩種 展開法, 例如

1

2 = 0.1000· · · = 0.0111 · · · 我們就規定取後者。 於是 (ξn) 就是定義在 Lebesgue 空間 ((0, 1],L, µ) 上的一個銅板 序列。 令 Sn= ξ1+· · · + ξn。

再令 rn(ω) = 2ξn(ω) − 1, n = 1, 2, . . ., 則 rn 取值 −1 與 +1, 叫做 Rademacher 函數。

利用分析學工具, 我們就可以證得下列 諸定理:

定理B: (Borel強大數法則, 1909 年) µ( lim

n→∞

Sn

n = 1 2) = 1

對於 Sn 的漲落 (fluctuation) 之研 究, 有一系列的結果, 最後導致重覆對數法則 (Law of the iterated logarithm) 的產生。

為方便起見, 下面令 Sn= r1+r2+· · ·+rn, 則 Borel 的強大數法則可以改述成:

Sn= o(n) a.s.(殆遍) 由此當然可得

Sn= O(n) a.s.

進一步, 我們有:

定 理4: (Khinchine重 覆 對 數 法 則,1924年)

lim sup

n→∞

Sn

√2n ln ln n = 1, a.s.

註: 在 1929 年 Kolmogorov 再推廣到一般 獨立隨機變數列的情形。

Steinhaus與 Wiener 在 1922 年提出 一個問題: 在調和級數 1 + 12 + 13 +· · · 每 一項之前以丟銅板來加正、 負號, 討論其歛散 行為。 這個問題是往後獨立隨機變數和 (sum of independent ramdom variables) 及隨 機積分 (Wiener 積分與 Itˆo 積分) 理論的發 源地。

定理5: (Rademacher, 1922; Kol- mogorov 與 Khinchine, 1924)

P

n=1Cn 為一個複數項之級數, 則

X

n=1

Cnrn 殆遍收歛 ⇔

X

n=1

|Cn|2 <∞。

(11)

復次,Wiener 在 1923 年將 (Sn) 作連 續化 (考慮銅板越丟越快, 步幅越來越小), 在 Lebesgue 空間上建構出 Wiener 過程 (W (t))t ≥ 0 (或叫做 Brown 運動)。 這是 最重要的一個隨機過程, 是整個現代隨機過 程論的出發點。

結論是: 在 Lebesgue 空間上開展的機 率論相當成功。

五. 回顧與前瞻

欲承載 Borel 的強大數法則, 是機 率論公理化的著眼關鍵。 Borel 當初建立這 個結果是在 Lebesgue空間上做出來的, 而 Lebesgue 空間是典型的機率空間。

如果改用正準建構 (canonical con- struction) 的初等機率空間 (Ω,A, P) 來看, 我們發現

B ≡ { limn→∞Sn

n = 1

2} 6∈ A

A 太小了, 事件 B 無處容身。 顯然 B 生存在由 A 所生成的單調類 (monotone class) m(A) 之中。 由單調類定理 (mono- tone class thesrem) 知, 代數 A 所生成 的單調類 m(A) 就是其所生成的 σ 代數 σ(A)。 換言之, B ∈ σ(A)。 另一方面, 由測度論知, P 可以唯一延拓到 σ(A) 上, 成為一個機率測度, 仍記為 P, 使得 (Ω, σ(A), P) 為一個機率空間, 並且在 其上 Borel 強大數法則成立。

進 一 步, 對 於 在 任 何 機 率空 間 (Ω,F, P ) 上的銅板序列, 同樣都可以證明 Borel 強大數法則成立。

但是對於初等機率空間 (N, R, P ) , 卻 可在其上定義各種的銅板序列, 使得 Borel 強大數法則有時成立, 有時不成立。 成立與否 跟隨機變數的函數本身有關, 而不只是依賴 於隨機變數的機率分佈。 這是初等機率空間 的致命傷。

理想的機率論應該只依賴於隨機變數的 機率分佈, 而跟隨機變數作為函數本身的對 應取值無關 (不妨叫做機率論的不變性理論 觀點), 這在機率空間上發展出的機率論確實 如此。

六. Kolmogorov 的公理系統

總結上述,Kolmogorov 在 1933年提出 機率空間的理型作為機率論的基礎, 這是順 理成章的最佳選擇。

Kolmogorov按兩個階段來建立機率論 的公理系統:

甲、 樣本空間 Ω 是有窮集的情形 此時初等機率空間 (Ω, A, P ) 的理型 就夠用, 通常取 A = 2。 這含蓋了所有 Laplace 型的古典機率空間。

乙、 樣本空間 Ω 是無窮集的情形 仍然取初等機率空間 (Ω, A, P ) 作為模 型, 但是進一步要求 P 具有連續性:

(An)⊂ A 且 (An)↓ ∅ (遞降至空集)

⇒ limn→∞P (An) = 0 (5)

(12)

根據測度論,(5) 式等價於 P 具有可列加性 (σ-additrvity):

(An)∈ A 兩兩互斥且

[

n=1

An ∈ A

⇒ P (

[

n=1

) =

X

n=1

P (An) (6) 從而 P 可以唯一延拓到由 A 所生成的 σ 代數 σ(A) 上, 仍記為 P , 而得到機率空間 (Ω, σ(A), P ) 。 整個機率論就在這個延拓的 機率空間上順利地開展。

因此, 機率論的基礎就是機率空間 (Ω,F, P ) 定義如下:

定義: 設 Ω 為一個非空集。 如果 F ⊂ 2 滿足:

(i) Ω∈ F,

(ii) A∈ F ⇒ Ac ∈ F,

(iii) (An) ⊂ F ⇒

S

n=1An ∈ F, 則 稱 F 為 Ω 上的一個 σ 代數。 如果 P :F → R+ = [0,∞) 滿足:

(iv) 0≤ P (A) ≤ 1, ∀A ∈ F, (v) P (Ω) = 1,

(vi) (An) ⊂ F, 兩兩互斥 ⇒ P (

S

n=1An)

=

P

n=1P (An),

則稱 P 為 F 上的一個機率測度。 如果 F 為 Ω 上的一個 σ 代數, P 為 F 上的一個機率 測度, 那麼三合一空間 (Ω, F, P ) 就叫做一 個機率空間。

七. 結語

Kolmogorov說:「在描述任何可觀測的 隨機過程時, 我們只得到初等機率空間的資

料, 而延拓的機率空間只是實際隨機過程的 一種理想化。 我們“任意地”(arbitrarily) 劃 定滿足公理 (5) 的系統作為機率模型。 這個 限制, 在各種研究中, 我們發現是適當的且方 便的。」

在 Kolmogorov 的公理系統之下, 三 合一空間 (N, R, P ) 與 (N, D, P) 都是

「化外之民」, 因為顯然它們都不能延拓成為 機率空間。 但是它們並不失其重要性。 Kol- mogorov 說他的公理系統是 「任意地」 割捨, 這很高明地保留一個活結, 使得非機率空間 上的機率論仍然有研究的餘地。 畢竟機率論 是一種數學理論, 但是它跟經驗世界又具有 密切關係。 有一個時期, 機率論被看作是介於 物理學 (或哲學) 與數學之間的一門學問。

放棄較自然與直觀的初等機率空間, 改 採較局限的機率空間, 倒不是因為初等機率 空間不足以承載機率論, 而是承載的東西花 樣繁多, 有的甚至違背了常識。 作局限使得事 情單純化, 而不失其豐富性。 由代數 A 延拓 為 σ 代數 σ(A), 相當於從有理數系 Q 延拓 為實數系 R, 多出了許多經驗世界接觸不到 的事件, 但是對於澄清經驗世界卻大有用處。

某種理想化、 連續化、 無窮化是 「了解」 的必 要手段, 這是機率論給我們的啟示。

參考資料

1. 楊維哲: 機率論, 台北, 正中書局, 1979 年。

2. 蔡聰明: 什麼是機率與機率法則? 數學傳播, 十九卷一期, 1995。

3. W.D. Sudderth and S. Ramakrishnan:

A sequence of coin toss variables for

(13)

which the strong law fails. Amer.

Math. Monthly, 939-941, 1988。

4. A. N. Kolmogorov: Foundations of the theory of probability, Chelsea, New York, 1956。

5. L. Breimam: Probability. Addison- Wesley, 1968。

6. K. Itˆo :Introduction to probability the- ory, Cambridge Univ. Press, 1984。

7. M. Kac: Statistical independence in probability, Analysis and number the- ory, Carus Math. Monographs 12, 1959。

8. J. Barone and A. Novikoff: A History of the axiomatic formulation of proba- bility from Borel to Kolmogorov, Part I. Arch. Hist. Exact Sci. 18, 123-190, 1978。

9. H. Royden: Real Analysis, third Edi- tion, McMillan, 1988。

10. L.E. Maistrov: Probability theory, A Historcal Sketch, Academic press, 1974.

—本文作者任教於台灣大學數學系

參考文獻

相關文件

處理量子場論的 Feynman path integral 則牽涉了更深的機率概念。 當科技中, 因應需要面對的系統愈趨開放, 牽涉的因素增多, 需要處理的數據愈來愈大, 愈來 愈多,

機率論具有廣泛而豐富的應用: 在研究 大 自然方面, 「自然的真正理路在於機率的演 算」(The true logic of Nature is in the Calculus of Probability. Butler 之名言。 ) 為了應用機率,

隨機微分方程式等之名乎。 另一方面, 機率 論之應用層面亦大有進展; 豈不見隨機微 分方程在金融之應用乎。 在此短文中, 筆者 簡略談些機率論與函數論的一些關連。 雖是

3.2 術後發生的情況如血尿(幾乎都有) 、腎動脈或靜脈阻塞(機率小於 1.5%)、淋巴囊腫(機率小於 2%) 、移植腎延遲發揮功能(機率因腎臟來源不同而異,可至三成的比例) 、慢性排斥(機率小於

Cauchy, Gauss, Laplace, Poisson (from left to right) Cauchy, Gauss, Laplace, Poisson (from left to right)... Poisson and Poisson Process Poisson and

《HPM 通訊》駐校連絡員 日本:陳昭蓉 (東京 Boston Consulting Group)

[r]

[r]