• 沒有找到結果。

和光同塵

N/A
N/A
Protected

Academic year: 2022

Share "和光同塵"

Copied!
7
0
0

加載中.... (立即查看全文)

全文

(1)

和光同塵 ()

黃文璋

4. 無記憶性質

Cundy(1966) 說他曾自收音機中獲知, 知更鳥 (robin) 平均可再活 1.2 年, 而與牠 現在年齡無關。 假設某日你與一朋友相約至 海邊垂釣。 朋友的釣魚技術與你相彷。 你抵達 約定地點時, 朋友已先到了 30 分鐘, 但尚未 釣上魚。 你是否會覺得朋友較你有更大的機 會釣上第一條? 很可能不會。 原因是: 魚應 不至於同情朋友已枯坐了 30 分鐘, 而讓他先 釣上一條。 此正如丟一銅板, 直至出現一正面 才停止。 如果連丟十次皆得反面, 那就是白丟 了, 以後的發展就像重新丟一樣, 而不會是因 已丟那麼多次, 所以正面快出現了。

我們常說歲月催人老。 但如前述釣魚的 例子, 有些事物, 歲月不會使其衰老, 此物 還會“活”多久, 與一新生代相彷。 此物之“死 亡”, 似乎都是因為某一突然的事件發生, 而 非逐漸衰退。 亦即若此物已活了 a 單位的時 間, 則會再活至少 b 單位的時間之可能性, 與 a 無關。 此物彷彿會忘記它自己已活了多 久。 此性質便稱為無記憶性質 (memoryless property)。

年輕人通常不希望壽命有無記憶性質, 老年人一般而言, 就很希望壽命有無記憶性 質。 不過在戰場上, 對那些在第一線的士兵, 到底還能活多久, 很可能就有無記憶性質了。

正式地說, 一隨機變數 X, 稱為在某一 實數的子集合 S 中有無記憶性質, 若滿足對

∀a, b ∈ S,

P (X > a + b | X > a) = P (X > b)。

(1) 例1: 連續丟一出現正面機率為 p > 0 之銅板, 直至得到一正面才停止, 令 X 表總 共的投擲數。 則 X 有自 1 開始, 且參數為 p 之幾何分佈 (geometric distribution), 以 Ge(p) 表之, 即

P (X = k) = p(1−p)k−1, k = 1, 2, 3, . . . 。 (2) 則

P (X > k) =

X

i=k+1

p(1−p)i−1= (1−p)k。 (3) 因此

P (X > a + b | X > a) = P (X > a + b) P (X > a)

88

(2)

=(1 − p)a+b (1 − p)a

= P (X > b)。

即若取 S = {1, 2, 3, . . .}, 則對 ∀a, b ∈ S, (4) 式成立。 因此自 1 開始之幾何分佈, 有無 記憶性質。

有位婦人很想生個女兒, 她已連生 7 個 兒子, 朋友都鼓勵她再生, 因為那有運氣那麼 壞的? 你現在知道鼓勵她再生的人是沒有道 理的, 因若令 Y 表得到一女兒前, 所生之 兒子數, 則 Y 有自 1 開始且參數為 1/2 之幾何分佈。 由於 Y 有無記憶性質, 所以 P (Y > 7 + b | Y > 7) = P (Y > b), 因此那已生的 7 個兒子, 並無助於使她更快 獲得一女兒。

例2: 指數分佈 (exponential distribu- tion) 亦有無記憶性質。 設 Y 有參數 λ 之 指數分佈, 以 E(λ) 表之, 即 Y 之機率密度 函數 (probability density function, 簡稱 p.d.f.) 為

f (x) = λeλx, x > 0。 (4) 則因

P (Y > x) =

Z

x λeλudu

= eλx, x > 0。 (5) 故

P (Y > a + b | Y > a) = P (Y > a + b) P (Y > a)

= eλ(a+b) eλa

= eλb, ∀a, b > 0。

(6)

基本上, 幾何分佈及指數分佈為僅有的 兩個具有無記憶性質之分佈。 證明見黃文璋 (1995) 第一章第 6 節。 我們發現此二分佈 之存活函數 (survival function) 皆為指數 函數。 在此對一隨機變數 X,

F (x) = 1 − F (x) = P (X > x), x ∈ R, 稱為其存活函數, 其中 F (x) = P (X ≤ x) 為 X 之分佈函數 (distribution function)。

存活函數又稱尾部機率函數 (tail probabil- ity function)。 若 X 表某物之壽命, 則存活 函數 F (x) 給出此物會存活至少 x 單位時間 之機率。 在諸如機器可靠度 (reliability) 的 探討, 醫學上某種疾病之壽命的探討, 精算學 的 (actuarial) 探討, 通常都是對存活函數較 有興趣。

指數函數且底小於 1 (幾何分佈底為 (1−p) < 1, 指數分佈底為 eλ < 1, 分別見 (6) 式及 (9) 式), 表 k → ∞ (或 x → ∞ 時), P (X > k) (或 P (Y > x)) 趨近至 0 之速度很快。 換句話說, 隨著 k 之增大 (或 x 之增大), X 要大於 k (或 Y > x) 愈來愈 不容易, 其難度, 我們之前以指數函數的威力 來形容。 但壽命之存活函數若為指數函數, 則 壽命便有無記憶性質, 能再活多久, 不受現有 年齡的影響。 此物彷彿隨時保持一全新狀態。

這真是一奇特的現象。 起初由其存活函數趨 近至 0 的速度很大, 我們會以為此物不易活 很久, 沒想到卻隨時像新的一樣。

國內數學界有位資深且為人敬重的前 輩, 一向語多詼諧。 他個子不高, 嘗言“身高要 看從那裡量, 從天花板量起我最高”。 頭頂距 天花板的距離, 的確他最遠。 年齡亦是如此,

(3)

一向我們是量距出生時之歲月長。 但距死亡 日還多久也是一不錯的比法: 距死亡日較久 的便算較年輕。 壽命若有幾何分佈或指數分 佈, 依此新算法, 便永遠像是松柏長青。 要知 駐顏有術不如青春永駐, 這是恭維人時不可 不留意的。

5. 波松過程

假設在時間 t = 0 裝了一新燈泡, 用 了 X1 的時間燈泡壞了, 立即換新 (更換的 時間假設可忽略), 再用了 X2 的時間, 第二 個燈泡又壞了, 於是立即更新, 如此繼續進 行下去。 若燈泡的壽命 X1, X2, . . . 假設為 獨立且有共同分佈 (independent and in- dentically distributed, 簡寫為 i.i.d.), 且 令 A(t) 表至時間 t 所共更換的燈泡數 (在 t = 0 裝的那一個不算, 所以 A(0) = 0)。 則 {A(t), t ≥ 0} 便稱為一更新過程 (renewal process)。

更新過程的例子很多, 只要是依序觀察 某特定事件, 事件發生之間距設為 i.i.d., 則 至時間 t 共發生的次數 A(t), t ≥ 0, 便構成 一更新過程。

若事件發生之間距 Xi, i ≥ 1, 以指 數為其共同分佈, 即設存在一 λ > 0, 使 P (Xi ≤ x) = 1 − eλx, x > 0, 則 {A(t), t ≥ 0} 便稱為一參數為 λ 之波松 過程 (Poisson process)。 波松過程為一點過 程 (point process, 如果發生一事件, 便在 時軸上標一點, 在某時區中發生幾個事件, 便 是在該時區中有幾個點), 也是一種計數過程

(counting process, 計算至時間 t 共發生幾 個事件)。

為何以波松對此過程命名呢?

令 Sn = X1+ X2+ · · · + Xn, n ≥ 1, 表第 n 個事件之發生時刻, S0 = 0, 若 Xi

以 E(λ) 為其共同分佈時, 如果你機率論學得 夠好, 當知 Sn 有 Γ(n, 1/λ) 分佈。 否則由求 Sn 之拉普拉斯轉換 (Laplace transforma- tion)

E(etSn) = E(et(X1+X2+···+Xn))

= (E(etX1))n

= ( λ λ + t)

n

= (1 + t λ)

−n

, 亦得 Sn 確有 Γ(n, 1/λ) 分佈。 即 Sn

之 p.d.f. 為

f (x) = λnxn−1eλx Γ(n)

= λnxn−1eλx

(n − 1)! , x > 0。 (7) 反覆利用分部積分 (integration by parts) 可得

P (Sn> t) =

Z

t f (x)dx

=

n−1

X

i=0

(λt)ieλt

i! , t > 0。 (8) 現因事件 [A(t) = n] 與 [Sn ≤ t <

Sn] 等價, 故 P (A(t) = n)

= P (Sn ≤ t < Sn+1) (9)

= P (Sn+1 > t) − P (Sn> t)

= (λt)neλt

n! , ∀t ≥ 0, n = 0, 1, 2, . . . 。

(4)

即得證對一參數為 λ 之波松過程, 至時間 t 發生的個數 A(t), 有參數 λt 之波松分佈。 這 是此過程以波松命名的原因。

對任二 t, s > 0, A(t + s) − A(t) 表波松過程在區間 (t, t + s] 中所發生的事 件個數。 可以證明 A(t + s) − A(t) 有參 數 λs 之波松分佈。 也就是說 A(t + s) − A(t) 之分佈只與區間長度 s 有關, 而與 其位置無關。 而且 A(t + s) − A(t) 還與 A(t) 獨立呢! 甚至對任意 n ≥ 2, 及 0 ≤ t0 < t1 < · · · < tn, A(tn) − A(tn−1), A(tn−1) − A(tn−2), · · · , A(t2) − A(t1), A(t1), 此 n 個隨機變數相互獨立。 即 在不相交區間 [0, t1], [t1, t2], . . . , [tn−1, tn] 中之事件發生個數相互獨立, 這是波松過程 一重要的性質, 稱為獨立增量 (independent increments) 性質。

在很多實際的情況中, 如釣魚、 交通事 故、 意外事件及至醫院看病等, 由於至下一事 件的等待時間往往有無記憶性質, 因此二事 件的間距便有指數分佈, 從而至時間 t 發生 的事件數 (選一起始點定為時間 0), 便形成 一波松過程。

我們也可以另一方式來說明為何波松過 程處處可見。 指數分佈的無記憶性質導致在 任一小區間 [t, t + h] 中, 會發生一事件之 機率為

P (X ≤ h) = 1 − eλh

= 1 − (1 − λh + o(h))

= λh + o(h), h → 0,

其中 X 表一有 E(λ) 分佈之隨機變數, 此處 用到當 h 很小時

eλh= 1 − λh + o(h),

又 o(h) 為某一 h 的函數 (o 讀為 little-oh), 且滿足

h→0lim o(h)

h = 0。

換句話說, 當 h 很小時, o(h) 與 h 相比更 小。 很多點過程有這種性質: 在一小區間發生 一個點 (或說一事件) 的機率約與此區間長 成正比 (除了一更小的誤差), 而與此區間的 位置無關。 至於會發生兩個以上的點之機率 則是極微小, 以 o(h)表之。 注意 o(h) 並非 指一特定的函數, 諸如 h2, h3/2 + h2 皆為 o(h), h → 0。 直觀上來看, 在一區間 [0, t]

中會發生幾個點便有波松分佈 (利用二項分 佈趨近至波松分佈的結果), 且在不相交區間 中各發生幾個點為相互獨立。 波松過程便產 生了。

無記憶性質, 事件發生的均勻性 (發生 機率只與區間長度有關, 且區間較短時, “差 不多”是線性的), 在不少實際的現象裡, 均具 有此二種特性, 因此使得波松過程成為一出 現極頻繁的計數過程。

關於波松過程的討論, 以及更一般的波 松過程之定義, 可參考黃文璋 (1995) 第五 章。

6. 等待時間之詭論

設有一參數為λ之波松過程{A(t), t ≥ 0}, 譬如說, A(t) 表至時間 t 共換了幾個

(5)

燈泡。 則在時間 t 正在使用的那一燈泡還可 用多久呢? 由指數分佈之無記憶性質, 我們 知道該燈泡之剩餘壽命 (residual life 或說 remaining life), 仍為有參數 λ 之指數分 佈, 與一般正常的間距一樣。 至於該燈泡已經 用多久了呢? 明顯地, 其已經用的時間 (稱 做現在壽命 (current life)), 不能超過 t。 若 以 δt 表現在壽命, 則易見只要 x < t, 則 δt > x, 若且唯若在區間 (t − x, t] 中, 沒有 換燈泡, 而此機率為 1 − eλx。 故

P (δt≤ x) =

1 − eλx, 0 ≤ x < t, 1 , x ≥ t。 (10) 當 x ≥ t 時, 由於必有 δt ≤ t, 故 P (δt ≤ x) = 1。 一般我們用 γt 表在時間 t 正在使 用的那一燈泡之剩餘壽命。

於時間 t 正在用的那一燈泡之總壽命 βt= γt+ δt, 其期望值為

E(βt) = E(γt) + E(δt)

= 1 λ +

Z

t

0 xλeλxdx + tP (δt = t)

= 1 λ + 1

λ(1 − eλt)。

不少人都有下述經驗: 等公車時, 別人 的車子總是先到, 自己要搭的卻老不來, 站牌 上明明寫 15 分鐘一班, 但幾乎每次都差不多 要等滿 15 分鐘, 難道每次到站牌, 都是公車 剛好才開走嗎?

我們先看一所謂 “等待時間之詭論”

(waiting time paradox)。 假設公車依一參 數為 λ 之波松過程到站, 某人在時間 t 抵達 此站。 若以 γt 表至下一班公車來所需之等待 時間 (即前面所提的剩餘壽命), 我們想求 γt

之期望值 E(γt)。 則可能會有下述二矛盾的 答案。

(a) 由指數分佈之無記憶性質, 導出 等待時間之分佈應與自己到站牌的時間無關, 因此

E(γt) = E(γ0) = 1 λ。

(b) 由於某人抵達站牌之時間, 為前後 兩班車到站之區間中任意的一個點, 由對稱 性知, 等待時間之期望值, 應大約是相鄰兩班 車抵站牌之時間差距期望值之半, 即1/(2λ)。

這兩種論點看起來似乎皆很合理, 不過 由之前所求出的波松過程之剩餘壽命的分佈, 我們知道 (a) 是對的。 但 (b) 之錯誤何在?

原因為雖然對一參數 λ 之波松過程, 每 一到達間距 Xi 皆有相同之指數分佈, 且期望 值為 1/λ, 但若對一固定的 t > 0, 找出 Xk 使得

k−1

X

i=1

Xi < t ≤

k

X

i=1

Xi,

則此 Xk 之期望值, 並不等於 1/λ 而是會大 於 1/λ。 且 t → ∞ 時, 由 (14) 式知, 此期 望值趨近至 2/λ, 而 2/λ 之半即為 1/λ。 換 句話說, 在 (b) 中我們誤將此一特別的 Xk (即總壽命) 之期望值也當做 1/λ。

我們可粗略地這樣想: 較長的區間比較 短的區間有更大的機會包含一特定的點 t。

雖然間距皆有指數分佈, 且參數相同, 但 由於是隨機變數, 區間就是有長有短, 假設在 一條數線上有一些間距長短不一的點, 你隨 機地取一點, 是不是較容易取自一間距較大 的區間中? 同樣的道理, 若兩班公車抵站之 間距很短, 你的到站時刻, 當然較不易落在其

(6)

中 (等車時間會較短), 而是較易落在一兩班 車抵站間距較大的區間 (等車時間會較長)。

在公車抵站間距為指數分佈之假設下, 你等 車時間之期望值 1/λ, 差不多等於在你之前 與在你之後抵站之二車間距期望值

1 λ + 1

λ(1 − eλt) 之半, 而不是一般人以為的 1/λ 之半。

再看另一關於 “檢驗的詭論” (inspec- tion paradox)。 假設使用某電池, 一旦沒電 了便立即換一同廠牌之新電池。 電池壽命設 為 i.i.d., 這些換電池的時刻便構成一更新過 程。

某品管人員想檢定電池之壽命, 原先與 操作人員約好上午 8 時至工廠, 工廠在那時 開始運作, 操作人員會在 8 時正啟用 30 個新 電池。 品管人員因故遲到, 但操作人員仍在 8 時正啟用電池。 有些電池電耗盡了, 操作人員 立即換新, 並記錄更換時間, 品管人員來廠後, 先登記正在測試的那些電池分別的啟用時間, 並等到每個電池電耗盡後, 拿到 30 個電池 的壽命資料。 結果取到的樣本其平均壽命差 不多是原先以為的電池壽命之兩倍, 這是怎 麼回事?

假設電池之品質相同, 即壽命之分佈函 數皆是某一同樣的 F , 我們以為這些受測電 池之壽命也同樣以 F 為其分佈函數。 其實並 不然, 當 F 是指數分佈, 此例本質上與前面 等公車的例子相同, 即此時正在受測電池的 壽命分佈與 F 是不同的。 這是值得重視的一 個問題, 我們看到一個明顯偏差的檢驗計畫 可能會導致錯誤的結論, 因為我們所觀察到

的樣本並非來自典型的母體 (typical popu- lation)。

在 Rao(1997) 一書中 pp.116-117, 亦 提到一類似的例子。 摩洛哥 (Morocco, 位於 西北非洲之一國家) 之國立統計經濟應用研 究所曾做一項研究, 目的是估計觀光客在他 們國家之平均逗留時間。 他們進行了兩種調 查, 其一是對住在旅館的觀光客, 其二是對即 將離境的旅客。 從對 3, 000 個在旅館的旅客 之調查, 得平均逗留時間為 17.8 日, 而從對 12, 321 個離境的旅客之調查, 得平均逗留時 間為 9.0 日。 前者差不多是後者的兩倍。 你現 在該知道何者才是可靠的停留時間之數據了。

7. 和其光同其塵

在老子第四章: 道沖, 而用之或不盈, 淵 兮似萬物之宗。 挫其銳, 解其紛, 和其光, 同 其塵, 湛兮似或存, 吾不知誰之子, 象帝之先。

和其光同其塵的意思就是隱藏光耀, 混 同塵俗。

不少統計學者均認為波松分佈與常態分 佈為最重要的兩個分佈。 但長久以來, 常態分 佈具有獨尊的地位, 不要說波松分佈, 絕大部 分的其他分佈, 其重要性往往被低估。

而在隨機過程裡, 波松過程與布朗運動 (Brownian Motion), 亦為最重要且最基本 的過程, 到處出現, 甚至在許多我們料不到的 地方。 但再度地, 波松過程的重要性也常被忽 略。

忽視波松分佈或波松過程的重要性, 其 實是統計學家的損失。 因在很多離散的狀態

(7)

下, 波松分佈或波松過程常是最佳模式。 波松 分佈及波松過程, 彷彿和光同塵, 明珠卻蒙上 灰塵。

雖然萬物有常, 但天下事物不能以常理 度量的本就不少, 非常態分佈之處處存在, 也 就不容懷疑。要發現波松分佈之重要, 遠比當 伯樂容易的多, 只要你的眼光, 偶而離開常態 分佈。

習題

1. 依第 1 節中關於豬肉換米的新聞報導裡, 所給米的重量, 估計 264 粒米的總重量, 並與全世界人口總重 (以每人平均 50 公 斤重計) 相比。

2. 試估計將 F64這個數印出來, 約需多少本 書?

3. 在第 2 節所述的致富方法中,

(i) 若每月投資 15, 000 元, 40年後之 本利和為何?

(ii) 若投資報酬率改為每年 10%, 則 30 年後之本利和為多少單位的錢? 40 年後呢?

4. 某工廠宣稱其生產的某型日光燈管可使 用 10, 000 小時。 某辦公室共安裝 32 支 該型燈管, 使用後才一個月便壞了一支。

該辦公室想了解這是否合理。 假設燈管壽 命為 i.i.d. 之 E(λ) 分佈, 期望值為 10, 000 小時, 又設每月上班 25 天, 每 天開燈 8 小時。 求

(i) 某特定燈管 1 個月內會壞之機率;

(ii) 辦公室 1 個月內至少會壞一支燈管 之機率;

(iii) 辦公室 5 個月內至少會壞二支燈管 之機率。

5. 設 X 有 E(λ) 分佈, Y 為一非負的隨機 變數, 且與 X 獨立。 試證 P (X > Y +t | X > Y ) = P (X > t)。

6. 設 X 有自 1 開始, 參數 p 之幾何分佈, Y 為一非負的隨機變數, 且與 X 獨立。 試 證 P (X > Y + t | X > Y ) = P (X >

t)。

7. 試證第 5 節中對一更新過程, 事件 [A(t) = n] 與 [Sn ≤ t < Sn+1] 等 價, ∀n ≥ 0。

8. 設 X 有 E(λ) 分佈, 又令 [·] 表最大整 數函數。

(i) 試證 [X] 與 X − [X] 獨立;

(ii) 求 X − [X] 之分佈。

9. 設 {A(t), t ≥ 0} 為一參數為 λ 之波松 過程, 求總壽命 βt 之分佈。

參考文獻

1. 黃文璋 (1995), 隨機過程, 華泰書局, 台北。

2. Cundy, H. M. (1966). Birds and atoms.

Math. Gazette50, 294-295.

3. Peterson, I. (1980). Islands of Truth — A Mathematical Mystery Cruise. W. H.

Freeman and Company, New York.

4. Rao, C. R. (1997). Statistics and Truth

— Putting Chance to Work, 2nd. ed.

World Scientific Publishing Co. Pte.

Ltd., Singapore.

—本文作者任教於國立高雄大學應用數學 系

參考文獻

相關文件

(Χ) 身體組織因死亡後開始分解的過程稱為屍僵(rigor mortis)。第三章 P90 10.(○或Χ皆可) 粗死亡率指的是一年內每十萬年中人口之死亡數。第四章 P103 二、簡答題(請自選五題作答,每題 10 分,共

其中的一種演算法也是最常用的演算法便是 -- 牛頓法 (Newton’s method) ,一般也稱為 -- 牛頓拉弗森法 (Newton-Raphson method)

此極限便是觀察分子或者分母誰「跑得比較快」。若是分子 趨近無窮大的速度快很多,則極限為無窮大 ,若是分母快很 多,則極限便是

要將變數變換法應用在定積分上,有兩種計算方法。其中的 一種便是先計算出不定積分,在利用微積分基本定理計算其

數學家吳文俊先生認為, 有些幾何定理的證明, 不單是傳統的歐式方法難以措手, 即便是 解析法也因計算繁複而無法解決。 如果能找到一種機械化的方法比較快捷地證明幾何定理, 那

不同疾病因死亡率決定性的影響機制。 長期 以來, 環境危險因子對致癌的影響受到許多 人的注 視和討論。 但是在我們的長期 Gom- pertz 模型分析中,

這次的實驗雖然很簡單,只是要做的地方比較多,所以花

更可能是跟易代相關的價值 觀念。這些觀念或許跟現代 人的想法相距很遠,卻是中 國傳統的一部分。這一部分 是否還沉澱在我們的思想深 處,並發揮正面或負面的作