• 沒有找到結果。

隨機與密碼

N/A
N/A
Protected

Academic year: 2022

Share "隨機與密碼"

Copied!
15
0
0

加載中.... (立即查看全文)

全文

(1)

隨機與密碼

黃文璋

一. 密碼

我們處在一個密碼的時代。 年輕人以手機傳簡訊, 520表我愛你, 5120184表我要愛你一輩 子, 08376表你別生氣了, 7456表氣死我了, 789表去打球 (用台語發音)。 這些乍看之下不明所 以, 但對習於傳簡訊者, 看這些數字大約就與看中文一樣。

在布魯斯威利 (Bruce Willis) 主演的終極密碼戰 (Mercury Rising) 裡, 一個患自閉症 的男孩, 竟然破解軍方一極機密的水星密碼。 美麗境界 (A Beautiful Mind) 裡的數學家納許 (John Nash, 羅素克洛 (Russell Crowe) 主演), 拿到博士學位後, 到國防部工作, 也參與解碼 的任務。 這類解碼, 大抵與聖經密碼 (The Bible Code, Michael Drosnin原著) 一書所描述者 類似。 即從一大片文字或符號中, 看出中間藏有某項訊息。 例如, 從聖經的第一個字母開始, 依 序每次跳過 100 個字母, 即將第1, 101, 201, 301, · · ·, 等字母連起來, 看組合出什麼字句。 不過 這種密碼容易淪於各說各話, 穿鑿附會, 是不是真的被破解, 有時不得而知。

有些縱橫填字遊戲 (cross-word puzzle) 或數字謎, 也可視為密碼。 如 S E N D

+ M O R E M O N E Y

式中每一英文字母代表一不同的阿拉伯數字, 假設此為一正確算式, 而解出其中的英文字母。 這 種密碼的破解, 主要是依據邏輯的合理性。 另外, 人類對遺傳的奧秘一直深感興趣, 近年來遂有 熱門的遺傳密碼。

大家可看出, 我們所稱的密碼, 是很廣泛的。 只要是我們不知的, 常可稱其中有密碼; 而對 訊息想隱藏不讓人知道, 就可說是在編密碼, 或稱編碼; 要解出隱藏的訊息, 便稱為解碼。

比較有系統的編碼, 是把文字對應到數字 (或符號, 如以旗號或閃燈造出密碼, 通行的手語 也屬於此類)。 電報 (在辭彙那部字典裡, 對密碼的解釋即為 “收發電報的秘密號碼”) 現在已不 流行了。 我們當年出國讀書 (那已經是很久以前了), 要到外交部辦手續。 那時政府對留學生設 想周到, 我們每人要將自己名字的每個字, 從一本對照表上, 各找出一個四位數字的碼, 填寫交

3

(2)

上, 以備若在國外發生什麼意外, 駐外單位可發電報通知台灣。 軍隊傳遞情報, 也常用這類方式。

這種編碼雖很有效率, 但只要那本對照表被敵方取得, 情報便暴露了。

在第二次世界大戰時, 德國憑藉其優異的密碼通訊能力, 潛艦神出鬼沒, 盟軍膽顫心驚。 在 獵殺U-571(U-571) 裡, 便是演盟軍如何奪取北大西洋中, 德軍編號U-571 潛艦上密碼解碼機 的驚險過程。 獵風行動 (Windtalkers) 也是以第二次世界大戰為背景。 美國海軍利用納瓦荷族 的母語創造出一種密碼。 尼可拉斯凱吉 (Nicolas Cage) 飾演的美國軍官, 在太平洋塞班島與 日軍的浴血戰中, 其職責乃是不讓那群納瓦荷族的通信兵落入日軍手中, 以免密碼被破。 所以除 了保護外, 必要時得槍殺他們。

上述這種編碼方式, 顯然存在一罩門, 不要說對照表、 解碼機, 或納瓦荷族人落入敵方手中 是很難防止的, 只要時間夠久, 經過比對, 便沒有破解不了的。

金融機構提款卡的密碼、 開鎖的密碼、 航空公司訂機位的電腦代號, 及電腦開機的密碼 (password) 等, 又是一類密碼。 甚至樂透彩每期的頭獎號碼, 亦可視為此類密碼。 是一種個人 式或偶發性的需求, 但也都是儘量不想讓人猜中。 這類密碼為了記憶方便, 往往不致於過長。 例 如, 提款卡的密碼通常只有四個數字。 開機密碼大抵是英文字母或數字, 七個就很多了, 太長自 己都記不住。 理論上這種密碼也是只要時間允許, 以及沒有限制錯誤次數 (如提款機通常按錯 三次, 卡片便出不來了), 都可以經由一個個試而破解。

既然沒有破解不了的密碼, 那有沒有比較難破的編碼方式呢? 也就是破解要花很長的時 間, 此時間超過保密的有效期限, 則便可充分達到保密的效果了。 答案是肯定的。 數學與統計在 這裡倒是有好的角色可扮演。

利用巨大整數難以分解的特性, 美國麻省理工學院的三位數學家 Rivest, Shamir 及 Adle- man, 於西元 1977 年提出一個至目前仍被認為極安全的密碼技術, 論文並於 1978 年刊登, 所謂 公開鑰匙密碼法 (Public-Key Cryptography)。 取他們三人姓的第一個字母, 又稱 RSA 法。

這方面的討論可參考楊重駿、 楊照崑 (1983, 1986), 及楊淑芬 (1991)。 RSA法適用於金融或 軍事等對保密工作很需要的單位, 為一種有系統的編碼法。 欲操作此法, 通常要有很強的計算設 備。

本文則針對前述第二類密碼, 說明如何利用隨機性來編碼使較難破解。 此法雖然卑之無甚 高論, 且並不需太多的設備, 卻常為一般人所忽略。 又鑑於一般人對隨機性的概念往往未能充分 掌握, 本文也將對此概念加以闡釋。

二. 隨機抽樣

賭博老手到賭場可能不會立刻就賭, 而是先觀察一番, 看看莊家出牌有沒有什麼規律, 看 看骰子是否那一面出現的頻率較高。 一般大賭場, 如美國拉斯維加 (Las Vegas) 及大西洋城

(3)

(Atlantic City) 等地的賭場, 每天進出的客人很多, 賭場大抵不會詐財, 而是從玩法的設計, 使 得對賭徒而言, 不是一公正的賭局。

有些事件彼此間有關係。 如父親與兒子的身高; 兩次考試的成績; 明天的氣溫與今天的氣 溫; 要拿報告給上司看之前, 先打聽上司今天的心情, 因認為上司心情的好壞, 會影響看你報告 的評語。 警察辦案會研究犯罪者的行為, 因認為犯罪者有一些行為模式, 由作案手法類似的案 件, 猜測嫌犯可能為同一人, 再由過去案件發生地點, 找出地緣關係, 推測其下一作案處。

我們常會根據過去的資料, 以對未來做預測。 有時則儘量想防止被別人預測中 (如賭場之 出牌, 或老師之命題)。 究竟什麼樣的情況會較難預測?

假設要猜下次月考班上誰會考第一。 班上雖四十多人, 依過去成績可做一些推斷。 其中有 少數幾人考第一名的機會較大, 大部分人則機會很小。 因此通常不會太難猜, 會考第一的總不出 那兩三個人。 但若要猜這次年終摸彩誰會中頭獎, 就不容易了。 因如果每人一張彩券, 則每人會 被抽中的機會皆相同, 即使知道過去若干年誰中頭獎, 顯然也沒有幫助。 雖有時我們說某人一向 運氣好、 手氣佳, 但多半是事後諸葛, 事前我們倒不見得真認為有誰被抽中的機會較大。

在統計上抽樣的方法很多, 如系統抽樣 (systematic sampling), 分層抽樣 (strati- fied sampling), 及叢聚抽樣 (cluster sampling) 等, 都是常用的方法。 大部分的民調、 抽 獎等, 包含各國風行的樂透彩, 常是採用以不重複的簡單隨機抽樣 (simple random sampling without replacement, 底下只稱簡單隨機抽樣) 的方式, 產生所要的號碼。 以北銀樂透彩為例, 由 42個數字, 每次產生不重複且順序不計的 6碼, 總共

42 6

!

= 5,245,786

組號碼, 每組產生的機率都相同。 如果是n取r, 則共有nr種組合。 如果是以n個相異數字來編 長度為r之密碼 (可重複且計順序, 這是通常的情況), 則共有nr組, 數目顯然增加很多。 假設每 組產生之機率皆相同, 我們便稱此為隨機密碼 (stochastic code)。 簡單隨機抽樣, 與隨機密碼, 其中皆含有兩個概念: 獨立及均勻。

獨立表每次抽出的號碼與以前的不相干, 均勻表每組號碼被抽中的機會都一樣。 在資訊理 論 (information theory) 裡, 一項試驗若有A1, · · · , Ak等k種可能的結果, 發生的機率分別 為p1, · · · , pk, 其中pi ≥ 0,Pki=1pi = 1, 則可以

H(p1, · · · , pk) = −

k

X

i=1

pilog pi

來量測此實驗中所含不確定性 (uncertainty)。 其中對數可取任何一不為 1之固定正數為底, 而 若某pi= 0, 則定義pilog pi = 0。 在物理上H(p1, · · · , pk)稱為此實驗之熵 (entropy), 此處不 擬多談。

(4)

當p1, · · · , pk之值為何, 會使H(p1, · · · .pk)最大? 也就是這種試驗何時會有最大的不確定 性? 對固定的k, 當每一結果之可能性皆相同, 即pi = 1/k, i = 1, · · · , k, H(p1, · · · , pk)達 到最大值, 即此時會有最大的不確定性。 可利用下述不等式 (此為 Jensen’s inequality 之一特 例) 來證明:

若φ(x)為一凸函數 (convex function), 則對任意正數a1, · · · , ak, φ(1

k

k

X

i=1

ai) ≤ 1 k

k

X

i=1

φ(ai).

現取φ(x) = x log x, x > 0, φ(0) = 0, 為一定義於[0, ∞)之凸函數, 取ai = pi, 利用

Pk

i=1pi = 1, 可得

−1

k log k = 1 klog 1

k = φ(1

k) = φ(1 k

k

X

i=1

pi)

≤ 1 k

k

X

i=1

φ(pi) = 1 k

k

X

i=1

pilog pi = −1

kH(p1, · · · , pk), 故有

H(p1, · · · , pk) ≤ log k = H(1

k, · · · ,1 k).

利用上述結果, 欲自n個數字中, 產生r個不重複且順序不計的號碼, 以簡單隨機抽樣產生, 會有最大的不確定性。 而以n個數字來編長度為r之密碼, 隨機密碼會有最大的不確定性。 換句 話說, 這種情況是最難猜中的, 印證我們之前的想法。

在簡單隨機抽樣裡, 知道過去的抽樣結果, 對未來之預測毫無幫助。 如果是n取r, 每組號 碼會出現的機率永遠是1/nr。 號碼的出現如果只是獨立, 而不均勻 (例如有些號碼球較重, 因 此較易出現), 則當然要猜那些較易出現的號碼。 對於樂透彩, 經過一段時間的觀察, 可統計出 各號碼出現的頻率。 只是有人對出現頻率較低的號碼, 會認為應快出現了, 有人則對出現頻率較 高的號碼, 認為該號碼“氣 ”較旺, 應較易再出現。 到底那一種看法才正確呢? 這就牽涉到對隨 機的概念是否能正確掌握。

三. 你了解隨機嗎?

民國 92 年 1 月 1 日起, 環保署實施第二階段的塑膠袋限用政策, 塑膠業者與民眾均感到困 擾。 中國時報 92年 1月 1日 15版有一則公視記者馬台興的投書, 其中有底下的一些句子:

昨天筆者支援採訪此則新聞, 經“隨機採樣” 受訪者, · · ·。 而 「平口, 無提把」 塑膠袋可用 的細節幾乎都能 “隨機” 答出。 · · ·。 於是筆者又鍥而不捨的“隨機” 多問了許多間店家, · · ·。

(5)

短短的文章裡, 用了三次 “隨機” 的字眼。 但作者是否真了解隨機的意義呢? 隨機與隨便 的意思一樣嗎? 就算該文作者了解隨機的意義, 但個人容不容易做到隨機採樣呢?

在機率裡, 隨機的意義本來是很一般的。 只要是一事先不能預知結果的試驗, 便稱隨機試 驗。 假設有一銅板, 出現正面的機率為0.2, 反面的機率為0.8, 連續投擲10次, 看得到幾個正面, 這便是一隨機試驗。 若以X表所得正面數, 則由排列組合裡的結果知

P (X = k) = 10 k

!

0.2k0.810−k, k = 0, 1, · · · , 10.

X便稱有二項分佈B(10, 0.2)。 一般的二項分佈則以B(n, p)表之。 但在簡單隨機抽樣裡, 或是 說將 10個球 “隨機地” 放進 10個箱子中, 如前所述, 此處之 “隨機” 便含有獨立及均勻的意思。

有時我們會說有一均勻的骰子, 或說將撲克牌洗得很均勻。

由於含義為 “均勻 ”, 一般人會將之視為與水泥塗抹得很 “均勻”, 儀隊隊員的身高很 “均 勻” 的意義相同。 也就是將均勻與相等視為同義, 而忽略了此為隨機現象。 要知在隨機現象裡, 均勻乃表出現之機率相等, 而非出現之頻率相等。

先看底下的例子。

例1. 假設有 2 個箱子, 將 2 個球分別隨機地放進箱中。 即每一個球皆有 1/2 的機率放進任 何一箱中。 而每箱中各恰有一球的機率為

2!

22 = 2 4 = 1

2.

如果是 3個球隨機地放進 3個箱子中, 則每箱中各恰有一球的機率為 3!

33 = 6 27 = 2

9.

如果是 10個球隨機地放進 10個箱子中, 則每箱中各恰有一球的機率為 10!

1010 = 3,628,800

1010 = 0.00036288.

n個球隨機地放進n個箱子中, 則每箱中各恰有一球的機率為n!/nn, 此值隨著n之增大而漸減。

上述現象, 可能違反一般人的直觀。 將10個球隨機地放進10個箱子中, 每個箱子中各恰有 一個球, 應是最均勻的, 結果卻是極不容易發生。 反而是不均勻的情況, 即至少有一箱子中有兩 個以上的球很容易發生, 機率為

1 − 0.00036288 = 0.99963712= 1.. 而一箱中有 2球, 8箱中各有一球, 另一空箱的機率為

10

1

9

8

10

2

· 8!

1010 = 45 · 10!

1010,

(6)

是每箱中各恰有一球的機率之 45倍。

令每箱中各恰有一球的機率為a。 再給一些例子如下:

(a) 1 箱中有 3 球, 7 箱中各有一球, 另 2 空箱, 其機率為60a。

(b) 2 箱中各有 3 球, 2 箱中各有 2 球, 另 6 空箱, 其機率為(35/4)a。

(c) 2 箱中各有 4 球, 2 箱中各有 1 球, 另 6 空箱, 其機率為(35/16)a。

(d) 1箱中有1球, 1箱中有2球, 1箱中有3球, 1箱中有4球, 另6空箱, 其機率為(35/2)a。

(e) 1 箱中有 6 球, 1 箱中有 2 球, 2 箱中各有 1 球, 另 6 空箱, 其機率為(7/4)a。

(f) 5 箱中各有 2 球, 另 5 空箱, 其機率為(63/8)a。

有些看起來很偏頗的事件, 其發生的機率卻比很均勻的事件之機率大。 我們給出恰有i個空 箱的機率如下:

(i) 0 空箱之機率為a。

(ii) 1 空箱之機率為45a。

(iii) 2 空箱之機率為375a。

(iv) 3 空箱之機率為980a。

(v) 4 空箱之機率為(7609/8)a。

(vi) 5 空箱之機率為(2835/8)a。

(vii) 6 空箱之機率為(6821/144)a。

(viii) 7 空箱之機率為(311/168)a。

(ix) 8 空箱之機率為(511/40320)a。

(x) 9 空箱之機率為a/9!。

可看出有 3個空箱之機率最大, 有 4個空箱之機率次大。

現在很多高中教室, 置有一竹籤筒, 以方便老師上課時隨機地點學生上台。 一學期下來, 就 是有幾位學生多次被點中, 有幾位學生卻從未被點過。 這也可以解釋為何即使上天對每一個人 可能無意有差別待遇, 但結果是抱怨禍不單行者不少, 慶幸好事連連者也不少。

在紅樓夢的第八回, 賈寶玉去探望薛寶釵, 正在閒聊。 一語未了, 忽聽外面的人說:『林姑娘 來了。 』 話猶未完, 黛玉已搖搖擺擺的進來, 一見寶玉, 便笑道:『哎喲! 我來的不巧了!』 寶玉等 忙起身讓坐。 寶釵笑道:『這是怎麼說?』 黛玉道:『早知他來, 我就不來了。』 寶釵道:『這是什麼意 思?』 黛玉道:『什麼意思呢? 來呢, 一齊來, 不來, 一個也不來。 今兒他來, 明兒我來, 間錯開了 來, 豈不天天有人來呢? 也不至太冷落, 也不至太熱鬧。 姐姐有什麼不解的呢?』

再看一例。

(7)

例2. 設一箱中有 20 個有編號的球, 自其中隨機地依序取兩個, 每次取出後放回。 則兩球 皆相異之機率為

20 20 ·19

20 = 0.95, 會有重複之機率為

1 − 0.95 = 0.05.

從10n個有編號的球中, 依序隨機地取n個, 每次取出後放回。 則會有重複之機率為 1 −10n · (10n − 1) · · · (10n − n + 1)

(10n)n .

易見此值隨著n之增大而漸增。 n = 30時, 此值約 0.098, 也就是自 30個球中取 3個還不太會重 覆; 但n = 300時, 此值就已約 0.777。 若n → ∞, 則此值趨近至 1。

球數愈多, 愈容易有取樣重複的現象。 一個類似的問題是, 如果做芝麻餅, 希望芝麻很均勻 地散佈, 可否隨機地撒呢? 你現在知道了, 不可以, 否則芝麻必是有些地方很多, 有些地方很稀 疏。 隨機下的後果, 往往是不均勻。

在沈默的羔羊 (The Silence of the Lambs) 那部電影裡, 有底下一句話:

Doesn’t this random scattering site seem desperately random, like an elaboration of bad liar.

這些隨機散佈的地點, 不是極度地隨機嗎? 就像差勁的騙子精心設計的謊言。

看起來很 “隨機”, 反而會像精心設計的謊言! 上課時老師點名, 如果是隨機地點, 是很難 每次都點不同的人。 統計樂透彩過去的頭獎號碼, 如果每個號碼累積出現的次數都一樣, 或連續 幾期開出的號碼都不一樣, 反而才該懷疑其隨機性。

有時我們會懷疑事件之隨機性, 此因看到過多的巧合。 以樂透彩為例, 從每期開出的6個頭 獎號碼, 要找到一些特殊的組合, 往往並非太困難的事。

例3. 在 42 取 6 的樂透彩裡, 偶數共有 21 個。 故 6 碼全為偶數之機率為

21

6



42

6

 = 54,264 5,245,786

= 0.0103,.

同理, 6 碼全為奇數, 6 碼全在 1 至 21, 6 碼全在 22 至 42, 機率均約為 0.0103。 所以每期頭獎號 碼全為偶數, 或全為奇數, 或全在 1至 21, 或全在 22至 42, 其機率約為

4 · 0.0103 = 0.0412.

(8)

甚至 6碼全為 3的倍數, 全不為 3的倍數, · · ·, 認真地找, 總可從每期開出的 6碼中, 找到一些有 趣的現象。 當期數夠多後, 更易從其間找到一些有趣的現象 (如北銀樂透彩 39 號曾連續 5 期出 現)。 這並不奇怪, 除非經過統計檢定, 否則不要輕易判定號碼並非隨機地出現。

另外, 有些我們以為不容易發生的事件, 其發生的機率其實並沒有想像中的小。 見底下的 兩個例子。

例4. 在n取r的樂透彩中, 頭獎號碼會有連號的機率為 1 −

n−r+1

r



n

r

 . 若是 42取 6, 則此機率為

1 −

37

6



42

6



= 0.5568,.

超過二分之一。 因此看到連號不用太驚訝。 但是否因此簽注時該簽連號, 使中頭獎的機率較大 呢? 此點留給讀者自己回答。

例5. 對北銀發行的樂透彩, 假設每期簽 5 注, 連續 50 年, 又假設北銀樂透彩的發行方式一 直未改變。 則至少會中一次的機率為何?

由於每週發行兩期, 1年 104期, 50年共5,200期。 則 50年間至少中一次頭獎之機率為 1 − (1 − 5

5,245,786)5,200 .

= 0.004944 .

= 1 202.

約為兩百分之一。 對中頭獎而言, 這是一不算小的機率。 不過仔細一想, 也做了不少投資。 50年 間共簽了5 · 5, 200 = 26, 000(注), 佔全部注數

26,000 5,245,786

= 0.004956. =. 1 202. 利息不計, 共花了一百三十萬元 (每注 50元)。

由上例可得到一些啟示: 在一個人的一生中, 自己或認識的人裡, 有中頭獎 (或發生很特 殊的事件) 者, 是不太稀奇的。 民國 90年 12月, 台北市新開幕的京華城購物中心, 為了促銷, 推 出一百名休旅車抽獎活動, 每天抽 10部, 購物每滿2,000元就可兌換一張抽獎券。 一對夫婦合計 抽中 7 部車, 造成不小的轟動。 這對夫婦共花了三百多萬元, 換來1,500餘張抽獎券。 抽獎活動 期間, 共投進約十四、 五萬張彩券, 每天箱內究竟有多少張彩券並不確定, 要算他們中 7 部車的 機率並不容易。 不過利用波松近似 (Poisson approximation, 見例 6之後的註 1), 估計此機率 約萬分之一左右, 當然是很小。 但從新聞的觀點, 只要有一這類幸運發生皆會引起注意 (也不一

(9)

定要 7部車, 只要 5部以上大約就有新聞價值了), 並不限京華城, 任何一家百貨公司, 任何一種 抽獎活動, 或任何一特殊事件皆行, 當然也不一定要發生在台北市。 如此一來發生的機率便更高 了。

一件事若發生在每個人身上的機率為百萬分之一, 則台灣兩千三百萬人, 每天發生二十餘 件是毫不稀奇的。 樂透彩中獎機率雖很低, 但若每一期賣出上千萬張, 則有幾個人中頭獎, 是很 合理的。 這個道理應不難弄明白。 不用因此常揣測那些人是如何中頭獎的。

例6. 美國紐約時報曾在第一版 (1986 年 2 月 14 日) 報導一位名叫 Adams 的女士第二度 贏得紐澤西 (New Jersey) 州的樂透彩頭獎。 1985年 10月 24日, 她第一次得三百九十萬美元, 第二次則得一百五十萬美元。 這是紐澤西州第一次有人得到兩次百萬美元以上獎金的樂透彩。

第一次中的樂透彩是 39取 6, 中頭獎之機率為 1

39

6

 = 1

3,262,623. 第二次中的樂透彩是 42取 6, 中頭獎之機率為

1

42

6

 = 1

5,245,786. 樂透彩主辦單位說, 一個人一生中中兩次頭獎之機率為

1

3,262,623 · 1 5,245,786

=. 1 1.7115 · 1013, 約十七兆分之一。

這樣算對嗎?

上述計算是假設 Adams 兩種彩券各買一張。 事實上 Adams 每週買好幾張且買了好幾 年。 而且在第一次中頭獎後, 便增加每週買的張數。 若在 39取 6的玩法裡, 每週買 3張, 在 42取 6 的玩法裡, 每週買 5 張, 則每週有大於百萬分之一的機率中頭獎:

1 − (1 − 3

3,262,623)(1 − 5

5,245,786) .

= 1.87265 · 10−6.

就用百萬分之一計好了, 在 4年 (約 200期, 每週一期) 裡, 一次頭獎皆未中的機率約為 (1 − 1

1,000,000)200 .

= e1,000,000200 = e5,0001 . 利用波松近似, 四年裡恰好中一次頭獎的機率約為

1

5,000e5,0001 =. 1 5,000,

(10)

恰好中兩次頭獎的機率約為 1 2( 1

5,000)2e5,0001 =. 1 50,000,000,

約五千萬分之一。 至於一個人終身 (以 30年, 1,500期計) 恰好中兩次頭獎之機率則約為 1

2( 1,500

1,000,000)2e1,000,0001,500 .

= 1.125 · 106. 略超過百萬分之一。

不論是五千萬分之一, 或百萬分之一的機率當然都很小。 但紐澤西州人口超過八百萬, 若 其中有一百萬 (= 106) 人, 一生中每期皆以上述方式買彩券 (兩種各買 3 張及 5 張), 則該州會 有人一生中至少中兩次頭獎之機率便很大了:

1 − (1 − 1.125 · 10−6)106 = 1 − e. −1.125= 0.6753..

若全美有五千萬 (= 5 · 107) 人, 每期皆以上述方式買彩券, 則即使只在 4 年裡, 至少有一人中 兩次頭獎的機率便已不算小了:

1 − (1 − 1

5 · 107)5·107 .

= 1 − e−1 .

= 0.6322.

1998年, Humphries 第二度贏得賓州樂透彩頭獎, 兩次合計有六百八十萬美元的獎金。 千 萬不要小看大數的威力。

有關巧合事件之討論, 可參考黃文璋 (1999b) 一文。

註1. 若n → ∞時, an→ 0, 且anbn → c, 其中|c| < ∞, 則n → ∞時, (1+an)bn → ec。 又若隨機變數Xn有參數為n及pn之二項分佈, n ≥ 1, 且滿足limn→∞npn = λ, 0 < λ < ∞, 則

n→∞lim P (Xn= k) = eλλk

k! , k = 0, 1, · · · . 這就是所謂波松近似, 為機率中一重要的結果。

人的天性很可能是不具有隨機性的。 Boland and Pawitan(1999) 一文曾做底下的實驗:

他們在所開設的初等統計學課程中, 以愛爾蘭國家樂透彩的玩法 (亦為 42 取 6), 要學生每人隨 機地寫出一組頭獎號碼, 如此得到 234組號碼。 結果這 234組號碼通不過隨機性的檢定。

隨機性的檢定是什麼呢? 我們以下例來說明。

例7. 你拿到一個銅板, 想看它是否為公正。 也就是想知道銅板正、 反面出現之機率是否 均為1/2。 假設此銅板為公正, 隨機投擲 10 次, 令X表所得正面數。 下表給出 X ≤ c 之機率 P (X ≤ c), c = 0, 1, · · · , 10。

(11)

c 0 1 2 3 4 5 6 7 8 9 10 P (X ≤ c) .001 .011 .055 .172 .377 .623 .828 .945 .989 .999 1

我們不會要求得到 5個正面才相信此銅板為公正, 因

P (X = 5)= 0.623 − 0.377 = 0.246,.

機率小於四分之一, 並非那麼大。 但若得到 8個正面, 可能就會懷疑此銅板出現正面之機率可能 大於1/2, 此因至少得到 8個正面之機率

P (X ≥ 8) = 1 − P (X ≤ 7) .

= 1 − 0.945 = 0.055, 並不太大。 若得到 9個正面懷疑便更強烈:

P (X ≥ 9) = 1 − P (X ≤ 8)= 0.011,.

此值更小。 若得到 10個正面 (機率為1/1,024= 0.000977) 懷疑心當然更強烈了。 至於機率多. 小才該懷疑, 乃視不同情況而定。 一般來說 0.1就算小, 0.05可說夠小, 0.01則是很小了。

上例說明統計裡假設檢定的基本想法, 與刑事訴訟法上的無罪推定原則 (被告未經審判證 明有罪確定前, 推定其為無罪) 類似。 在隨機性的檢定裡, 便是先相信各號碼出現的機率相同, 然後看會出現如此異常的機率是否夠小, 以判定該不該推翻出現的機率相同之假設。

由於在北銀 42 取 6 的樂透彩裡, 共有五百多萬種不同的組合, 而一年也僅開出 104 期, 每 一組號碼, 平均要五萬多年, 才會出現一次, 所以目前無法以各組號碼的出現頻率是否符合該有 的頻率, 來做檢定。 因此須以其他方式檢定。 通過檢定倒不一定表示號碼為隨機產生, 只是說尚 無不合; 但若不通過, 大約便不相信號碼為隨機產生。

假設有 42注樂透彩號碼:

1, 2, 3, 4, 5, 6; 7, 8, 9, 10, 11, 12; · · · ; 37, 38, 39, 40, 41, 42;

...

1, 2, 3, 4, 5, 6; 7, 8, 9, 10, 11, 12; · · · ; 37, 38, 39, 40, 41, 42.

即依序從 1 開始每次寫 6 個數字, 共 6 循環。 這 42 注號碼隨機嗎? 雖然 1 至 42 每個號碼出現的 次數一樣多, 都是 6次。 但卻無諸如(1, 7), (21, 42)這種 “ 對” 出現, 即每注中號碼之差異沒有 大於 5者。 因此這 42組有規律的號碼, 是通不過檢定的。

我們也可對偶數個數W , 最小間距MG, 最大間距L, 數字和S, 總間距數D, 及連號等做 檢定。 以總間距數為例, 在簽注時, 等差數列為許多人所愛好, 等差數列之總間距數為 1, 但會

(12)

出現等差數列之機率其實很低。 表 1至表 6給出隨機變數W 等之機率分佈。 很多證據顯示, 一般 人“ 隨意寫” 的號碼是不易符合隨機性的。 讀者可試著寫 50個 1至 42的數字, 許多人認為奇數 較隨機, 因此隨意寫的數字常以奇數居多, 看你的結果如何? 這方面的討論可參考黃文璋、 洪宛 頻及羅夢娜 (2002) 一文。 大家再回想本節一開始所提的那位記者, 自行 “隨機採樣” 很可能不 是真正隨機, 而只是隨意罷了。

由於缺乏隨機性的概念, 大部分人雖欲追求明牌, 但其實所追逐的往往卻是 “名牌” 。 樂透 彩除了普獎外, 是由中獎人均分該獎獎金。 而每組號碼中獎機率又相同, 所以該簽注熱門號碼還 是冷門號碼, 道理應很容易明白。 德國的樂透彩為49取6, 1993年10月16日那期共賣出6,803,090張 彩券,

表 7給出最熱門的 20組號碼。 諸位看, 如果簽中頭獎, 卻要與4, 000人共分獎金, 頭獎獎金 如果是一億元, 則每人只分到兩萬五千元。 這將是件多麼令人難過的事。 等差數列、 過去的頭獎 號碼、 修改過去頭獎號碼、 別國頭獎號碼、 與重大事件有關的號碼等, 都是一般人喜歡簽注的, 這些其實是名牌而非明牌。 由表 7可看出追求名牌之不智。 與其追求明牌卻追成名牌, 倒還不如 聽天由命 (隨機地選, 或採電腦選號), 至少結果不會更壞。

附帶一提, 那是否電腦選號較個人選號, 有較大之中獎機率呢? 我們看底下中國時報 92年 3 月 29 日 14 版記者蔡沛恆的一則報導。

昨日彩券銷售額降至五億五千七百萬元, 是去年底以來新低。 北銀彩券部經理楊 瑞東表示, 面對樂透彩銷售金額出現 “盤跌” 走勢, 北銀確實傷透腦筋, 甚至連 “取 消電腦選號” 的方式都考慮過, 後來因為影響層面過大而暫時作罷。

採用電腦選號可適度提升中獎率, 北銀評估暫停電腦選號主要是為了增加 「摃龜」

機會, 頭彩可以累積, 買氣自然上升。

楊瑞東進一步指出, 目前電腦選號比重約占六成, 六億元的銷售量等於有三億六 千萬元採電腦選號。 換算每二億六千三百萬元的銷售額就能開出一個頭獎, 與最近 每期頭獎得主一到二名的實際情況相比, 就能證明電腦選號果然保證每期都能開出 頭獎, 北銀樂彩的銷售量就欲高不易。

究竟電腦選號是否可適度提升中獎率? 暫停電腦選號是否可增加摃龜機會? 電腦選號是 否可保證每期都能開出頭獎? 這幾點有對的也有錯的, 也留給讀者自行思索。

表1. 42 取 6 樂透彩 W = i 之機率。

i 0 1 2 3 4 5 6

機率 0.01034 0.08146 0.23959 0.33720 0.23959 0.08146 0.01034

(13)

表2. 42 取 6 之樂透彩 MG = l 之機率。

l 1 2 3 4 5 6 7 8

P(M G = l) 0.5568 0.2704 0.1163 0.0422 0.01186 0.002183 0.0001748 0.000001334 表3. 42取6樂透彩 L= k 之機率。

k 1 2 3 4 5 6 7 8

機率 0.000007 0.000203 0.001272 0.004276 0.010326 0.020233 0.034169 0.051322

k 9 10 11 12 13 14 15 16

機率 0.069558 0.085374 0.095205 0.097488 0.093070 0.084134 0.072984 0.061337

k 17 18 19 20 21 22 23 24

機率 0.050294 0.040461 0.032071 0.025100 0.019396 0.014778 0.011083 0.008167

k 25 26 27 28 29 30 31 32

機率 0.005898 0.004163 0.002862 0.001908 0.001227 0.000755 0.000440 0.000240

k 33 34 35 36 37

機率 0.000120 0.000053 0.000020 0.000006 0.000001

表4. 42 取 6 樂透彩 S 落在各區間之機率。

區間 [21, 99) [99, 113) [113, 124) [124, 135) [135, 146) [146, 160) [160, 238) 機率 0.14039 0.14079 0.14244 0.15276 0.14244 0.14079 0.14039

表5. 42 取 6 樂透彩 D = i 之機率。

i 1 2 3 4 5

機率 0.000030 0.005250 0.107826 0.466809 0.420086 表6. 連號情況之機率。

情況 111111 21111 2211 222 3111 321 機率 0.44317 0.41547 0.07554 0.00148 0.05036 0.00889

情況 33 411 42 51 6

機率 0.00013 0.00444 0.00025 0.00025 0.000007 . 111111表無連號, 21111表恰有一組二連號,餘類推。

四. 隨機密碼

在電影裡屢有底下這類場景: 想潛入某人之電腦, 一再試他的密碼都不對。 突然看到他桌 上貼著女友的照片, 你知道他女友叫 Jeniffer, 一試果然對了。 再看底下 91年 11月 25日, 中廣

(14)

新聞網的一則報導。

表7. 1993 年 10 月 16 日德國樂透彩最熱門之 20 組號碼。

排名 組合 張數 排名 組合 張數

1 7 13 19 25 31 37 4004 11 8 14 21 25 36 39 2083 2 7 14 21 28 35 42 3817 12 6 25 27 30 34 39 1896 3 5 27 34 35 37 49 3698 13 9 17 20 21 26 41 1868 4 1 2 3 4 5 6 3249 14 2 10 18 26 34 42 1551 5 4 11 18 25 32 39 2821 15 5 10 15 20 25 30 1527 6 13 19 25 31 37 43 2335 16 44 45 46 47 48 49 1489 7 6 12 18 24 30 36 2288 17 12 24 32 36 40 42 1459 8 9 17 25 33 41 49 2227 18 1 10 20 30 40 49 1387 9 1 9 17 25 33 41 2116 19 43 44 45 46 47 48 1341 10 8 16 24 32 40 48 2097 20 1 7 22 28 43 49 1317 矇對別人的提款卡密碼123456, 盜領十多萬港幣。

香港一名三十四歲的江姓男子, 今年四月初在一部自動櫃員機上, 撿到一張先前 客戶未取走的提款卡。 他隨便亂按六個號碼, 竟給他矇對了, 於是他先後盜領十餘萬 港幣。

這名江姓男子撿到提款卡後, 隨意按下 [123456]這六個號碼, 沒想到竟然成功進 入銀行系統, 於是他立即盜領兩萬港幣。 在這張卡失效前, 他前前後後一共盜領十二 萬六千多塊港幣。

在針鋒相對 (Insomnia) 那部電影裡, 飾演警探的艾爾帕西諾 (Al Pacino), 受到嫌犯羅 賓威廉斯 (Robin Williams) 的要脅。 帕西諾將一把槍藏在空調的排氣口, 以為應很隱密, 奈 何人同此心, 被威廉斯找到而拿走。

如果要藏東西該如何藏呢? 將適合藏的地點編號, 隨機地挑一個, 應是最難被找到的。 假 設要以英文字母或數字造密碼, 隨機挑選應是最難被破解的。 如果你不夠 “隨機” (如前指出, 一 般人缺乏隨機性的, 有人一寫就是 123456, 以為別人必想不到), 可用抽籤或藉助隨機數表。 當 然這樣做也是要付出代價的。 由於那串密碼可能毫無意義, 不容易記憶, 自己可能會忘記。

我們再引一民國 92年 3月 29日, 中廣新聞網記者韓啟賢的一則報導。

最近新出現的 “網路芳鄰” 電腦病毒, 主要是入侵“密碼可以輕易被破解” 的電 腦伺服主機。 因此, 防毒公司呼籲網路使用者, 取個特殊的密碼, 並經常更換, 才是 避免被電腦病毒入侵破壞的最好辦法。 · · ·。

(15)

防毒軟體公司對此表示, 破解密碼已成為駭客快速入侵企業網路的模式。 而且, 駭客通常是使用 “字典攻擊法” 進行攻擊。 這種“字典攻擊法”, 就是以特定程式將所 有字典上的單字逐一嘗試, 破解密碼。 而這隻 “ 網路芳鄰” 電腦病毒, 就是採用“字 典攻擊法” 滲透上萬部電腦系統。

因此, 防毒軟體公司呼籲網路使用者, · · ·, 取個沒有邏輯可循的密碼, 避免使用 個人或親朋好友的生日或電話號碼, 英文字或是純數字組合, · · ·。

我們來簡單算一下好了。 一般英文字典可能有為數十萬左右的單字。 但若以英文單字為密 碼, 很可能是採常見字。 這種常用字, 總不超過兩萬個。 若以26個英文字母加上0, 1, · · · , 9等10 個阿拉伯數字混和編碼, 共 36 個字母或數字。 則長度為 6 的字母數字串 (這是國內航空公司訂 位代號的編碼方式), 共有

366 = 2, 176, 782, 336

種組合, 為一般人會想到的英文字 (如前以20,000個計) 的10萬倍以上。 如果原先的密碼, 字典 攻擊法平均一天可破解, 採隨機編碼, 平均而言, 便要十萬天 (約273年) 才能破解, 安全性當然 大幅度地提高。 駭客大約就一籌莫展了。 假若還不放心, 用長度為 7的字母數字串, 那就更保險 了。

在世說新語雅量篇, 周顗指著州官顧和的心問他 “此中何所有?” 顧和答以 “此中最是難 測地”。 後來周顗去見丞相王導, 對他說“卿州吏中, 有一令僕才!”

令僕乃指尚書令及僕射, 都是官名, 在唐、 宋為宰相之職。 一語道出心最難測, 便被後來也 當到左僕射的周顗, 驚為有蓋世之才。 但我們已指出, 並非每個人的心皆很難測, 除非心像隨機 密碼一般。 如果你明白此一道理, 說不定便有令僕才了。

參考文獻

1. 黃文璋 (1999a), 數學欣賞, 華泰文化事業股份有限公司, 台北市。

2. 黃文璋 (1999b), 純屬巧合, 數學傳播季刊, 第 23 卷第 4 期, 6-21。

3. 黃文璋、 洪宛頻、 羅夢娜 (2002), 樂透彩開出號碼隨機性之檢定, 中國統計學報, 第 40 卷第 3 期, 249-273。

4. 楊淑芬 (1991), 踏著歷史的足跡學數學−數學在數論教學上之應用, 科學月刊, 第 22 卷第 1 期, 64- 71。

5. 楊重駿、 楊照崑 (1983), 數論在密碼上的應用 (上)、 (下), 數學傳播季刊, 第 7 卷第 2 期, 16-22, 第 3 期, 2-7。

6. 楊重駿、 楊照崑 (1986), 數字密碼的一些新研究, 數學傳播季刊, 第 10 卷第 3 期, 29-34。

7. Boland, P. J. and Pawitan, Y. (1999), Trying to be random in selecting random numbers for lotto, Journal of Statistics Education 7, 1-9.

—本文作者任教於國立高雄大學應用數學系

參考文獻

相關文件

如果我們有 一個簡單的位移密碼, 則字母 e 變成密文中的某一個字母, 所以這個字母出現 的頻率會跟 e 在原文中出現的頻率一樣。 因此頻率分析之後, 鑰匙可能就會被逼現身。

這對傳統的密碼系統來說是不可能的, 因為解密鑰匙與加密鑰匙是對稱的, 公開加密鑰匙 就等於是公開解密鑰匙。 所以我們必須將加密鑰匙與解密鑰匙之間的對稱性打破, 唯有如此才 能突破僵局。

編號 國籍代碼 護照號碼 姓名 照片 性別代碼 入國日期 備註. *國籍代碼:印尼 009、馬來西亞 019、蒙古 021、菲律賓 024、泰國 030、越南 033。

恩尼格瑪密碼機旋轉盤的工作原理圖,連續按兩次 A 鍵後,電流會流經所有旋轉盤,通 過反射器後分別向反方向流到 G 燈和 C 燈。

如 2011 年,美國航太公司洛克希德馬丁(Lockheed Martin)所研製的 F-35 戰 機數據資料遭網軍竊取。其攻擊的流程,便是先以洛馬所採用的動態密碼供應 商 RSA 為目標,將惡意程式偽裝成

更且,中國網軍竊密內容涵蓋國安、國防、外交、軍情與高科技及商業機 密,對國家安全造成之威脅以及產生之實害,自屬重大。因此,制定《國

當你動手在紙上, 把鄭一, 吳二, 張三, 李四, 王五, 陳六, 何七, 趙八, 梁九, 劉 十· · ·擺弄成三堆的時候, 你會覺得, 這個問 題不勝其繁。.. 讓

四、主管機構密發給個人的權責代碼及密碼,係用於操作電腦以存取重要機密