8 閒聊機率與統計…與其請問上帝是否擲骰子,不如研究上帝 怎麼擲骰子
題目:有甲﹑乙兩粒均勻的正四面體骰子,在甲骰子的四面分別寫上 1,2,2,3 四個數字;
在乙骰子的四面分別寫上 1,3,3,5 四個數字。將甲﹑乙兩粒骰子同時投擲時,其點數和的 機率分佈為何?(考慮壓在桌面上那一面的數字和)
丟一枚公正的銅板,不是正面就是反面朝上,而且其機率都一樣是1
2;投擲一粒均勻的 骰子(正立方體),也只會出現六種情況,點數 1,2,3,4,5,6 朝上的機率都一樣是1
6。
這兩個結果可以從多次的實驗得到驗證,不需要求神問卜,請問上帝。日常生活中,類 似這樣的機率活動有許多,如何得到各種情況發生的機率分佈是人們很感興趣的一件事。
與其求見上帝,問他這機率分佈是多少,不如善用手邊的數學知識,親手研究這機率分 佈來得實際。
頭腦是一切不真實的集合,它總是思考著讓所有的事 情都完美。但人生幾時完美呢?是故,每當頭腦被大量使 用,想做完美的事時,它總是站在選擇錯誤的那一面,因 為它選擇了完美的冒牌貨或替代品…世故或是沒稜沒 角,像球或圓一樣的圓滑。只有你相信生命只能美麗,沒 辦法完美,那頭腦的選擇才會是正確的選擇。當你達到
“不用選擇是唯一且最好的選擇”時,你就進入人生這粒 骰子的最高境界了。
十賭九輸,十墓九空,雖然是兩句成語,但它們反映 了人們貪婪的天性。所以很多遊戲,它們發生的機率並不 如想像中那樣簡單。如何巧妙地發現它們,又科學地計算 它們,確實是對人類的一大挑戰。
8.1 利用多項式的乘法運算擲骰子…均勻骰子
將甲﹑乙兩粒骰子同時投擲,那麼甲﹑乙兩粒骰子的點數和分佈次數可以由底下的多項 式乘法看出
1 2 2 3 1 3 3 5
1 2 3 1 3 5
2 3 4 5 6 7 8
2 2
2 3 4 3 2 . x x x x x x x x
x x x x x x
x x x x x x x
同時投擲甲、乙兩粒骰子的樣本空間有 4 4 16 種,而點數和的分佈次數可由上述多項 式的係數決定。例如點數和為 4 的情況有 3 種,即 ( , ) (1,3),(1,3),(3,1)甲乙 三種,它們分 別對應到上述多項式的乘積展開式
1 3 1 3 3 1 4
3 . x x x x x x x 所以同時投擲甲﹑乙兩粒骰子的點數和機率表為
練習 1 如果甲﹑乙兩粒均勻的正四面體骰子的四個面都是寫上 1,2,3,4 四個數字,那麼 將甲﹑乙兩粒骰子同時投擲時,其點數和的機率分佈為何?當你完成此問題時,
請將答案與本章題目的答案比較一下,你的發現是什麼呢?對於你的發現,你 可以用多項式的性質,講得更深入嗎?
練習 2 有甲﹑乙兩粒均勻的正六面體骰子,在甲骰子的六面分別寫上 1, 3, 4, 5, 6, 8 六 個數字;在乙骰子的六面分別寫上 1, 2, 2, 3, 3, 4 六個數字。將甲﹑乙兩粒骰子 同時投擲時,其點數和的機率分佈為何?
8.2 利用二項式定理擲骰子…楊輝三角 二項式定理是說 (x y)n的展開式可以寫成
0 1 1 2 2 1 1 0
0 1 2 1
(x y)n Cnx yn Cnxn y Cnxn y Cnn x yn Cnnx yn 的形式。這個恆等式的係數 !
C ( )! !
n k
n n k k
。若將這些係數依 n 值的大小,由上而下;依 k 值的大小,從左至右排列,則可以排列成如下的楊輝三角:
由二項式定理知道:(x y)n1展開式中x(n 1) ryr項的係數為Cnr1;而把(x y)n1寫成 (xy) (n x y)的乘積,將 (x y)n展開並計算其與 (x y)的乘積,得
1 1
1 1 1
C C ( )
C C .
n n r r n n r r
r r
n n n r r
r r
x y x y x y
x y
因此,二項式定理的係數滿足
1
Cnr Cnr Cnr1,
也就是說,楊輝三角上的任一個數等於其上方左﹑右兩數的和。
二項式定理(代數形式)與楊輝三角(幾何模型)被廣泛使用來解釋許多數學問題,接 下來舉兩個例子作說明:
① (彈珠台)如果彈珠台是一個三角形,當彈珠從頂點下降一格時,有一半的機率向 右走﹑另一半的機率會向左走,那麼該如何描述彈珠的落點分佈呢?楊輝三角就是 一個很好的模型:將三角形的彈珠台想成楊輝三角,當你投下 1 粒彈珠時,楊輝三 角的第 1 列的數字 1 就是它的分佈;當你投下 2 粒彈珠時,楊輝三角的第 2 列的數 字 1, 1 告訴你,它的分佈是左﹑右各 1 粒;當你投下 4 粒彈珠時,楊輝三角的第 3 列的數字 1, 2, 1 告訴你,它的分佈是左﹑右各 1 粒,中間有 2 粒,也就是說,彈珠
跑到左﹑右兩側的機率分別是1
4,而落在正中央的機率是1
2;依此類推,當你投下 16 粒彈珠時,楊輝三角的第 5 列的數字 1, 4, 6, 4, 1 告訴你,應該有 6 粒彈珠會落在 正中央。從這過程發現,楊輝三角是解釋彈珠台遊戲的最佳幾何模型。
② (分割線段)將一條一公尺長的線段,依1: 3的比例分割成兩條小線段,再將這兩條 小線段,分別依1: 3的比例各分割成兩條小線段,依此類推,在五次分割之後,會 製造出 32 條小線段。你如何知道這 32 條小線段的長度及同一長度的線段各幾條呢?
拜二項式定理所賜,可以利用
5 1 2 3 4 5
5 5 5 5 5 5
0 5 1 5 2 5 3 5 4 5 5 5
1 3 1 3 3 3 3 3
C C C C C C
4 4 4 4 4 4 4 4
展開式中的每一項與該項係數來解釋這問題。將展開式中係數算出,得
5 1 2 3 4 5
5 5 5 5 5 5
1 3 1 3 3 3 3 3
1 5 10 10 5 1 .
4 4 4 4 4 4 4 4
這個式子告訴我們:線段長度有
1 2 3 4 5
5 5 5 5 5 5
1 3 3 3 3 3 , , , , , 4 4 4 4 4 4 等六種,每種長度有
1, 5, 10, 10, 5, 1 條,一共
32 1 5 10 10 5 1
條線段。由此發現,分割線段可透過二項式定理的代數形式闡釋。
8.3 利用對數性質擲骰子…班佛法則
機率分佈的一個重要性質就是所有事件的機率總和是 1,例如丟一枚公正的銅板,出現 正面事件的機率是1
2,而出現反面事件的機率也是1
2,這兩個數字的和1 1
2 2就是 1。投 擲一粒均勻骰子也有同樣的性質,也就是說出現點數 1,2,3,4,5 與 6 的機率都是1
6,而它
們的和1 1 1 1 1 1
6 6 6 6 6 6也是 1。
如果你會利用對數性質log10alog10blog10ab與log 10 110 的話,你將發現底下九個介 於 0 與 1 之間的數字和也是等於 1:
10 10
10 10
10 10
10 10
10 10
10 10
10 10
10 10
10
1 2
log 1 log ;
1 1
1 3
log 1 log ;
2 2
1 4
log 1 log ;
3 3
1 5
log 1 log ;
4 4
1 6
log 1 log ;
5 5
1 7
log 1 log ;
6 6
1 8
log 1 log ;
7 7
1 9
log 1 log ;
8 8
log 1 1
1010 log .
9 9
班佛發現日常活動中,有許多以上述九個數字為機率分佈的機率模型。最有名,也最容 易被誤解的一個模型就是“隨手寫下正整數”這個模型。如果請全班或全校的每位學生 隨手寫下一個正整數,那麼這些正整數的首位數字(例如 2489 的首位數字就是 2)的分 佈機率為何呢?很多人可能把這遊戲想成跟擲骰子一樣,認為首位數字是 1 的會佔1
9, 首位數字是 2,3,4, ,9 的也都各佔1
9。事實並不是這樣的,班佛研究發現,學生所寫正 整數的首位數字之分佈並不均勻,首位數字是 (1d d 9)的比例約為 10 1
log 1 d
。 另一個有趣的發現:當妳翻閱圖書館的藏書時,你會發現每本書的每一頁被翻閱的次數 不相同,如何辨識呢?很簡單,只需看書本側邊黑白的程度,越黑的哪幾頁肯定被閱讀
最多次。如果你去統計的話,你將發現頁碼的首位數字是 (1d d 9)的被翻閱的比例是
10
log 1 1 d
。
像這兩個例子,當你研究與正整數相關的首位數字分佈,如果首位數字 (1d d 9)的分 佈比例為 10 1
log 1 d
,就稱它符合班佛法則。接下來列舉一些符合班佛法則的事件:
① (存摺存款的首位數字)郵政總局如果統計每位存款人的存款錢數的首位數字,他 可能會驚訝的發現,這個首位數字的分佈並不均勻,反而符合班佛法則。也就是說,
一百多元,一千多元,一萬多元,十餘萬元,百餘萬元,千餘萬元,…等的存款戶 約佔log 210 0.3010左右。
② (河流流過的區域面積)統計全世界所有河流所流經的區域面積,這面積的首位數 字也會符合班佛法則。
③ (財務報表的首位數字)你的公司想作假帳,逃漏稅嗎?那你得懂班佛法則才有辦 法得逞。公司每日進進出出的貨物很多,產生的數據自然龐大,國稅局如何監控公 司是否數據造假,逃漏稅呢?這都要歸功於班佛法則,根據統計,如果公司正常運 作下,那麼所產生的數據的首位數會符合班佛法則。國稅局為了節省時間與人力,
只需查核該公司的數據的首位數字是否符合班佛法則,便可知道該公司的數據是否 造假了。
④ (都市人口數字的首位數字)每個都市的人口數的第一位數字也會符合班佛法則。
⑤ ( 2n的首位數字)將數列 2 n 的前一千項列出,統計這一千個數字之首位數,你將 發現它們的分佈完全符合班佛法則的比例。不止一千項,列出一萬項或更多項,也 都會符合班佛法則。
⑥ (費氏數列的首位數字)費氏數列 fn 定義為
1 2 1, n 2 n 1 n( 1).
f f f f f n
數學家猜測費氏數列 fn 的首位數字符合班佛法則。
⑦ (質數的首位數字)將質數依小到大排列 2,3,5,7,11, 。數學家猜測它們的首位數字 會符合班佛法則,但尚未被證實。
班佛發現的首位數字分佈現象不僅與人類選取數字的心理相關,也與自然界的多種分佈 一致。與班佛法則一樣出名的另一個法則是齊普夫法則,它是美國社會學家齊普夫發現 的:齊普夫的學生很有耐心地去計算《哈姆雷特》這本書中所出現的字,並且依照它們 的出現頻率做降冪排列。頻率最高的字是“ the ”,共出現 1087 次,緊跟在後面的則 是“ and ”這個字。齊普夫發現,它們的分布狀況遵行了一個數學的金科玉律。當一 個人寫書時,將整本書所出現的字,依照它們出現頻率做降冪排列,出現頻率第 n 高的 字出現次數與出現頻率最高的字出現次數的比值,可以用數學公式
k
c n
來表示,這裡的常數 ,c k 與作者寫這本書時的心理素質相關。
齊普夫法則不僅寫書適用,也適用在許許多多的日常生活中,網頁瀏覽人數統計分佈就 是一個例子。如果將某特別類別的網頁每日瀏覽人數,依多到少做統計,那麼第 n 高的 網頁每日瀏覽人數與最高的網頁每日瀏覽人數的比值,也會符合齊普夫法則。
例題 1 一位作家出版一本書,書中出現頻率最高的字一共出現 1000 次,第 5 與第 10 高的字的出現次數分別為 40 與 10 次。若該書符合齊普夫法則,則求齊普夫常數 ,c k 的 值。
【解】由齊普夫法則得到
40 ; 5 1000
10 . 10 1000
k
k
c
c
將兩式相除得到
2k 4 k 2.
將k 2代入第一式得
2
40 1.
5 1000
c c
故齊普夫常數c1,k 2。
練習 3 某特別類別的網頁每日瀏覽人數統計表符合齊普夫法則。若將每日瀏覽人數第 n 高的瀏覽人數記為 ( )f n 人,把log n 當 x 座標,10 log10 f n 當 y 座標,則證明( ) 這些數對 ( , )x y 座落在一條直線上。
練習 4 帕累托有一個法則說:在一個國家裡,年收入超過 m 元(美金)的人數佔全體 人數的
k , c m
這裡的常數 ,k c 與這個國家有關。有一個國家年收入的中位數是 14400 元(美 金),而且知道該國家帕累托常數k 0.5。
① 求帕累托常數 c 的值。
② 在該國家,年收入超過多少時,可以擠進高所得的族群。(註:年收入在前 20% 的人士算高所得族群)
8.4 利用夢境擲骰子…夢的奧秘
在丹增嘉措活佛所著的書《探索夢的奧秘》中,提到愛迪生如何利用夢境的故事:「我 們剛睡醒的時候,夢境的回憶猶歷歷在目,這時尚未完全醒過來,稱為半睡半醒狀態。
有人認為半睡半醒狀態是一種天才狀態,有很深刻的創造力,就像大發明家愛迪生發明 電燈泡的創造力一樣。愛迪生很看重這種半睡半醒狀態,每次在潛心研究發明時,會運 用自己的技巧,進入半睡半醒狀態。他會端坐在椅上,利用放鬆與冥想技巧進入寤寐之 間的潛意識狀態。愛迪生手握兩個鐵球,手心向下,然後舒服坐在椅子上,手肘靠近扶 手,雙手下方的地面上放有鐵盤。當愛迪生入睡時,手就放鬆而自然張開,鐵球就自然
掉落,碰擊鐵盤而發出聲響,吵醒自己,然後一再重複這個動作。」事實上,在夢學領 域從事研究的學者指出:“夢境約有百分之七十的內容是象徵和隱喻組成,百分之十五 是實際記憶,最後的百分之十五是變形和偽裝。”
例題 2 從過去盜墓者間的資料得知,每盜十個墓,約有九個是空墓,早就被盜走陪葬 品。試問:一位盜墓者至少應該盜幾個墓,才有過半的機會,能盜得陪葬品。
【解】令盜墓者盜 n 個墓時,會有過半的機會,盜得陪葬品。也就是說,盜 n 個墓時,
都是空墓的機率少於一半,即
0.9n 0.5.
將兩邊取對數得到
10 10
(log 9 1) log 2.
n
利用log 910 2log 310 2 0.4771 0.9542,log 2 10 0.3010得到 0.0458n0.301 n 6.572.
故盜墓者至少應該盜 7 個墓,才有過半的機會,能盜得陪葬品。
8.5 利用累積的經驗擲骰子…比賽制度的選擇
運動競賽或棋藝比賽常採取多場的比賽制度,如三戰兩勝,五戰三勝或者是七戰四勝等。
運動選手或下棋者應該參加或採用那個比賽制度,對自己最有利呢?讓我們計算看看!
例題 3 你和你的好朋友經常打桌球,根據過去的經驗得知:在每一局中,你獲勝的機 率為 p(1
2 p 1)。今天你的好朋友想跟你來一場比賽,至於是採三戰兩勝或者是五戰 三勝的比賽制度,由你決定。問:你應採取那一種比賽制度才有較高的勝算。
【解】設在三戰兩勝及五戰三勝中,贏得比賽的機率分別為P 與3 P 。經由計算得到 5
2 3 2
3 2
2 2
3 4 3 3 5 4 3 2
5 3 3 3 3
3 3 3 2
C 1 (1 ) 2 (1 );
C C (1 ) C C (1 ) 3 (1 ) 6 (1 ) .
P p p p
p p p
P p p p p p
p p p p p
因為1
2 p 1,所以 1 1 2 p0及
2 2
3 3 3 2
3 5
2 2
2 (1 ) 3 (1 ) 6 (1 ) 3 (1 ) (1 2 ) 0.
P P p p p p p p p p
p p p
故選五戰三勝贏得比賽的機率較高。
閒聊機率與統計…與其請問上帝是否擲骰子,不如研究上帝怎 麼擲骰子的練習題解答
練習 1
設有甲﹑乙兩粒均勻的正四面體骰子,在甲骰子的四面分別寫上 1,2,3,4 四個數字;在乙 骰子的四面也分別寫上 1,2,3,4 四個數字。如果將甲﹑乙兩粒骰子同時投擲,會出現
4 4 16種情況,那麼甲﹑乙兩粒骰子的點數和分佈次數可以由底下的多項式乘法看出
1 2 3 4
1 2 3 4
2 3 4 5 6 7 8
2 3 4 3 2 . x x x x x x x x
x x x x x x x
因此,同時投擲甲﹑乙兩粒骰子的點數和機率表為
① 發現:這個練習題的機率分布表與本章題目的機率分布表是一樣的。
② 原因:多項式x22x33x4 4x53x62x7x8可以分解成
x1x2 x3x4
x1x2 x3x4
與
x1x2 x2 x3
x1x3x3x5
的兩種不同乘積。
練習 2
甲、乙兩粒骰子的點數和分佈次數可以由底下的多項式乘法看出
1 3 4 5 6 8 1 2 2 3 3 4
1 3 4 5 6 8 1 2 3 4
2 3 4 5 6 7 8 9 10 11 12
2 2
2 3 4 5 6 5 4 3 2 . x x x x x x x x x x x x
x x x x x x x x x x
x x x x x x x x x x x
因此,同時投擲甲﹑乙兩粒骰子的點數和機率表為
練習 3 令最高的瀏覽人數為 a 人。由齊普夫法則知道
( ).
k
c f n n a 兩邊取對數
10 10 10 10
log cklog nlog f n( ) log a, 整理得到直線方程式
10 10 10 10 10
log log ( ) log log log , k n f n c a ac
其中xlog10n y, log10 f n( )。故數對 ( , )x y 座落在一條直線上。
練習 4
① 因為中位數是 14400 元美金,所以我們知道年收入超過 14400 元美金的人數佔全體 人數的
1. 2 由帕累托法則得到
0.5
1 1
2 14400 2 60.
k
c c
m
c
② 設年收入超過 m 元時,是屬於高所得的族群。由題意知
0.5
60 20
90000.
100 m
m
故年收入超過 90000 元時,可以擠進高所得的族群。