Discrete Probability Distributions
離散型機率分配
離散型機率分配
統計對象 型態 分配類型
母體分配 樣本分配
離散型 機率分配
均勻分配 二項分配 多項分配 負二項分配 超幾何分配 幾何分配 伯努利分配 波松分配 連續型
機率分配
連續均勻分配 常態分配 標準常態分配 指數分配 Gamma分配 卡方分配
抽樣分配 機率分配
樣本比例差( Ƹ𝑝 − 𝑝 ) 平均數~
Z分配 t分配
變異數~
單母體變異數 卡方分配
兩母體變異數比 F分配
常見離散型機率分配
分配類型 適用情境說明 分配函數
均勻分配
discrete uniform distribution
無論隨機變數如何變化,其 機率值為固定常數,例如投
擲一次骰子,機率都是1/6 𝑓 𝑥 = ቐ 1
n , x = 1,2, . . , n 0 , other
二項分配
binomial distribution
在成功與失敗的機率不變情 況下,不斷重複試驗所得的 機率分配函數
𝑓 𝑥 = 𝐶xn px qn−x , x=0,1,..,n
其中p為成功機率;q為失敗機率
伯努利分配
bernoulli distribution
在二項分配下,不論成功或 失敗,只做一次(n=1),
算是二項分配的特例
𝑓 𝑥 = px q1−x , x=0,1
其中p為成功機率;q為失敗機率
超幾何分配
hyper geometric distribution
從N物中採抽出不放回抽樣,
抽出n個樣本,其中N物中,
有S個相同,N-S個不同。
所以每次抽樣都會受前次抽 樣影響
𝑓 𝑥 = 𝐶
xSC
n−xN−SC
nN,
0 ≤ x ≤ min(n,S) 波松分配
Poisson distribution
在一個單位時段或區段內,
某事件發生次數(X)的問 題
𝑓 𝑥 = 𝑒−𝜆 𝜆x
x ! , x = 0,1,2 … 𝜆 為平均次數
其他離散型機率分配
分配類型 適用情境說明 分配函數
多項分配
multinomial distribution
二項分配的延伸,二項分配 是把母體分成二種類別,而 多項分配則將母體分類超過 兩個以上
𝑓 𝑥1, 𝑥2, … , 𝑥𝑘
= 𝑛!
𝑥1! 𝑥2! ⋯ 𝑥𝑘! 𝑝1𝑥1𝑝2𝑥2 ⋯ 𝑝𝑘𝑥𝑘
= C𝑥n1,𝑥2,…,𝑥𝑘 𝑝1𝑥1𝑝2𝑥2 ⋯ 𝑝𝑘𝑥𝑘
負二項分配
negative binomial distribution
第 r 次成功所需試驗的次數
(每次都是伯努利試驗)
(X表示第 r 次事件發生時 所需試驗次數)
𝑓 𝑥 = 𝐶r−1x−1 pr qx−r ,
𝑥=r, r+1, r+2, …..
其中p為成功機率;q為失敗機率
幾何分配 geometric distribution
不斷進行伯努利分配,直到 第1次成功為止所需試驗次
數之機率函數
𝑓 𝑥 = q
x−1p , x =0,1,2,….
其中p為成功機率;q為失敗機率
discrete uniform distribution
均勻分配
函數定義(分配形式)
無論隨機變數如何變化,其機率值為固定常數,
例如投擲一次骰子,機率都是1/6
𝑓 𝑥 =
1
n , x = 1,2, . . , n 0 , other
1 2 3 n
………
𝑓 𝑥 1
𝑛
x
若我們對母體的情況未知,通常我們 採用隨機方式抽樣時,最常就是預設 事件發生的機率服從均勻分配。例如
抽籤時,每支籤的機率相同;
隨機調查大樓住戶的滿意度,每戶 被抽到的機率相同;
擲骰子的機率、抽撲克牌的機率等
均勻分配的重要參數
期望值 變異數
E(x) = n + 1 2
V(x) = n 2 − 1 12
證明:
𝐸 x =
x=1 n
𝑥𝑓 𝑥 =
𝐸 x2 =
x=1 n
x2𝑓 𝑥 =
V x = 𝜎2 = 𝐸 x2 − 〔E(x)〕2 =
binomial
distribution
二項分配
函數定義(分配形式)
在成功與失敗的機率不變情況下,不斷重複試驗所得 的機率分配函數
𝑓 𝑥 = 𝐶 x n p x q n−x , x =0,1,..,n
其中 p 為成功機率;q=1-p 為失敗機率P = 0.1 P = 0.25 P = 0.5 P = 0.75
對稱
右偏 右偏 左偏
分配的重要參數
期望值 變異數
E(x) = n p
V x = npq = np(1-p)
證明:
𝐸 x =
x=1 n
𝑥𝑓 𝑥 =
𝐸 x2 =
x=1 n
x2𝑓 𝑥 =
V x = 𝜎2 = 𝐸 x2 − 〔E(x)〕2 =
案例
假設台北市約有40%的人們喜歡棒球運動,現於 市區中隨機訪問1人,試問(a)此人喜歡棒球運動 的期望值為何?變異數與標準差為何?(b)若隨機 訪問5人,試問我們可以期望5人中喜歡棒球的人 數與變異數、標準差為何?有2人喜歡棒球運動的 機率為何?至少有3個人喜歡棒球運動的機率為何?
「現代統計學」p88,吳柏林 著,五南圖書
案例解說
(a)(隨機訪問1人)此人喜歡棒球運動的期望值為何?變異數與標準差為何?
令隨機變數 X 代表喜歡棒球與否,則 執行次數 n=1 ;p=0.4 期望值 E(X) =np=(1)(0.4)=0.4
變異數 V(X) =σ2=pq=np(1-p)=(1)(0.4)(1-0.4)=0.24 標準差 σ = 0.24 ≒ 0.49 (b)若隨機訪問5人,試問我們可以期望5人中喜歡棒球的人數與變異數、標準差為何?
有2人喜歡棒球運動的機率為何?至少有3個人喜歡棒球運動的機率為何?
令隨機變數 X 代表喜歡棒球的人數,則 執行次數 n=5 ;p=0.4 期望值 E(X) =np=(5)(0.4)=2
變異數 V(X) =σ2=pq=np(1-p)=(5)(0.4)(1-0.4)=1.2 標準差 σ = 1.2 ≒ 1.1 P(X=2)= 𝐶xn px qn−x = 𝐶25 (0.4)2(1 − 0.4)5−2 = 5 × 4
1 × 2 × 0.0346 = 0.346
P(X≧3)=1-P(X≦2)=1-(P(X=0)+P(X=1)+P(X=2))=1- σx=02 Cx5(0.4)x(0.6)5−x =0.317
bernoulli
distribution
伯努利分配
函數定義(分配形式)
在二項分配下,不論成功或失敗,只做一次(n=1),
算是二項分配的特例
𝑓 𝑥 = p x q 1−x , x =0,1
其中 p 為成功機率;q=1-p 為失敗機率
P = 0.7 P = 0.2
分配的重要參數
期望值 變異數
E x = p
V x = pq = p(1-p)
證明:
𝐸 x =
x=1 n
𝑥𝑓 𝑥 =
𝐸 x2 =
x=1 n
x2𝑓 𝑥 =
V x = 𝜎2 = 𝐸 x2 − 〔E(x)〕2 =
hyper geometric distribution
超幾何分配
函數定義(分配形式)
從 N 物中採抽出不放回抽樣,抽出 n 個樣本,其中 N 物中,有 S 個相同,N-S 個不同。所以每次抽樣 都會受前次抽樣影響
𝑓 𝑥 = 𝐶 x S C n−x N−S
C n N 0 ≤ x ≤ m in(n,S)
n = 50 n = 20 n = 10 n = 5
分配的重要參數
期望值 變異數
E(x) = n p V x = 𝑁−𝑛
𝑁−1 npq
證明:
𝐸 x =
x=1 n
𝑥𝑓 𝑥 =
𝐸 x2 =
x=1 n
x2𝑓 𝑥 =
V x = 𝜎2 = 𝐸 x2 − 〔E(x)〕2 =
其中 p = n N; q=1-p
有限母體修正因子
(finite population correction) 當母體總數很大時(N→∞),
每次抽樣成功的機率都可以視 為成功:
𝑁→∞
𝑙𝑖𝑚
𝑁−𝑛
𝑁−1
=
1 , V(x) = npq 此時超幾何分配會趨近二項分配,一般以 n/N ≦ 0.05 時作為判別
案例
1.從6男3女中隨機抽出4人組成委員會,求此委員 會中男性人數與女性人數的機率分配?
「應用統計學 二版」p147,李德治、童惠玲 著,博碩文化
2.一批產品共有10件,其中含有2件不良品?今隨
機抽取3件,求均為良品的機率?
案例解說
1 ) 令 X 表委員會中男性人數、Y表委員會中女性人數,符合超幾何分配:
所以 N=6+3=9;S=6 ;n=4
𝑓 𝑥 = 𝐶
x6C
4−x9−6C
49, x=1,2,3,4 𝑓 y = 𝐶
x3
C
4−y9−3C
49, y=0,1,2,3
2 ) 令 X 表不良品件數,符合超幾何分配,所以 N=10;S=2 ;n=3 ,所以
𝑓 𝑥 = 𝐶
x2C
3−x10−2C
310, x=0,1,2
均為良品的機率:
𝑓 0 = 𝐶
02C
3−010−2C
310= 7
15
超幾何分配與二項分配
超幾何分配 二項分配
選取方式 取後不放回 取後放回
是否獨立 否 是
期望值 np np
變異數 npq
N−nN−1
npq
超幾何分配的近似分配
當 n/N ≦ 0.05 ,(N-n)/(N-1) 趨近於1
n/N ≦ 0.05
超幾何分配 二項分配
Poisson
distribution
波松分配
函數定義(分配形式)
λ = 1 λ = 3 λ = 5 λ = 10
𝑓 𝑥 = 𝑒 −𝜆 𝜆 x
x ! , x = 0,1,2 … 𝜆 為平均次數
在一個單位時段或區段內,某事件發生次數( X )
的問題(常用於關於時間、長度、面積、…等問題)
分配的重要參數
期望值 變異數
E(x) = λ V x = λ
證明:
𝐸 x =
x=1 n
𝑥𝑓 𝑥 =
𝐸 x2 =
x=1 n
x2𝑓 𝑥 =
V x = 𝜎2 = 𝐸 x2 − 〔E(x)〕2 =
案例
台灣地處亞熱帶,常受颱風過境的自然災害困擾。
每年夏季6月至9月為颱風侵襲台灣的主要季節。
中央氣象局統計資料指出,平均每年約有5個颱風 過境台灣。試問明年沒有颱風過境台灣的機率為 多少?明年將有5個颱風過境台灣的機率為多少?
明年超過7個以上颱風過境台灣的機率為多少?
「現代統計學」p92,吳柏林 著,五南圖書
案例解說
(a)沒有颱風過境台灣的機率為多少?
令隨機變數 X 代表每年颱風過境台灣次數,本題符合 λ=5 的Poisson分配 P(X=0▕ λ=5)= 𝑒−𝜆 𝜆x
x !
=
𝑒−5 500 ! = 0.0067 (b)將有5個颱風過境台灣的機率為多少?
P(X=5▕ λ=5)= 𝑒−𝜆 𝜆x
x !
=
𝑒−5 555 ! = 0.1755 (c)超過7個以上颱風過境台灣的機率為多少?
P(X ≧ 7▕ λ=5) = 1-P(X ≦ 6) = 1 -〔P(X=0) + P(X=1) + P(X=2) +…+ P(X=6)〕
= 1 - 〔
σ
k=06 𝑒−𝜆 𝜆kk !
〕 = 1 - 〔
𝑒−5 500 !
+
𝑒−5 511 !
+….+
𝑒−5 566 !
〕
= 1-0.7622= 0.2378
Poisson的近似分配
當二項分配成功機率 p → 0 且 n → ∞ 時,
二項分配會趨近Poisson分配。因為Poisson 分配的機率計算較容易,所以當二項分配的
成功機率很小時,就可以用Poisson分配來計算
p → 0 且 n → ∞
Poisson 分配 二項分配
表示成功機率很小時
λ = np
各種機率分配的關係
常態分配 幾何分配
超幾何分配
伯努利分配 負二項分配
二項分配
多項分配
指數分配
Gamma 分配
卡方分配 𝜒
22卡方分配 𝜒
𝜈2成功1次
就停止 成功 r 次 就停止
取出 不放回
分類超過二項
n 大 p 小
𝜆 = 1 𝛽
𝛽 = 1 𝜆
𝜆 → ∞ 𝛽 = 2
a= 1
𝛽 = 2 a= 𝜈
2
𝑛𝑝 ≥ 5, 𝑛𝑞 ≥ 5 𝑛
𝑁 ≤ 0.05
n = 1
※資料來源:統計學第二版,李德治、林孟儒、童蕙玲 著,
博碩文化,p10-42
常用機率分配 離散型分配 連續型分配