Continuous
Probability Distributions
連續型機率分配
連續型機率分配
統計對象 型態 分配類型
母體分配 樣本分配
離散型 機率分配
均勻分配 二項分配 多項分配 負二項分配 超幾何分配 幾何分配 伯努利分配 波松分配 連續型
機率分配
連續均勻分配 常態分配 標準常態分配 指數分配 Gamma分配 卡方分配
抽樣分配 機率分配
樣本比例差( Ƹ𝑝 − 𝑝 ) 平均數~
Z分配 t分配
變異數~
單母體變異數 卡方分配
兩母體變異數比 F分配
常見連續型機率分配
分配類型 適用情境說明 分配函數
連續均勻分配
uniform distribution
隨機變數(X)在某連續區
間內所發生的機率都相同
𝑓 𝑥 =
1b−a
, a ≤ x ≤ b
常態分配
normal distribution
存在於大自然間的各種現 象或狀態,都可以將母體
視為常態分配 𝑓 𝑥 = 1
2 𝜋 𝜎 e−
1 2
(x−𝜇)2 𝜎2
− ∞ < x < ∞, μ為平均數, 𝜎為標準差
標準常態分配
standard normal distribution
透過 z = x−𝜇
𝜎 的「標準
化」,將原本要利用微積 分計算求值,轉換成可以 利用查表得到結果
𝑓 𝑥 = 1
2 𝜋 e−z
2
2 , − ∞ < z < ∞
指數分配
exponential distribution
與Poisson隨機變數相反,
指數分配的隨機變數(X)
是描述連續兩事件發生的 間隔時間
𝑓 𝑥 = 1 𝛽 e−
x
𝛽 , x ≥ 0
x 為第一次發生事件所需時間;
β 為事件發生的平均時間;
其他連續型機率分配
分配類型 適用情境說明 分配函數
Gamma 分配 Gamma
distribution
隨機變數(X)表示事件第 a 次發 生所需的時間。因此若「X>t」表 示事件第 a 次發生至少需要t個時 間單位;另個說法是,在 t 時間內 事件至少發生 (a-1) 次的機率
𝑓 𝑥 = 1
𝛽𝛤 𝑎 ( 𝑥
𝛽 )
𝑎−1𝑒
−𝑥 𝛽
, 0 < 𝑥 < ∞ , 𝑎 > 0, 𝛽 > 0
x
為第a
次發生所需時間;𝛽
表發生一次所需的時間;卡方分配 chi-square distribution
卡方分配可以算是Gamma分配的 特例(a = 𝜈
2 , 𝛽 = 2),在統計應 用上,可進行單一母體變異數 𝜎2 的統計推論;可用來做適合度檢定
(goodness-of-fit test)、獨立 性檢定(test of independence)
與變異數齊一性檢定(test of homogeneity)
𝑓 𝑥 = 1 2𝛤 𝜈
2 (𝑥
2)𝜈2−1 𝑒−𝑥2 , 0 < 𝑥 , v 為卡方分配的自由度
uniform
distribution
連續均勻分配
函數定義(分配形式)
隨機變數(X)在某連續區間〔a,b〕內所發生的機率都相 同,例如等待公車到達機率,或是約會碰面機率等。
𝑓 𝑥 = 𝑙
𝑏 − 𝑎 , 𝑎 ≤ 𝑥 ≤ 𝑏
c d
𝑃 𝑐<x<d = න
𝑐 𝑑
𝑓 𝑥 ⅆ𝑥
= න
𝑐
𝑑
1
𝑏 − 𝑎 ⅆ𝑥
= 1
𝑏 − 𝑎 ⅆ − c
求滿足區間的機率值=求面積
分配的重要參數
期望值 變異數
E(x) = 𝑎 + 𝑏 2
V x = 𝑏−𝑎 2
12
證明:
𝐸 x = න
𝑎 𝑏
𝑥𝑓 𝑥 ⅆ𝑥 =
𝐸 x2 = න
𝑎 𝑏
𝑥2𝑓 𝑥 ⅆ𝑥 =
V x = 𝜎2 = 𝐸 x2 − 〔E(x)〕2 =
案例
已知台北捷運系統大約5分鐘發一斑車,且為均勻 分配。假設某人欲到站搭乘捷運,若此人完全不知 道任何列車到站時間的訊息,請問:
(1)此人等待時間小於2分鐘的機率?
(2)此人至少等待3分鐘以上的機率?
(3)此人等待時間介於1到4分鐘的機率?
(4)此人平均等待時間為何?
(5)此人等待時間的變異數為何?
「統計學 二版」p10-4,李德治、林孟濡、童惠玲 著,博碩文化
案例解說 1
(1)此人等待時間小於2分鐘的機率?
P(x<2)= න
0 21
5ⅆ𝑥 = 1
5 𝑥 ȁ02 = 2
5
(2)此人至少等待3分鐘以上的機率?
𝑝 𝑥 ≥ 3 = න
3 51
5ⅆ𝑥 = 1
5( ቚ𝑥)
3 5= 1
5 5 − 3 = 2 5 約5分鐘發一斑車 (開始思考……)
→(情境一)到達車站時,若是剛錯過一班,要再等5分鐘才能搭上車
→(情境二)到達車站時,剛好遇到車進站,所以不用等就能上車
→(情境三)到達車站時,看到顯示,還有幾分鐘到站
→→到達車站,還要再等待1分鐘、2分鐘、…或5分鐘的機率,每個等待發生 的機率應該都是1/5的機率,所以
𝑓 𝑥 = 𝑙
5 , 0 ≤ 𝑥 ≤ 5
0 5
0 5
2
3
案例解說 2
(4)此人平均等待時間為何?
→平均等待時間就表示求期望值,所以
E x =
𝑎+𝑏2
=
0+52
=
52 (分鐘)
(5)此人等待時間的變異數為何?
(3)此人等待時間介於1到4分鐘的機率?
P(1<x<4)= න
1 41
5ⅆ𝑥 = 1
5 𝑥 ȁ14 = 1
5 4 − 1 = 3
5
V x =
𝑏−𝑎 212
=
5−0 212
=
2512
01 4 5
normal
distribution
常態分配
函數定義(分配形式)
μ σ
σ 最早由法國數學家De Moiver於1773年
提出,隨後高斯(Carl Gauss)在重複 測量的誤差研究中,亦導出曲線方程式,
所以常態分配又稱為高斯分配。
𝑓 𝑥 = 1
2𝜋𝜎 𝑒
𝑥−𝜇 2
2𝜎2 , -∞ < x < ∞
通常以符號 X ~ N(μ, σ
2) 表示 具常態分配
a b
P a ≦ x ≦ b
= න
a b
𝑓 𝑥 = න
a
b
1 2𝜋𝜎 𝑒
𝑥−𝜇 2 2𝜎2
函數定義(分配形式)2
μ
aσ
aμ
bσ
bμ
存在於大自然間的各種現象或狀 態,都可以將母體視為常態分配。
例如身高、體重、智商等,常態 分配機率函數曲現呈鐘形(bell shaped),此曲線稱為常態曲線
(normal curve);適合以平均 數來代表母體的中央集中趨勢。
μ
b< μ
aσ
b> σ
aX
1~ N(μ
a, σ
a2)
X
2~ N(μ
a, σ
b2) X
3~ N(μ
b, σ
a2) X
4~ N(μ
b, σ
b2)
X
1X
2X
3X
4σ 越小越集中
分配的重要參數與特性
期望值 變異數
E x = μ V x = σ 2
常態分配特性:
න
−∞
∞
𝑓 𝑥 = න
−∞
∞ 1
2𝜋𝜎𝑒
𝑥−𝜇 2
2𝜎2 = 1
(1) (2)
-∞ ∞
(3) 偏態係數=0;
峰度係數=3;
(4)
反曲點
(infection point)
案例
製藥廠製造一種抗胃癌新藥,假設每顆藥丸重量
符合常態分配N(0.3 , 0.01
2),單位:g,因為
此藥含有某成分比率的珍貴藥材與劇毒,製造產
品需要較嚴格的品管。製藥廠認為此抗癌新藥的
重量應為(0.3 ± 0.02)之間才安全。試問,此種
抗癌新藥產品不被接受的比率有多少?
案例解說
〝重量符合常態分配N(0.3 , 0.012)〞
→ μ=0.3;σ=0.01
〝重量應為(0.3 ±
0.02)之間〞
→ 要求P((0.3-0.02) ≦ X ≦ (0.3+0.02))的值
P(0.28 ≦ X ≦ 0.32) =
0.280.32 2𝜋(0.01)1𝑒
𝑥−0.3 2
2(0.01)2
= … …( 現場任務 ) 方法一(用定義計算):
方法二(利用「Z」查表):
P(0.28 ≦ X ≦ 0.32) = 𝑃
0.28−0.30.01
≤
𝑥−0,30.01
≤
0,32−0,30,01
= P(-2 ≦ Z ≦ 2) = 2 P( Z ≦ 2 ) – 1
= 2 × 0.9772 – 1 →
查表可得「0.9772」的值= 0.9544
→ 〝安全〞,所以不被接受的比率有4.56%(1-0.9544)standard normal distribution
標準常態分配
函數定義(分配形式)
要計算常態分配就必須要進行積分運算,在多數實際的情況下,積分運算不 容易求得答案結果,此時可以運用數值分析的方法來求得近似值。但是數學 家更想到一種方式,利用「座標變換」(變數變換)的技巧,將常態分配轉 換為「標準常態分配」(standard normal distribution),並且事先將各 種可能的機率值製作成「查表」;利用這個「查表」方式,就可以不用積分 計算,或是計算機操作,就可以求得對應的數值。
𝑓 z = 1
2𝜋 𝑒
z22, -∞ < z < ∞
z = x − 𝜇 標準化: 𝜎
→ μ
z= 0 ; σ
z= 1
圖片來源:http://www.slideshare.net/raj_2952/normal-distribution-and-sampling-distribution
請參閱專章進一步說明
圖片來源:http://slideplayer.com/slide/8022376/
exponential distribution
指數分配
函數定義(分配形式)1
與Poisson隨機變數相反,指數分配的隨機變數(X)是描述 連續兩事件發生的間隔時間,常用在計算生命長度、顧客打 電話時間、電子產品失效等問題。指數分配與Poisson分配 可以彼此相互轉換,也就是說指數分配的問題也可用
Poisson分配去計算機率,反之亦然:
Poisson分配
指數分配1小時內,平均20部車子開進停車場
(λ=20輛/小時)
平均每隔3分鐘有1部車子開進停車場
(β=3分鐘/輛)
高速公路上每1公里平均種10棵樹
(λ=10輛/1小時)
高速公路上平均每隔100公尺有1棵 樹(β=100公/棵)
血液中每1cm3中有1000個紅血球
(λ=1000個/cm3)
血液中每0.001cm3中有1個紅血球
(β=0.001cm3
/個)
「統計學 二版」10-25,李德治、林孟濡、童惠玲 著,博碩文化
函數定義(分配形式)2
𝑓 𝑥 = 1
𝛽 e −
x
𝛽 , x ≥ 0 x
為第一次發生事件所需時間;β
為事件發生的平均時間;期望值 變異數
E x = β V x = β 2
β=0.5
β=1
β=1.5
常用之指數分配計算公式
a a a b
P X>a = න
a
∞
𝑓 𝑥 ⅆ𝑥
= න
a
∞
1
𝛽 e
−x
𝛽
ⅆ𝑥
= 𝑒 −
𝑎 𝛽
P X<a
= න
0 a
1
𝛽 e
−x
𝛽
ⅆ𝑥
= 1 −𝑒 −
𝑎 𝛽
P a<X<b
= න
a b
1
𝛽 e
−x
𝛽
ⅆ𝑥
= 𝑒 −
𝑎
𝛽
− 𝑒 −
b 𝛽
案例 1
假設門診醫生看病時間平均每分鐘看0.2人,若看 病時間為指數分配,試問看一病人超過5分鐘的機 率有多少?最多10分鐘的機率有多少?
「現代統計學」p99,吳柏林 著,五南圖書
案例 1 解說
設隨機變數 X 表醫生對每個病人看病時間,平均每分鐘看
0.2病人 → 平均 5 分鐘看1個病人 → 服從指數分配,β=5
(1) P(X > 5) = න
5
∞ 1
5 𝑒 −
𝑥
5
ⅆ𝑥 = −𝑒 −
𝑥
5
ቚ ∞ 5 = e −1 = 0.37
(2) P(X<10) = න
0
10 1
5 𝑒 −
𝑥
5
ⅆ = −𝑒 −
𝑥
5
ቚ 10 0 = 1 − e −2 = 0.86
案例 2
假設某廠牌彩色電視機其壽命時間呈指數分配,
且平均壽命10年,試求以下機率值:
(1)壽命長達12年以上?
(2)1年內即發生故障而報廢?
(3)壽命時間介於2至10年?
(4)求電視壽命的變異數?
「應用統計學 二版」p173,李德治、童惠玲 著,博碩文化
案例 2 解說
設隨機變數 X 表電視機壽命時間,平均壽命10年 → β=10
(1) P(X > 12) = න
12
∞ 1
10 𝑒 −
10𝑥ⅆ𝑥 = 𝑒 −
1210= 𝑒 −
65(2) P(X < 1) = න
0 1 1
10 𝑒 −
10𝑥ⅆ𝑥 = 1 − 𝑒 −
101(3) P(2<X<10) = න
2
10 1
10 𝑒 −
𝑥
10
ⅆ𝑥 = 𝑒 −
2
10
− 𝑒 −
10
10
= 𝑒 −
1
5
− 𝑒 −1
(4) V (X) = β
2= 10
2= 100
Gamma
distribution
Gamma分配
函數定義(分配形式)
Gamma分配主要用在描述第 α 次事件發生所需的時間,而指數分配是在
描述第一次發生所需的時間,所以可以說指數分配是Gamma分配的特例。Gamma分配應用在工業上的用途十分廣泛,例如在增加系統的可靠度上,
會設計類似 α-1 個備份元件藉以延長壽命。這種直到 α 次事件發生損壞所 需的時間,就服從Gamma分配。
𝑓 𝑥 = 1
𝛽𝛤 α ( 𝑥
𝛽 ) 𝑎−1 𝑒 −
𝑥 𝛽 ,
Γ 𝛼 = න
0
∞
𝑥
𝛼−1𝑒
−𝑥ⅆ𝑥 Gamma
函數Gamma
函數性質:Γ 𝛼 + 1 = α Γ 𝛼 Γ 𝛼 + 1 = α ! Γ 1
2 = 𝜋 0 < 𝑥 < ∞ , α > 0, 𝛽 > 0
x
為第 α次發生所需時間;𝛽
表發生一次所需的時間;分配的重要參數與特性
期望值 E(x) = α ‧ β 變異數 V x = α ‧ β 2
k → α
θ → β
about probability distribution
關於機率分配的一些事
各種機率分配的關係
常態分配 幾何分配
超幾何分配
伯努利分配 負二項分配
二項分配
多項分配
指數分配
Gamma
分配卡方分配
𝜒
22 卡方分配𝜒
𝜈2成功1次
就停止 成功 r 次 就停止
取出 不放回
分類超過二項
n 大 p 小
𝜆 = 1 𝛽
𝛽 = 1 𝜆
𝜆 → ∞ 𝛽 = 2
a= 1
𝛽 = 2 a= 𝜈
2
𝑛𝑝 ≥ 5, 𝑛𝑞 ≥ 5 𝑛
𝑁 ≤ 0.05
n = 1
※資料來源:統計學第二版,李德治、林孟儒、童蕙玲 著,
博碩文化,p10-42
常用機率分配 離散型分配 連續型分配