• 沒有找到結果。

連續型機率分配

N/A
N/A
Protected

Academic year: 2023

Share "連續型機率分配"

Copied!
33
0
0

加載中.... (立即查看全文)

全文

(1)

Continuous

Probability Distributions

連續型機率分配

(2)

連續型機率分配

統計對象 型態 分配類型

母體分配 樣本分配

離散型 機率分配

均勻分配 二項分配 多項分配 負二項分配 超幾何分配 幾何分配 伯努利分配 波松分配 連續型

機率分配

連續均勻分配 常態分配 標準常態分配 指數分配 Gamma分配 卡方分配

抽樣分配 機率分配

樣本比例差( Ƹ𝑝 − 𝑝 ) 平均數~

Z分配 t分配

變異數~

單母體變異數 卡方分配

兩母體變異數比 F分配

(3)

常見連續型機率分配

分配類型 適用情境說明 分配函數

連續均勻分配

uniform distribution

隨機變數(X)在某連續區

間內所發生的機率都相同

𝑓 𝑥 =

1

b−a

, a ≤ x ≤ b

常態分配

normal distribution

存在於大自然間的各種現 象或狀態,都可以將母體

視為常態分配 𝑓 𝑥 = 1

2 𝜋 𝜎 e

1 2

(x−𝜇)2 𝜎2

− ∞ < x < ∞, μ為平均數, 𝜎為標準差

標準常態分配

standard normal distribution

透過 z = x−𝜇

𝜎 的「標準

化」,將原本要利用微積 分計算求值,轉換成可以 利用查表得到結果

𝑓 𝑥 = 1

2 𝜋 ez

2

2 , − ∞ < z < ∞

指數分配

exponential distribution

與Poisson隨機變數相反,

指數分配的隨機變數(X)

是描述連續兩事件發生的 間隔時間

𝑓 𝑥 = 1 𝛽 e

x

𝛽 , x ≥ 0

x 為第一次發生事件所需時間;

β 為事件發生的平均時間;

(4)

其他連續型機率分配

分配類型 適用情境說明 分配函數

Gamma 分配 Gamma

distribution

隨機變數(X)表示事件第 a 次發 生所需的時間。因此若「X>t」表 示事件第 a 次發生至少需要t個時 間單位;另個說法是,在 t 時間內 事件至少發生 (a-1) 次的機率

𝑓 𝑥 = 1

𝛽𝛤 𝑎 ( 𝑥

𝛽 )

𝑎−1

𝑒

𝑥 𝛽

, 0 < 𝑥 < ∞ , 𝑎 > 0, 𝛽 > 0

x

為第

a

次發生所需時間;

𝛽

表發生一次所需的時間;

卡方分配 chi-square distribution

卡方分配可以算是Gamma分配的 特例(a = 𝜈

2 , 𝛽 = 2),在統計應 用上,可進行單一母體變異數 𝜎2 的統計推論;可用來做適合度檢定

(goodness-of-fit test)、獨立 性檢定(test of independence)

與變異數齊一性檢定(test of homogeneity)

𝑓 𝑥 = 1 2𝛤 𝜈

2 (𝑥

2)𝜈2−1 𝑒𝑥2 , 0 < 𝑥 , v 為卡方分配的自由度

(5)

uniform

distribution

連續均勻分配

(6)

函數定義(分配形式)

隨機變數(X)在某連續區間〔a,b〕內所發生的機率都相 同,例如等待公車到達機率,或是約會碰面機率等。

𝑓 𝑥 = 𝑙

𝑏 − 𝑎 , 𝑎 ≤ 𝑥 ≤ 𝑏

c d

𝑃 𝑐<x<d = න

𝑐 𝑑

𝑓 𝑥 ⅆ𝑥

= න

𝑐

𝑑

1

𝑏 − 𝑎 ⅆ𝑥

= 1

𝑏 − 𝑎 ⅆ − c

求滿足區間的機率值=求面積

(7)

分配的重要參數

期望值 變異數

E(x) = 𝑎 + 𝑏 2

V x = 𝑏−𝑎 2

12

證明:

𝐸 x = න

𝑎 𝑏

𝑥𝑓 𝑥 ⅆ𝑥 =

𝐸 x2 = න

𝑎 𝑏

𝑥2𝑓 𝑥 ⅆ𝑥 =

V x = 𝜎2 = 𝐸 x2 − 〔E(x)〕2 =

(8)

案例

已知台北捷運系統大約5分鐘發一斑車,且為均勻 分配。假設某人欲到站搭乘捷運,若此人完全不知 道任何列車到站時間的訊息,請問:

(1)此人等待時間小於2分鐘的機率?

(2)此人至少等待3分鐘以上的機率?

(3)此人等待時間介於1到4分鐘的機率?

(4)此人平均等待時間為何?

(5)此人等待時間的變異數為何?

「統計學 二版」p10-4,李德治、林孟濡、童惠玲 著,博碩文化

(9)

案例解說 1

(1)此人等待時間小於2分鐘的機率?

P(x<2)= න

0 21

5ⅆ𝑥 = 1

5 𝑥 ȁ02 = 2

5

(2)此人至少等待3分鐘以上的機率?

𝑝 𝑥 ≥ 3 = න

3 51

5ⅆ𝑥 = 1

5( ቚ𝑥)

3 5= 1

5 5 − 3 = 2 5 約5分鐘發一斑車 (開始思考……)

→(情境一)到達車站時,若是剛錯過一班,要再等5分鐘才能搭上車

→(情境二)到達車站時,剛好遇到車進站,所以不用等就能上車

→(情境三)到達車站時,看到顯示,還有幾分鐘到站

→→到達車站,還要再等待1分鐘、2分鐘、…或5分鐘的機率,每個等待發生 的機率應該都是1/5的機率,所以

𝑓 𝑥 = 𝑙

5 , 0 ≤ 𝑥 ≤ 5

0 5

0 5

2

3

(10)

案例解說 2

(4)此人平均等待時間為何?

→平均等待時間就表示求期望值,所以

E x =

𝑎+𝑏

2

=

0+5

2

=

5

2 (分鐘)

(5)此人等待時間的變異數為何?

(3)此人等待時間介於1到4分鐘的機率?

P(1<x<4)= න

1 41

5ⅆ𝑥 = 1

5 𝑥 ȁ14 = 1

5 4 − 1 = 3

5

V x =

𝑏−𝑎 2

12

=

5−0 2

12

=

25

12

01 4 5

(11)

normal

distribution

常態分配

(12)

函數定義(分配形式)

μ σ

σ 最早由法國數學家De Moiver於1773年

提出,隨後高斯(Carl Gauss)在重複 測量的誤差研究中,亦導出曲線方程式,

所以常態分配又稱為高斯分配。

𝑓 𝑥 = 1

2𝜋𝜎 𝑒

𝑥−𝜇 2

2𝜎2 , -∞ x

通常以符號 XN(μ, σ

2

) 表示 具常態分配

a b

P a ≦ x ≦ b

= න

a b

𝑓 𝑥 = න

a

b

1 2𝜋𝜎 𝑒

𝑥−𝜇 2 2𝜎2

(13)

函數定義(分配形式)2

μ

a

σ

a

μ

b

σ

b

μ

存在於大自然間的各種現象或狀 態,都可以將母體視為常態分配。

例如身高、體重、智商等,常態 分配機率函數曲現呈鐘形(bell shaped),此曲線稱為常態曲線

(normal curve);適合以平均 數來代表母體的中央集中趨勢。

μ

b

μ

a

σ

b

σ

a

X

1

N(μ

a

, σ

a2

)

X

2

N(μ

a

, σ

b2

) X

3

N(μ

b

, σ

a2

) X

4

N(μ

b

, σ

b2

)

X

1

X

2

X

3

X

4

σ 越小越集中

(14)

分配的重要參數與特性

期望值 變異數

E x = μ V x = σ 2

常態分配特性:

−∞

𝑓 𝑥 = න

−∞

1

2𝜋𝜎𝑒

𝑥−𝜇 2

2𝜎2 = 1

(1) (2)

-∞ ∞

(3) 偏態係數=0;

峰度係數=3;

(4)

反曲點

(infection point)

(15)

案例

製藥廠製造一種抗胃癌新藥,假設每顆藥丸重量

符合常態分配N(0.3 , 0.01

2

),單位:g,因為

此藥含有某成分比率的珍貴藥材與劇毒,製造產

品需要較嚴格的品管。製藥廠認為此抗癌新藥的

重量應為(0.3 ± 0.02)之間才安全。試問,此種

抗癌新藥產品不被接受的比率有多少?

(16)

案例解說

〝重量符合常態分配N(0.3 , 0.012)〞

→ μ=0.3;σ=0.01

〝重量應為(0.3 ±

0.02)之間〞

→ 要求P((0.3-0.02) ≦ X ≦ (0.3+0.02))的值

P(0.28 ≦ X ≦ 0.32) = ׬

0.280.32 2𝜋(0.01)1

𝑒

𝑥−0.3 2

2(0.01)2

= … …( 現場任務 ) 方法一(用定義計算):

方法二(利用「Z」查表):

P(0.28 ≦ X ≦ 0.32) = 𝑃

0.28−0.3

0.01

𝑥−0,3

0.01

0,32−0,3

0,01

= P(-2 ≦ Z ≦ 2) = 2 P( Z ≦ 2 ) – 1

= 2 × 0.9772 – 1

查表可得「0.9772」的值

= 0.9544

→ 〝安全〞,所以不被接受的比率有4.56%(1-0.9544)

(17)

standard normal distribution

標準常態分配

(18)

函數定義(分配形式)

要計算常態分配就必須要進行積分運算,在多數實際的情況下,積分運算不 容易求得答案結果,此時可以運用數值分析的方法來求得近似值。但是數學 家更想到一種方式,利用「座標變換」(變數變換)的技巧,將常態分配轉 換為「標準常態分配」(standard normal distribution),並且事先將各 種可能的機率值製作成「查表」;利用這個「查表」方式,就可以不用積分 計算,或是計算機操作,就可以求得對應的數值。

𝑓 z = 1

2𝜋 𝑒

z22

, -∞ z

z = x − 𝜇 標準化: 𝜎

→ μ

z

= 0 ; σ

z

= 1

圖片來源:http://www.slideshare.net/raj_2952/normal-distribution-and-sampling-distribution

(19)

請參閱專章進一步說明

圖片來源:http://slideplayer.com/slide/8022376/

(20)

exponential distribution

指數分配

(21)

函數定義(分配形式)1

與Poisson隨機變數相反,指數分配的隨機變數(X)是描述 連續兩事件發生的間隔時間,常用在計算生命長度、顧客打 電話時間、電子產品失效等問題。指數分配與Poisson分配 可以彼此相互轉換,也就是說指數分配的問題也可用

Poisson分配去計算機率,反之亦然:

Poisson分配

指數分配

1小時內,平均20部車子開進停車場

(λ=20輛/小時)

平均每隔3分鐘有1部車子開進停車場

(β=3分鐘/輛)

高速公路上每1公里平均種10棵樹

(λ=10輛/1小時)

高速公路上平均每隔100公尺有1棵 樹(β=100公/棵)

血液中每1cm3中有1000個紅血球

(λ=1000個/cm3

血液中每0.001cm3中有1個紅血球

(β=0.001cm3

/個)

「統計學 二版」10-25,李德治、林孟濡、童惠玲 著,博碩文化

(22)

函數定義(分配形式)2

𝑓 𝑥 = 1

𝛽 e

x

𝛽 , x ≥ 0 x

為第一次發生事件所需時間;

β

為事件發生的平均時間

期望值 變異數

E x = β V x = β 2

β=0.5

β=1

β=1.5

(23)

常用之指數分配計算公式

a a a b

P X>a = න

a

𝑓 𝑥 ⅆ𝑥

= න

a

1

𝛽 e

x

𝛽

ⅆ𝑥

= 𝑒

𝑎 𝛽

P X<a

= න

0 a

1

𝛽 e

x

𝛽

ⅆ𝑥

= 1 −𝑒

𝑎 𝛽

P a<X<b

= න

a b

1

𝛽 e

x

𝛽

ⅆ𝑥

= 𝑒

𝑎

𝛽

− 𝑒

b 𝛽

(24)

案例 1

假設門診醫生看病時間平均每分鐘看0.2人,若看 病時間為指數分配,試問看一病人超過5分鐘的機 率有多少?最多10分鐘的機率有多少?

「現代統計學」p99,吳柏林 著,五南圖書

(25)

案例 1 解說

設隨機變數 X 表醫生對每個病人看病時間,平均每分鐘看

0.2病人 → 平均 5 分鐘看1個病人 → 服從指數分配,β=5

(1) P(X > 5) = න

5

∞ 1

5 𝑒

𝑥

5

ⅆ𝑥 = −𝑒

𝑥

5

5 = e −1 = 0.37

(2) P(X<10) = න

0

10 1

5 𝑒

𝑥

5

ⅆ = −𝑒

𝑥

5

10 0 = 1 − e −2 = 0.86

(26)

案例 2

假設某廠牌彩色電視機其壽命時間呈指數分配,

且平均壽命10年,試求以下機率值:

(1)壽命長達12年以上?

(2)1年內即發生故障而報廢?

(3)壽命時間介於2至10年?

(4)求電視壽命的變異數?

「應用統計學 二版」p173,李德治、童惠玲 著,博碩文化

(27)

案例 2 解說

設隨機變數 X 表電視機壽命時間,平均壽命10年 → β=10

(1) P(X > 12) = න

12

∞ 1

10 𝑒

10𝑥

ⅆ𝑥 = 𝑒

1210

= 𝑒

65

(2) P(X < 1) = න

0 1 1

10 𝑒

10𝑥

ⅆ𝑥 = 1 − 𝑒

101

(3) P(2<X<10) = න

2

10 1

10 𝑒

𝑥

10

ⅆ𝑥 = 𝑒

2

10

− 𝑒

10

10

= 𝑒

1

5

− 𝑒 −1

(4) V (X) = β

2

= 10

2

= 100

(28)

Gamma

distribution

Gamma分配

(29)

函數定義(分配形式)

Gamma分配主要用在描述第 α 次事件發生所需的時間,而指數分配是在

描述第一次發生所需的時間,所以可以說指數分配是Gamma分配的特例。

Gamma分配應用在工業上的用途十分廣泛,例如在增加系統的可靠度上,

會設計類似 α-1 個備份元件藉以延長壽命。這種直到 α 次事件發生損壞所 需的時間,就服從Gamma分配。

𝑓 𝑥 = 1

𝛽𝛤 α ( 𝑥

𝛽 ) 𝑎−1 𝑒

𝑥 𝛽 ,

Γ 𝛼 = න

0

𝑥

𝛼−1

𝑒

−𝑥

ⅆ𝑥 Gamma

函數

Gamma

函數性質:

Γ 𝛼 + 1 = α Γ 𝛼 Γ 𝛼 + 1 = α ! Γ 1

2 = 𝜋 0 < 𝑥 < ∞ , α > 0, 𝛽 > 0

x

為第 α次發生所需時間;

𝛽

表發生一次所需的時間;

(30)

分配的重要參數與特性

期望值 E(x) = α ‧ β 變異數 V x = α ‧ β 2

k → α

θ → β

(31)

about probability distribution

關於機率分配的一些事

(32)

各種機率分配的關係

常態分配 幾何分配

超幾何分配

伯努利分配 負二項分配

二項分配

多項分配

指數分配

Gamma

分配

卡方分配

𝜒

22 卡方分配

𝜒

𝜈2

成功1次

就停止 成功 r 就停止

取出 不放回

分類超過二項

n p

𝜆 = 1 𝛽

𝛽 = 1 𝜆

𝜆 → ∞ 𝛽 = 2

a= 1

𝛽 = 2 a= 𝜈

2

𝑛𝑝 ≥ 5, 𝑛𝑞 ≥ 5 𝑛

𝑁 ≤ 0.05

n = 1

※資料來源:統計學第二版,李德治、林孟儒、童蕙玲 著,

博碩文化,p10-42

常用機率分配 離散型分配 連續型分配

Poisson分配

(33)

The End

參考文獻

相關文件

第1~7題包含單選題與非選題。單選題每題7分。非選題依各題配分。 (一)1 ~ 3 題為題組 閱讀下文,回答1-3題。 我叫「喬」,這是同事米爾頓.大衛森對我的稱呼。他是程式設計師,而我是電腦程式。我是萬 用自動機複合體的一部分,與遍布世界的其他部分連成一體。我什麼都知道,幾乎什麼都知道。

表1是東南亞各國的殖民國、宗教、經濟和區域特色簡介,請將五個國家的排序依次 選出? 表1 國 家 A B C D E 殖民國 西班牙、美國 荷蘭 英國 英國 英國 主要宗教 天主教北部; 伊斯蘭教南部 伊斯蘭教 伊斯蘭教 佛教、道教、 基督教 伊斯蘭教 經濟活動 農礦 農林礦 農林礦 工、商業、轉 口貿易 礦業石油 區域特色 土地分配不均,貧富差距大