• 沒有找到結果。

假設檢定基本觀念

N/A
N/A
Protected

Academic year: 2023

Share "假設檢定基本觀念"

Copied!
40
0
0

加載中.... (立即查看全文)

全文

(1)

Hypothesis Testing

~Basic concept

假設檢定基本觀念

(2)

基本觀念

(3)

關於假設檢定

●推論統計可分為三大領域:估計、檢定、分類與選擇。

●「假設檢定」包含了兩個動作:

〝假設〞~針對想要證實的資訊做出假設;

〝檢定〞~利用樣本訊息去檢定所設立的假設是否成立。

●假設檢定是一種彼此互斥「二分法」的統計方法。

●〝假設〞事前分為「虛無假設」(null hypothesis ,H0) 與「對立假設」(alternative hypothesis ,H1)兩種。

●〝檢定〞事後可採用常應用的「信賴區間法」、「臨界 值法」、「標準檢定法」、「P值法」等方式證明。

(4)

統計推論案例

假設某同學修商用統計學的課,宣稱他可以輕易的 及格過關。請問,你相信這位同學所說的話嗎?

假設來做個不記名的調查,進行隨機抽點n位 同學的意見做統計:(n次抽樣試驗)

根據所得資訊,若是計算出~

●估計同意其宣稱的比例(Proportion) – 點估計

●估計同意其宣稱比例的可能範圍 – 信賴區間

●評估其所宣稱的是「隨便說說的」或「很有把握」

– 假設檢定

(5)

「假設」的立場

• 假設基礎:二分法(兩種互斥的決策)

• 邏輯應用:反証法

虛無假說(null hypothesis~ H

0

)

– 欲推翻的決策

– 主張錯誤或是希望被否決的假設

對立假說(alternative hypothesis~ H

1

)

– 欲證實的決策

– 主張對的假設

(6)

如何界定虛無與對立?

檢察官 犯人

舉証推翻犯人無罪 無罪?

有罪?(期待) 為何不舉証證明

犯人有罪就好?

法官

提供舉證 資訊

法官為避免冤獄

→採取寬鬆認定

→要有足夠證據,才能 推翻犯人無罪的假設

→將犯人判刑

所以我們將檢定所要〝推翻〞的論點,放在「虛無假設」

上,相對這個假設的互斥論點,就是「對立假設」,也就 是我們設想所要的期待結果。

(7)

虛無假設 與 對立假設

檢定者主張錯誤或希望被否定的假設。

以數學邏輯思考,虛無假設是不存在的假設,或暫時性的 假設,所以稱為「虛無」。

虛無假設(null hypothesis ,H

0

對立假設(alternative hypothesis ,H

1

檢定者主張對的假設。

假設檢定的過程類似數學的反證法,也就是先假設H0是正確 的,然後透過機率看是否可以否定H0,來驗證H1的主張是被 支持的。

所以假設檢定整個計算過程,都是在檢定「虛無假設」是 否可以支持否定條件,計算過程與「對立假設」無關。

(8)

假設檢定的步驟建議

第1步 第2步 第3步 第4步 第5步

根據所要研究或判斷的問題,設立兩個假設。

蒐集所調查的樣本資料計算「檢定統計量」。

設立顯著水準大小,建立拒絕域與不拒絕域。

(一般社會科學採用0.05作為顯著水準的標準;

醫學統計則多採用0.01作為顯著水準的標準)

比較檢定統計量與臨界值大小,判定檢定統計量 落於拒絕域或是不拒絕域內。

下結論並做決策或推論。

(9)

單尾檢定與雙尾檢定

左尾檢定 右尾檢定 雙尾檢定

ቊ H0:𝜇 ≥ 𝜇0 H1:𝜇 < 𝜇0

或 ቊ H0:𝜇 = 𝜇0 H1:𝜇 < 𝜇0

ቊ H0:𝜇 ≤ 𝜇0 H1:𝜇 > 𝜇0

或ቊ H0:𝜇 = 𝜇0 H1:𝜇 > 𝜇0

ቊ H0:𝜇 = 𝜇0 H1:𝜇 ≠ 𝜇0

假設檢定整個計算過程,都是在檢定「虛無假設」是否可以支持否定條件

(10)

拒絕域與不拒絕域(接受域)

拒絕域 不拒絕域

α

μ

0

樣本抽樣分配的可能性

圖片參考:「統計學 二版」p14-5,李德治、林孟濡、童惠玲 著,博碩文化

μ'

ቊ H0:𝜇 ≥ 𝜇0 H1:𝜇 < 𝜇0

或 ቊ H0:𝜇 = 𝜇0 H1:𝜇 < 𝜇0

「假設」的寫法,〝=〞一定放在「虛無假設」

中。以左尾檢定為例,就是把所有大於或等於 μ0的可能情況都放在一起。若是最左邊 μ=μ0 被拒絕,那其他分配也等於都被拒絕,所以虛 無假設也可以進行 μ=μ0 即可。

(11)

檢定的方法(類型)

在給定的信賴水準下,利用樣本統計量求出信賴區間,然後檢查此區 間是否包含虛無假設值,則結論即可為拒絕虛無假設。

信賴區間法

臨界值法

標準檢定法

P值法

在給定的信賴水準下,先計算出臨界值,用以決定拒絕域或是不拒絕 域;再檢查樣本統計量落在那個區域?進而決定拒絕或不拒絕虛無假 設的方法。

資料來源:「統計學 二版」p14-6,李德治、林孟濡、童惠玲 著,博碩文化

又稱「公式法」,是將臨界值進一步推導後所得到的方法,先求出檢 定統計量,再檢查檢定統計量位於拒絕域或是不拒絕的方法。

將檢定統計量改用機率表示後,再和顯著水準比較大小,進而決定拒 絕或不拒絕虛無假設的方法。

(12)

案例1

某飲料廠商宣稱,他們的 1 公升容器中平均至少裝

有 0.98 公升的飲料。現抽出若干 1 公升裝的飲料,

以檢定此一宣稱。請問,如何列「假設」議題?

H

o

: μ ≥ 0.98

H

1

: μ < 0.97

(13)

案例2

某種款式的汽車平均每公升汽油可行駛 8 公里,現 有一製造研究小組發明一種新的化油器系統來增加 每加侖汽油可行駛的里程數。想要找到足夠的證據 顯示新的化油器的確可以使里程數超過 13公里,

請問,如何列「假設」議題?

H

0

: μ ≤ 13

H

1

: μ > 13

(14)

案例3

在某批零件中,品管人員抽出部分為樣本,並藉以 決定是否接受整批零件或因零件未符合規格而退回 給供應商。假設零件規格重量平均為 750 公克,如 果平均重量大於或小於 750 公克,這些零件將可能 產生品質問題,請問,如何列「假設」議題?

H

0

: μ = 750

H

1

: μ ≠ 750

(15)

檢定錯誤 與

檢定力函數

(16)

假設檢定的風險~檢定錯誤

Why ?

當「假設」設定好後,就要利用樣本訊息來推論以進行

「檢定」,作為決策拒絕或不拒絕的決定。若是抽樣過程 產生偏差,就會導致決策時的誤判。

因為我們是透過抽樣方式來推論,所以在檢定計算時,也 會瞭解可能產生誤判的機率是多少,將更多的資訊顯示出 來提供給決策者有更多的判斷依據。

從統計的觀點,如果能增加抽樣的隨機性與抽取更多的樣 本數,理論上,也能降低發生檢定誤判的機率。所以有時 是設定誤判機率的限制條件,回頭先求取必要的樣本數,

再根據可執行的抽樣方式進行抽樣調查。

如何避免 ?

(17)

檢定錯誤的類型

α =max P(拒絕H

0

▕ H

0

為真)

真實 狀況

決策

接受H

0

拒絕H

0

H

0

為真

(H

0

True)

正確決策 機率: 1-α

型Ⅰ錯誤

(Type Ⅰ Error) 機率: α

H

0

為偽 (H

0

False)

型Ⅱ錯誤

(Type Ⅱ Error) 機率: β

正確決策 機率: 1-β

β =P(拒絕H

1

▕ H

1

為真)

(18)

型Ⅰ錯誤

拒絕域 不拒絕域

α μ

0

樣本抽樣分配的可能性

圖片參考:「應用統計學 二版」p282李德治、童惠玲,博碩文化

以左尾檢定為例,「虛無假設」包含所有大於等於μ0的一切母 體可能(μ≧ μ0)。當μ= μ0時發生型Ⅰ錯誤的機率最大值。

ҧ

𝑥

α=max P(拒絕H0▕ H0為真)

常用的 α 值是 0.05 及 0.01。

如果犯型 I 錯誤,必須付出極高的成本,則研究人員偏好較小

的 α 值。只控制型 I 錯誤機率的假設檢定通常稱為顯著性檢 定 (significance tests)。

(19)

型Ⅱ錯誤

雖然大部分的假設檢定應用都會控制型 I 錯誤 的機率,但是型 II 錯誤的機率則不一定在控制 中。因此,假若我們決定不拒絕 H

0

,我們還是 不能確定此決定有多大的信心。

統計學家通常建議我們用「不拒絕 H

0

」(do

not reject H

0

),而不用「接受 H

0

」(accept H

0

)

的陳述。

(20)

案例4

有一強烈颱風正迅速接近台灣,但不確定是否會登陸,市 長需要決定明天是否放颱風假,於是他設立兩個假設,其 假設為:

H0:颱風會經過 H1:颱風不會經過

若型Ⅰ錯誤(Type Ⅰ Error)以 α 表示;型Ⅱ錯誤

( Type Ⅱ Error )以 β 表示,試回答下列各小題:

(1)「該放假而不放假」犯何種型態錯誤?

(2)「不該放而放假」犯何種型態錯誤?

(3)「寧可放錯假」,請問 α 增加或減少? β 增加或減少?

資料來源:「統計學 二版」p14-32,李德治、林孟濡、童惠玲 著,博碩文化

(21)

案例4說明

真實 狀況

決策

接受H0(放假) 拒絕H0(不放假) H0為真

(颱風會經過

→該放)

正確決策 機率:1-α

型Ⅰ錯誤

(Type Ⅰ Error) 機率:α

H0為偽

(颱風不會經過

→不該放)

型Ⅱ錯誤

(Type Ⅱ Error) 機率:β

正確決策 機率:1-β

(1)「該放假而不放假」犯何種型態錯誤? → 型Ⅰ錯誤

(2)「不該放而放假」犯何種型態錯誤? → 型Ⅱ錯誤

(3)「寧可放錯假」,請問 α 增加或減少? β 增加或減少?

→ 「放錯假」表示有〝放假〞,「寧可」表示〝不該放〞,所以是

「型Ⅱ錯誤」,故β會增加,而與α無關。

(22)

檢定力函數

Power of a Test

(23)

檢定力函數(power function of test)

α β

1-β

μ

0

C

𝑥 ҧ μ

Real

檢定力 = 1- β = (接受H

1

∣ H

1

為真)

假設實際母體的平均數為μReal(<μ0),若在檢定時「接受H0 」,就犯了 型Ⅱ錯誤;若是要降低型Ⅱ錯誤,就是讓(1-β)所代表區域越大(更往左移 或分配更集中),則β就會下降,所以在可給定(或限定)α(發生型Ⅰ錯 誤機率)情況下,若β越小,就表示整個假設檢定所會犯的所有可能錯誤越 小,因此把(1-β)視為檢定抽樣分配的強度,稱為「檢定力函數」。

H0:𝜇 ≥ 𝜇0 H1:𝜇 < 𝜇0

(24)

影響檢定力因素

檢定力 = 1-β = (接受H1 ∣ H1為真)

1.樣本中位數」大小:樣本數越大,檢定力越大

2.顯著水準α:一般而言α越大,檢定力越大

3.檢定統計量的選擇:一般是以平均數( ҧ𝑥)為統計量代表,

若是以「中位數」為代表,因為其抽樣之標準差較大,其 檢定力會較小。

4.決策法則之決定:檢定時採用左尾、右尾或雙尾亦會影響 檢定力的大小。(相同條件下,單尾比雙尾更具有檢定力)

資料來源:「應用統計學 二版」p288,李德治、童惠玲 著,博碩文化

一般而言在進行檢定時,α越大β越小,有沒

有可能α變大β也隨之變大?

(25)

影響檢定力因素

一般而言在進行檢定時,α越大β越小,有沒 有可能α變大β也隨之變大?

α

β μ

0

μ

Real

n=30

n=20

有可能,當拒絕域 的臨界值(C)固定 時,降低樣本數會 導致兩者同時變大。

(右方對應α之綠色 曲線下的面積比黑

色大;同理,β亦同)

C

(26)

如何計算檢定力?

Reject H0:   52

Do not reject H0 :  52

• Suppose we do not reject H

0

:   52 when in fact the true mean is  = 50

52 50

This is the true

distribution of X if = 50

This is the range of X where H0 is not rejected

= Prob. of type II error

DCOV A

Copyright © 2014 Pearson Education

Here, β = P( തx  cutoff ∣ if μ = 50 )

C

α β

(27)

如何計算檢定力?

Reject H0: μ 52

Do not reject H0 : μ 52

• Suppose n = 64 , σ = 6 , and  = .05

52 50

So β = P( x  50.766 ) if μ = 50

50.766 64

1.645 6 n 52

Z σ μ

X

cutoff 

0

  

(for H0 : μ 52)

50.766

DCOV A

Copyright © 2014 Pearson Education Step1:先利用α求出臨界值C

(28)

如何計算檢定力?

Reject H0: μ 52

Do not reject H0 : μ 52

0.1539 0.8461

1.0 1.02)

P(Z 64

6

50 50.766

Z P μ 50)

| 50.766 X

P(

• Suppose n = 64 , σ = 6 , and  = 0.05

52 50

Probability of type II error:

β = 0.1539 Power

= 1 - β

= 0.8461

50.766

The probability of correctly rejecting a false null hypothesis is 0.8641

DCOV A

Copyright © 2014 Pearson Education

Step2:計算β值

Step3:計算檢定力:power=1-β

(29)

案例5

假設തx4, തx25 表示由常態母體N(μ,42)分別隨機抽 取4,25個樣本之樣本平均數,欲進行μ值之檢定,若 令統計假設為H0:μ=0;H1:μ =1,求下列二種檢定 法的α與β值。

檢定法則1:若 തx25 >1.32,則拒絕H0:μ=0 檢定法則2:若 തx4 >3.29,則拒絕H0:μ=0

「現代統計學」p175,吳柏林 著,五南圖書

(30)

案例5說明

(1)檢定法則1:

α = P(拒絕H0 ∣ H0為真)= P(തx25 >1.32 ∣ H0=0)

= P( തx25−0

42/25 > 1.32−0

42/25 ) = P( Z>1.65 ) ≒ 0.05 β = P(接受H0 ∣ H0為偽)= P(തx25 <1.32 ∣ H1=1)

= P( തx25−1

42/25 < 1.32−1

42/25 ) = P( Z<0.4 ) = 0.66 → 檢定力 1-β=0.34 (2)檢定法則2:

α = P(拒絕H0 ∣ H0為真)= P(തx4 >3.29 ∣ H0=0)

= P( തx4−0

42/4 > 3.29−0

42/4 ) = P( Z>1.645 ) = 0.05 β = P(接受H0 ∣ H0為偽)= P(തx25 <1.32 ∣ H1=1)

= P( തx4−1

42/4 < 3.29−1

42/4 ) = P( Z<1.15 ) = 0.87 → 檢定力1-β=0.13

檢定法則1的「檢定力」比法則2好

(31)

單尾檢定與雙尾檢定 的檢定要點

常見用法、決策法則、檢定要點

(32)

假設檢定的類型

類別 檢定H0項目 左尾 右尾 雙尾

平均數 μ ≧ μ0 μ ≦ μ0 μ = μ0

比例 p ≧ p0 p ≦ p0 p = p0

變異數 σ2 ≧ σ02 σ2 ≦ σ02 σ2 = σ02

平均數差

(獨立樣本)

μ1 ≧ μ2 μ1 ≦ μ2 μ1 = μ2 μ1 - μ2 ≧ 0 μ1 2 ≦ 0 μ1 - μ2=0

平均數差

(成對樣本) μd ≧ 0 μd ≦ 0 μd = 0

比例差 p1 ≧ p2 p1 ≦ p2 p1 = p2

p1 - p2 ≧ 0 p1 - p2 ≦ 0 p1 - p2=0

變異數差異 σ12 ≧ σ22 σ12 ≦ σ22 σ12 = σ22

σ12 22 ≧1 σ12 22 ≦1 σ12 22=1

(33)

左尾檢定的檢定要點

假設檢定 決策法則

抽樣分配示意圖 ቊ𝐻0:𝜃 ≥ 𝜃0

𝐻1:𝜃 < 𝜃0

根據抽樣樣本,計算檢定 統計量 θ

給定顯著水準 α ,其對應 的數值為C(臨界值)

若 θ ≧ C → 不拒絕 H0 若 θ < C → 拒絕 H0

θ0 C

α

拒絕域 不拒絕域

P ෠𝜃 ≤ C = 𝛼 ⋯ ①

利用所抽樣的樣本,

計算其統計量 θ 若滿足式①條件,即 表示「拒絕H0

(34)

右尾檢定的檢定要點

假設檢定 決策法則

抽樣分配示意圖 ቊ𝐻0:𝜃 ≤ 𝜃0

𝐻1:𝜃 > 𝜃0

根據抽樣樣本,計算檢定 統計量 θ

給定顯著水準 α ,其對應 的數值為C(臨界值)

若 θ ≦ C → 不拒絕 H0 若 θ > C → 拒絕 H0

θ0 C

α

不拒絕域 拒絕域

P ෠𝜃 ≥ C = 𝛼 ⋯ ②

利用所抽樣的樣本,

計算其統計量 θ 若滿足式②條件,即 表示「拒絕H0

(35)

雙尾檢定的檢定要點

假設檢定 決策法則

抽樣分配示意圖 ቊ𝐻0:𝜃 = 𝜃0

𝐻1:𝜃 ≠ 𝜃0

根據抽樣樣本,計算檢定 統計量 θ

給定顯著水準 α ,其對應 的數值為CL與CU(臨界值 的下限與上限)

若CL ≦ θ≦ CU → 不拒絕 H0 若 θ<CL 或 θ>CU → 拒絕 H0

θ0 CL

α/2

拒絕域

不拒絕域 P መ𝜃 ≤ CL = 𝛼

2

利用所抽樣的樣本,計算其 統計量 θ ,若滿足式③或

④條件,即表示「拒絕H0 P መ𝜃 ≥ CU = 𝛼

2

CU α/2

拒絕域

(36)

控制α、β條件下,所需的樣本數

起心動念

●抽樣時,受限抽樣方法的好壞,難免會產生判斷的錯誤。

●當型Ⅰ錯誤變小,通常會造成型Ⅱ錯誤變大。

●一般型Ⅰ錯誤所造成的後果遠比型Ⅱ錯誤嚴重,因此通 常會先控制型Ⅰ錯誤(α)在合理範圍後再進行檢定。

●實際上,除非知道真實母體分配資訊,也無法計算型Ⅱ 錯誤(β)。若想同時減少α、β,就必須增加樣本數。

在有限的調查資源下,我們可以先試算想要

控制的α與β所對應的樣本數;評估可進行的

樣本數後,才進行實際的檢定統計調查。

(37)

在給定α、β值,如何計算樣本數?

α β

左尾檢定

μ0 C

右尾檢定

雙尾檢定

C

CL CU α

α/2 α/2

β μ0

μ0

C = 𝜇0 − z𝛼 𝜎2

n = 𝜇R + z𝛽 𝜎2 n

μR

μR

n = 𝜎

2 z𝛼 + z𝛽 2 𝜇0 − 𝜇R 2

C = 𝜇0 + z𝛼 𝜎2

n = 𝜇R − z𝛽 𝜎2 n

n = 𝜎

2 z𝛼 + z𝛽 2 𝜇R − 𝜇0 2

CL = 𝜇0 − z𝛼/2 𝜎2

n = 𝜇R + z𝛽 𝜎2 n

n = 𝜎

2 z𝛼/2 + z𝛽 2

𝜇0 − 𝜇R 2 = 𝜎2 z𝛼/2 + z𝛽 2 𝜇𝑅 − 𝜇0 2

或計算CU

CL CU

(38)

案例6

考慮下列兩個假設:

「應用統計學 二版」p292,李德治、童惠玲,博碩文化

ቊ𝐻0:𝜇 ≥ 10 𝐻1:𝜇 < 10

已知母體變異數為25,現隨機抽取120個樣本,已知 母體真實的平均數是9,在顯著水準α=0.05時,發生 型Ⅱ錯誤 β=0.2912。若現在欲降低型Ⅱ錯誤至0.1,

請問需再抽取幾個樣本?

(39)

案例6說明

若給定 α=0.05, β=0.1 下,需抽樣:

n = 𝜎2 z𝛼 + z𝛽 2

𝜇0 − 𝜇R 2 = 52 z0.05 + z0.1 2 10 − 9 2

= 52 1.645+1.28 2

10−9 2 = 214

所以還要再抽取 214 – 120 = 94 個樣本

(40)

The End

案例1:Ho : μ 0.98 H1 : μ < 0.98 案例2:

H0 : μ ≤ 13 H1 : μ > 13 案例3:

H0 : μ 750 H1 : μ ≠ 750

參考文獻

相關文件

小原設定手機解鎖的密碼為 abcd 四碼,若他是利用 1080 的標準分解式 2abcd 來設計密碼,請問此組密碼為何? 答:.. 小原設定手機解鎖的密碼為 abcd 四碼,若他是利用 2268 的標準分解式 2abc7d 來設計密碼,請問此組密碼為何?