1.
每一個假設檢定(也稱為顯著檢定)都有五個基本的步驟。我們將 會在這個章節和第 13 章解釋如何對我們有興趣的參數運用這些步驟。
而其他狀況下的假設檢定則在 14 到 16 章中解釋。儘管某些細節會改 變,相同的這五個步驟總是會被使用。五個步驟如下:
1. 決定虛無假設和對立假設,為對母體的兩個可能推論。
2. 在證實所有必要資料的情況發生後,對其作適當的統計摘 要。
3. 如果虛無假設為事實,藉由比較統計量與預期的可能值來找 出 p-value。
4. 藉由 p-value 來決定這個結果是否顯著。
5. 做出這個情況的條件下的結論。
課程 1 和 2 將會解釋這五個步驟的基本概念和定義。課程 3 則會 討論假設鑑定可能的誤差和這些誤差對於可能值的影響。
2.
假設檢定(以𝐻0來表示)表示什麼都沒有發生的情況。每一個假設 檢定會因為問題不同而有所改變,但通常可以認為是維持現狀、沒有 關係或沒有差異。多數情形下,研究人員會希望能夠反駁虛無假設。
對立假設(以𝐻0表示)表示有發生什麼事的情況。多數情形中,研 究人員希望證明的便是對立假設。其可能表示現狀是錯誤的、是有關 係的或是有所不同。
3.
單邊假設檢定表示對立假設的參數在特定的「虛無」值中只有單 向成立。也可以被稱為單尾假設檢定。
雙邊假設檢定表示對立假設的參數在特定的虛無值中雙向都成 立。
4.
假設檢定的檢定統計量是用來評估虛無假設和對立假設的資料 摘要。
p-value 是假設虛無假設為真,且在這個假設下決定檢定統計量 的值會與對立假設的方向一樣極端,甚至更極端。
Pooled
(assumes equal population variances)
Data Confidence Interval Estimate
Hypothesized Difference 1 for the Difference Between Two Means
Level of Significance 0.05
Population 1 Sample Data
Sample Size 8 Confidence Level 95%
Sample Mean 72
Sample Standard Deviation 9.134 Intermediate Calculations
Population 2 Sample Degrees of Freedom 18
Sample Size 12 t Value 2.1009
Sample Mean 65.667 Interval Half Width 7.8451
Sample Standard Deviation 7.512
Confidence Interval
Intermediate Calculations Interval Lower Limit -1.5121 Population 1 Sample Degrees of Freedom 7 Interval Upper Limit 14.1781 Population 2 Sample Degrees of Freedom 11
Total Degrees of Freedom 18
Pooled Variance 66.9301
Standard Error 3.7341
Difference in Sample Means 6.3330
t Test Statistic 1.4282
Two-Tail Test
Lower Critical Value -2.1009
Upper Critical Value 2.1009
p-Value 0.1704
Do not reject the null hypothesis
Unpooled
(assumes unequal population variances) Data
Hypothesized Difference 1
Level of Significance 0.05
Population 1 Sample
Sample Size 8
Sample Mean 72
Sample Standard Deviation 9.1340 Population 2 Sample
Sample Size 12
Sample Mean 65.667 Sample Standard Deviation 7.5120
Intermediate Calculations Calculations Area
Numerator of Degrees of Freedom 228.9549 Pop. 1 Sample Variance 83.4300 Denominator of Degrees of Freedom 17.5473 Pop. 2 Sample Variance 56.4301 Total Degrees of Freedom 13.0479
Pop. 1 Sample Var./Sample
Size 10.4287
Degrees of Freedom 13
Pop. 2 Sample Var./Sample
Size 4.7025
Standard Error 3.8899 For one-tailed tests:
Difference in Sample Means 6.3330 T.DIST.RT value 0.0968 Separate-Variance t Test Statistic 1.3710 1-T.DIST.RT value 0.9032
Two-Tail Test
Lower Critical Value -2.1604
Upper Critical Value 2.1604
p-Value 0.1936
Do not reject the null hypothesis