第九章
簡單隨機抽樣與抽樣分配
學習目的
1. 了解抽樣的意義以及抽樣的重要性。
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
學習目的
1. 了解抽樣的意義以及抽樣的重要性。
2. 了解抽樣誤差與非機率誤差。
學習目的
1. 了解抽樣的意義以及抽樣的重要性。
2. 了解抽樣誤差與非機率誤差。
3. 知悉樣本大小、抽樣成本和抽樣誤差的關係。
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
學習目的
1. 了解抽樣的意義以及抽樣的重要性。
2. 了解抽樣誤差與非機率誤差。
3. 知悉樣本大小、抽樣成本和抽樣誤差的關係。
4. 了解簡單隨機抽樣。
學習目的
1. 了解抽樣的意義以及抽樣的重要性。
2. 了解抽樣誤差與非機率誤差。
3. 知悉樣本大小、抽樣成本和抽樣誤差的關係。
4. 了解簡單隨機抽樣。
5. 了解樣本統計量:樣本平均數、樣本比例的抽樣分配 的形狀及其平均數、變異數的計算。
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
學習目的
1. 了解抽樣的意義以及抽樣的重要性。
2. 了解抽樣誤差與非機率誤差。
3. 知悉樣本大小、抽樣成本和抽樣誤差的關係。
4. 了解簡單隨機抽樣。
5. 了解樣本統計量:樣本平均數、樣本比例的抽樣分配 的形狀及其平均數、變異數的計算。
6. 了解中央極限定理及其應用。
學習目的
1. 了解抽樣的意義以及抽樣的重要性。
2. 了解抽樣誤差與非機率誤差。
3. 知悉樣本大小、抽樣成本和抽樣誤差的關係。
4. 了解簡單隨機抽樣。
5. 了解樣本統計量:樣本平均數、樣本比例的抽樣分配 的形狀及其平均數、變異數的計算。
6. 了解中央極限定理及其應用。
7. 了解其他抽樣方法。
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
學習目的
1. 了解抽樣的意義以及抽樣的重要性。
2. 了解抽樣誤差與非機率誤差。
3. 知悉樣本大小、抽樣成本和抽樣誤差的關係。
4. 了解簡單隨機抽樣。
5. 了解樣本統計量:樣本平均數、樣本比例的抽樣分配 的形狀及其平均數、變異數的計算。
6. 了解中央極限定理及其應用。
本章結構
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
簡單隨機抽樣與 抽樣分配
抽樣的重要性 與抽樣誤差
樣本比例的 抽樣分配
Excel 的使用 簡單隨機
抽樣
簡單隨機 抽樣的方
法 簡單隨機 抽樣的實
施方法 抽樣的
重要性 抽樣誤差 與非抽樣
誤差 抽樣成本 與抽樣誤
差 抽樣單位 與抽樣底
冊
抽樣分配
中央極限 定理
其他抽樣 分配 母體比例與
樣本比例 樣本比例的平 均數與變異數 樣本比例抽樣
分配的情形 樣本比例抽樣
分配的應用 樣本平均數的
抽樣分配
母體分配 樣本平均數 的抽樣分配 抽樣誤差與 非抽樣誤差 樣本平均數 的平均數與
變異數 樣本平均數 的平均數與
變異數
樣本平均數 抽樣分配的
應用
•
統計推論係利用樣本統計量去推論母體的特質,而樣本是否具有代表性會受抽樣方法的影響,因 此抽樣方法非常重要。
抽樣的重要性
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
抽樣的重要性
等待看牙時間(母體)
抽樣的重要性
等待看牙時間(樣本一) 等待看牙時間(樣本二)
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
•
抽樣誤差抽樣誤差是樣本統計量與相對應的母體參數間的差異。
此種差異來自抽樣過程中的機遇(chance)、抽樣方法 及推論方法的不同。
抽樣誤差與非抽樣誤差
•
抽樣誤差抽樣誤差是樣本統計量與相對應的母體參數間的差異。
此種差異來自抽樣過程中的機遇(chance)、抽樣方法 及推論方法的不同。
•
非抽樣誤差非抽樣誤差主要來自調查時的執行與事後在記錄、整理 資料時所發生的錯誤。
抽樣誤差與非抽樣誤差
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
抽樣誤差與非抽樣誤差
樣本統計量 母體參數
抽樣誤差與非抽樣誤差
樣本統計量 母體參數
估計誤差
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
抽樣誤差與非抽樣誤差
樣本統計量 母體參數
估計誤差
非抽樣誤差 抽樣誤差
抽樣誤差與非抽樣誤差
樣本統計量 母體參數
估計誤差
非抽樣誤差 抽樣誤差
資 時 料 的
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
抽樣誤差與非抽樣誤差
樣本統計量 母體參數
估計誤差
非抽樣誤差 抽樣誤差
資 時 料 的 整 疏 理 失
抽 樣 方 法
推 論 方 法
樣 本 數
抽樣成本與抽樣誤差
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
抽樣底冊
•
抽樣單位抽樣母體中的一個母體元素或一組母體元素。
抽樣底冊
•
抽樣單位抽樣母體中的一個母體元素或一組母體元素。
•
抽樣底冊抽樣單位的名冊或一覽表。
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
簡單隨機抽樣
•
簡單隨機抽樣的意義抽取樣本時,若所有可能抽出的樣本被抽出的機率均相 等,則稱該抽樣方法為簡單隨機抽樣。
簡單隨機抽樣
•
簡單隨機抽樣的意義抽取樣本時,若所有可能抽出的樣本被抽出的機率均相 等,則稱該抽樣方法為簡單隨機抽樣。
•
簡單隨機抽樣的實施方式 1. 抽籤式應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
簡單隨機抽樣
•
簡單隨機抽樣的意義抽取樣本時,若所有可能抽出的樣本被抽出的機率均相 等,則稱該抽樣方法為簡單隨機抽樣。
•
簡單隨機抽樣的實施方式 1. 抽籤式2. 以亂數表抽取樣本
0 1 2 3 4 5 6 7 8 9 10 1 6824 7709 3937 3289 9545 620 3904 5203 6590 8769 2 237 7574 8607 1502 4776 944 4946 1519 4834 2810 3 1336 8960 2192 7132 9267 4262 6070 7664 7690 3873 4 6840 3016 3991 8582 1813 12 3781 8635 286 3932 5 5577 7452 9477 7942 7328 822 7876 6379 9014 6845 6 3495 3500 9497 8688 7764 17 1221 5816 8840 8573 7 5163 5127 5955 7826 982 3563 7783 1575 7738 9146 8 3746 5767 5137 3846 9113 3394 5172 3745 2574 5275 9 596 6736 4273 7665 8229 6933 6510 93 4091 4567 10 6553 4267 4071 3532 593 3874 5368 5295 6303 2629
亂數表
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
簡單隨機抽樣
•
簡單隨機抽樣的意義抽取樣本時,若所有可能抽出的樣本被抽出的機率均相 等,則稱該抽樣方法為簡單隨機抽樣。
•
簡單隨機抽樣的實施方式 1. 抽籤式2. 以亂數表抽取樣本 3. 用電腦做隨機抽樣
設定母體元素個數
(編輯 → 填滿 → 數列)應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
設定母體元素個數
1~800
(編輯 → 填滿 → 數列)
設定母體元素個數
1~800
(編輯 → 填滿 → 數列)
進行隨機抽樣
(工具 → 資料分析 → 抽樣)應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
設定母體元素個數
1~800
(編輯 → 填滿 → 數列)
進行隨機抽樣
(工具 → 資料分析 → 抽樣)抽取 50 個樣本
抽樣分配
•
母體參數母體參數是描述母體資料特性的統計測量數,一班簡稱為 參數或母數。參數是我們想要獲取的,是統計的核心。
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
抽樣分配
•
母體參數母體參數是描述母體資料特性的統計測量數,一班簡稱為 參數或母數。參數是我們想要獲取的,是統計的核心。
•
樣本統計量樣本統計量為樣本的實體函數。通常用來描述樣本的資料 特性,或用來推論母體參數。
抽樣分配
•
母體參數母體參數是描述母體資料特性的統計測量數,一班簡稱為 參數或母數。參數是我們想要獲取的,是統計的核心。
•
樣本統計量樣本統計量為樣本的實體函數。通常用來描述樣本的資料 特性,或用來推論母體參數。
•
抽樣分配應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
樣本平均數的抽樣分配
樣本平均數的抽樣分配
•
母體分配母體分配是母體元素的機率分配。
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
樣本平均數的抽樣分配
x f
22 1
25 2
28 1
30 1
N = 5
展示小姐的月薪的次數分配
•
母體分配母體分配是母體元素的機率分配。
x f(x)
22 1 / 5 = 0.2
25 2 / 5 = 0.4
28 1 / 5 = 0.2
展示小姐的月薪的母體機率分配
樣本平均數的抽樣分配
•
母體分配母體分配是母體元素的機率分配。
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
樣本平均數的抽樣分配
0 0.1 0.2 0.3 0.4 0.5
22 25 28 30 x
f(x)
µ = 26,σ
2 = 7.6展示小姐的月薪的母體機率分配
•
母體分配母體分配是母體元素的機率分配。
樣本平均數的抽樣分配
•
母體分配母體分配是母體元素的機率分配。
•
樣本平均數的抽樣分配設母體為隨機變數 X,其機率分配為 f(x),若字母體中簡單 隨機抽取 n 個元素為一組樣本,表為 (X1
, X
2, ... , X
n),若 令,則 為樣本平均數。其機率分配表為 ,
稱為樣本平均數的抽樣分配。X = n X
i i = 1/
nX f x
] g應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
母體
N
母體
N
所有可能樣本
x
1⠇
x
n抽樣
x
1⠇
x
nS
1S
2S
⠇
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
母體
N
所有可能樣本 所有樣本平均數
x
1⠇
x
n抽樣
x
1⠇
x
nx
1⠇
x
nS
1S
2S
CnN⠇
x
1=
n
/ x
x
2=
n
/ x
x
CnN=
n
/ x
x f x ] g
x
11 C
nNx
21 C
nN⠇ ⠇
x
CnN1 C
nN的平均數與變異數
E X ] g
、V X ] g
X
樣本平均數的機率分配
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
A = 22 B = 25 C = 25 D = 28 E = 30
展示小姐月薪的抽樣
A = 22 B = 25 C = 25 D = 28 E = 30
(ABC) (ABD) (ABE) (ACD) (ACE) (ADE) (BCD) (BCE) (BDE) (CDE)
展示小姐月薪的抽樣
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
A = 22 B = 25 C = 25 D = 28 E = 30
(ABC) (ABD) (ABE) (ACD) (ACE) (ADE) (BCD) (BCE) (BDE) (CDE)
X = 3
X
1+ X
2+ X
3定義
X
:樣本組的平均數 展示小姐月薪的抽樣樣本 樣本平均數
(ABC) = (22 , 25 , 25) 24
(ABD) = (22 , 25 , 28) 25
(ABE) = (22 , 25 , 30) 25.66667
(ACD) = (22 , 25 , 28) 25
(ACE) = (22 , 25 , 30) 25.66667 (ADE) = (22 , 28 , 30) 26.66667
(BCD) = (25 , 25 , 28) 26
(BCE) = (25 , 25 , 30) 26.66667 (BDE) = (25 , 28 , 30) 27.66667
x
展示小姐月薪的樣本平均數
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
x x
2f x ] g x
2f x ] g
24 576 1 / 10 = 0.10 57.6
25 625 2 / 10 = 0.20 125
25.66667 659.7779489 2 / 10 = 0.20 131.7555898
26 676 1 / 10 = 0.10 67.6
26.66667 711.1112889 2 / 10 = 0.20 142.2222578 27.66667 765.4446289 2 / 10 = 0.20 153.0999258
∑ f( ) = 1.00x 677.2667733
展示小姐的月薪的抽樣分配
0.1 0.2 0.3
展示小姐的月薪抽樣分配圖
f x ] g
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
樣本平均數的平均數與變異數
•
抽樣分配的平均數X
E X ] g
= nX = nX
抽樣分配的平均數等於母體平均數,即樣本平均數的平均數與變異數
•
抽樣分配的平均數X
E X ] g
= nX = n•
無限母體樣本平均數的變異數與標準差v
2X= V X ] g = n v
2v
X=
n v
X
抽樣分配的平均數等於母體平均數,即應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
樣本平均數的平均數與變異數
•
抽樣分配的平均數X
E X ] g
= nX = n•
無限母體樣本平均數的變異數與標準差•
有限母體抽出不放回樣本平均數的變異數與標準差v
2X= V X ] g = n v
2v
X=
n v
v
2X= V X ] g = n v
2$ N - 1 N - n v
X=
n
v $ N - 1
N - n
X
抽樣分配的平均數等於母體平均數,即常態母體樣本平均數的抽樣分配
•
常態母體 的抽樣分配X
X X
設母體
X 為一常態分配,表為 X ~ N(µ , σ
2),自母 體中簡單隨機抽取 n 個為樣本,令 = ∑ X / n,則不論樣本數為何
為一常態分配,且平均數為 µ、變異數為 σ
2/ n 表為:
X ~N n, n a v
2k
中央極限定理
•
中央極限定理(非常態母體 的抽樣分配)X
無論母體為何種分配,自母體簡單隨機抽取
n 個為
一組樣本,若樣本數n 夠大(一般認為 n ≥ 30),
則樣本平均數的抽樣分配會趨近於常態分配。
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
中央極限定理
•
中央極限定理(非常態母體 的抽樣分配)X
無論母體為何種分配,自母體簡單隨機抽取
n 個為
一組樣本,若樣本數n 夠大(一般認為 n ≥ 30),
則樣本平均數的抽樣分配會趨近於常態分配。
母體分配 A 母體分配 B
n = 5
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
抽樣分配 A 抽樣分配 B
µ µ
n = 10 n = 5
抽樣分配 A 抽樣分配 B
n = 30 n = 10
n = 5
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
抽樣分配 A 抽樣分配 B
µ µ
n = 30 n = 10
n = 5
抽樣分配 A 抽樣分配 B
中央極限定理
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
•
應用中央極限定理的注意事項1. 一般而言,不論母體為何種分配,當 n ≥ 30 時,
漸趨於常態分配。
X
中央極限定理
•
應用中央極限定理的注意事項2. 中央極限定理可適用於樣本統計量為隨機樣本 (X1, X2, ... , Xn) 線性函數的情況。
1. 一般而言,不論母體為何種分配,當 n ≥ 30 時,
漸趨於常態分配。
X
中央極限定理
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
•
應用中央極限定理的注意事項2. 中央極限定理可適用於樣本統計量為隨機樣本 (X1, X2, ... , Xn) 線性函數的情況。
3. 若母體為非常態分配,雖是大樣本,則其抽樣分 配不是常態分配,而是近似常態分配。
1. 一般而言,不論母體為何種分配,當 n ≥ 30 時,
漸趨於常態分配。
X
中央極限定理
•
應用中央極限定理的注意事項2. 中央極限定理可適用於樣本統計量為隨機樣本 (X1, X2, ... , Xn) 線性函數的情況。
3. 若母體為非常態分配,雖是大樣本,則其抽樣分 配不是常態分配,而是近似常態分配。
1. 一般而言,不論母體為何種分配,當 n ≥ 30 時,
漸趨於常態分配。
X
的抽樣分配
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
X
樣本 母體分配 抽樣分配
大樣本 母體為常態分配
(n ≥ 30)
母體非常態分配
小樣本 母體為常態分配
(n < 30)
母體非常態分配
X
的分配決定於母體分配X ~N n, n a v
2k
X ~N n, n a v
2k
X ~N n, n a v
2k
樣本平均數的抽樣分配 - Excel
工具 → 資料分析 → 亂數產生器
樣本平均數的抽樣分配 - Excel
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
工具 → 資料分析 → 敘述統計
樣本平均數的抽樣分配 - Excel
工具 → 資料分析 → 直方圖
樣本平均數的抽樣分配 - Excel
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
樣本比例的抽樣分配
•
母體比例p = K N
樣本比例的抽樣分配
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
•
母體比例•
樣本比例p = K N
W p
= n k
= n X
i i = 1/
n樣本比例的抽樣分配
•
母體比例•
樣本比例•
樣本比例的平均數p = K N
W p
= n k
= n X
i i = 1/
nE p a k W
= n = p
樣本比例的抽樣分配
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
•
變異數與標準差1. 無限母體
V p a k
W= vWp
2 = n
pq
v
Wp= pq n
樣本比例的抽樣分配
•
變異數與標準差1. 無限母體
2. 有限母體
V p a k
W= vWp
2 = n
pq
v
Wp= pq n
V p a k W
= v
Wp2
= n pq
$ N - 1 N - n
樣本比例的抽樣分配
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
點二項分配
樣本比例抽樣分配的形狀
母體為一點二項分配 E(X) = p , V(X) = pq
母體無限 母體有限
大樣本
np > 5 , nq > 5
小樣本
W~N p, n p b pq l
W~N p, n p pq
N - 1 N - n
c m
超幾何分配
W~p p, npq
N - 1 N - n
c m
p
二項分配W~
b p, n pq l
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
分層抽樣-比例抽樣
第一層 第二層 ... 第 K 層
n1 n2 nk
分層抽樣-比例抽樣
樣本
分 層 抽 樣 是 將 母 體 依 其 特 性,或依與調查目的有關的 性質,分成幾類或組。母體 中的每一個個體或元素都屬
第一層 第二層 ... 第 K 層
n1 n2 nk
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
部落抽樣
第一 母體
部落
第二 部落
第 K
... 部落
部落抽樣
部落抽樣是先將母體中相鄰 的某些群體劃分為 n 個不同 的部落,母體中的每一個元 素均屬於其中的一個部落,
且是唯一的一個部落。然後 再從這些部落中隨機抽取部
第一 母體
部落
第二 部落
第 K
... 部落
樣本
隨機抽樣
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
系統抽樣
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 ... k (k+1) (k+2) ... N 母體
系統抽樣
系統抽樣法是自母體自然隨 機排列的資料中,每隔一定 間隔選取一個樣本,直到抽
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 ... k (k+1) (k+2) ... N 母體
樣本
6 12 18
以 Excel 做系統抽樣
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
工具 → 資料分析 → 抽樣
母體資料範圍
以 Excel 做系統抽樣
工具 → 資料分析 → 抽樣
母體資料範圍
抽樣週期
以 Excel 做系統抽樣
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
分段抽樣
... 母體
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
分段抽樣
... 母體
部落抽樣或分層抽樣
分段抽樣
分段抽樣法是將母體按照某些 特性或某種分類標準分為數個 部落或層別,先由這些部落或 層別中抽出幾個部落或層別,
此為第一段。再由已經抽出的 部落或層別,依特性或分類標 準再抽出部落或層別,此為第 ... 母體
部落抽樣或分層抽樣
部落抽樣或分層抽樣
應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006
•
判斷抽樣法統計人員或調查研究人員根據自己的專長、知識、研究 的目的來選取代表性的樣本,此種抽樣方法稱為判斷抽 樣法,又稱為目的抽樣法。
非機率抽樣法
•
判斷抽樣法統計人員或調查研究人員根據自己的專長、知識、研究 的目的來選取代表性的樣本,此種抽樣方法稱為判斷抽 樣法,又稱為目的抽樣法。
•
方便抽樣法方便抽樣法式調查研究人員以現有的或方便取得的方式 來抽取樣本的方法。