• 沒有找到結果。

第九章

N/A
N/A
Protected

Academic year: 2022

Share "第九章"

Copied!
91
0
0

加載中.... (立即查看全文)

全文

(1)

第九章

簡單隨機抽樣與抽樣分配

(2)

學習目的

1. 了解抽樣的意義以及抽樣的重要性。

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

(3)

學習目的

1. 了解抽樣的意義以及抽樣的重要性。

2. 了解抽樣誤差與非機率誤差。

(4)

學習目的

1. 了解抽樣的意義以及抽樣的重要性。

2. 了解抽樣誤差與非機率誤差。

3. 知悉樣本大小、抽樣成本和抽樣誤差的關係。

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

(5)

學習目的

1. 了解抽樣的意義以及抽樣的重要性。

2. 了解抽樣誤差與非機率誤差。

3. 知悉樣本大小、抽樣成本和抽樣誤差的關係。

4. 了解簡單隨機抽樣。

(6)

學習目的

1. 了解抽樣的意義以及抽樣的重要性。

2. 了解抽樣誤差與非機率誤差。

3. 知悉樣本大小、抽樣成本和抽樣誤差的關係。

4. 了解簡單隨機抽樣。

5. 了解樣本統計量:樣本平均數、樣本比例的抽樣分配 的形狀及其平均數、變異數的計算。

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

(7)

學習目的

1. 了解抽樣的意義以及抽樣的重要性。

2. 了解抽樣誤差與非機率誤差。

3. 知悉樣本大小、抽樣成本和抽樣誤差的關係。

4. 了解簡單隨機抽樣。

5. 了解樣本統計量:樣本平均數、樣本比例的抽樣分配 的形狀及其平均數、變異數的計算。

6. 了解中央極限定理及其應用。

(8)

學習目的

1. 了解抽樣的意義以及抽樣的重要性。

2. 了解抽樣誤差與非機率誤差。

3. 知悉樣本大小、抽樣成本和抽樣誤差的關係。

4. 了解簡單隨機抽樣。

5. 了解樣本統計量:樣本平均數、樣本比例的抽樣分配 的形狀及其平均數、變異數的計算。

6. 了解中央極限定理及其應用。

7. 了解其他抽樣方法。

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

(9)

學習目的

1. 了解抽樣的意義以及抽樣的重要性。

2. 了解抽樣誤差與非機率誤差。

3. 知悉樣本大小、抽樣成本和抽樣誤差的關係。

4. 了解簡單隨機抽樣。

5. 了解樣本統計量:樣本平均數、樣本比例的抽樣分配 的形狀及其平均數、變異數的計算。

6. 了解中央極限定理及其應用。

(10)

本章結構

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

簡單隨機抽樣與 抽樣分配

抽樣的重要性 與抽樣誤差

樣本比例的 抽樣分配

Excel 的使用 簡單隨機

抽樣

簡單隨機 抽樣的方

簡單隨機 抽樣的實

施方法 抽樣的

重要性 抽樣誤差 與非抽樣

誤差 抽樣成本 與抽樣誤

抽樣單位 與抽樣底

抽樣分配

中央極限 定理

其他抽樣 分配 母體比例與

樣本比例 樣本比例的平 均數與變異數 樣本比例抽樣

分配的情形 樣本比例抽樣

分配的應用 樣本平均數的

抽樣分配

母體分配 樣本平均數 的抽樣分配 抽樣誤差與 非抽樣誤差 樣本平均數 的平均數與

變異數 樣本平均數 的平均數與

變異數

樣本平均數 抽樣分配的

應用

(11)

統計推論係利用樣本統計量去推論母體的特質,

而樣本是否具有代表性會受抽樣方法的影響,因 此抽樣方法非常重要。

抽樣的重要性

(12)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

抽樣的重要性

等待看牙時間(母體)

(13)

抽樣的重要性

等待看牙時間(樣本一) 等待看牙時間(樣本二)

(14)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

抽樣誤差

抽樣誤差是樣本統計量與相對應的母體參數間的差異。

此種差異來自抽樣過程中的機遇(chance)、抽樣方法 及推論方法的不同。

抽樣誤差與非抽樣誤差

(15)

抽樣誤差

抽樣誤差是樣本統計量與相對應的母體參數間的差異。

此種差異來自抽樣過程中的機遇(chance)、抽樣方法 及推論方法的不同。

非抽樣誤差

非抽樣誤差主要來自調查時的執行與事後在記錄、整理 資料時所發生的錯誤。

抽樣誤差與非抽樣誤差

(16)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

抽樣誤差與非抽樣誤差

樣本統計量 母體參數

(17)

抽樣誤差與非抽樣誤差

樣本統計量 母體參數

估計誤差

(18)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

抽樣誤差與非抽樣誤差

樣本統計量 母體參數

估計誤差

非抽樣誤差 抽樣誤差

(19)

抽樣誤差與非抽樣誤差

樣本統計量 母體參數

估計誤差

非抽樣誤差 抽樣誤差

資 時 料 的

(20)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

抽樣誤差與非抽樣誤差

樣本統計量 母體參數

估計誤差

非抽樣誤差 抽樣誤差

資 時 料 的 整 疏 理 失

抽 樣 方 法

推 論 方 法

樣 本 數

(21)

抽樣成本與抽樣誤差

(22)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

抽樣底冊

抽樣單位

抽樣母體中的一個母體元素或一組母體元素。

(23)

抽樣底冊

抽樣單位

抽樣母體中的一個母體元素或一組母體元素。

抽樣底冊

抽樣單位的名冊或一覽表。

(24)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

簡單隨機抽樣

簡單隨機抽樣的意義

抽取樣本時,若所有可能抽出的樣本被抽出的機率均相 等,則稱該抽樣方法為簡單隨機抽樣。

(25)

簡單隨機抽樣

簡單隨機抽樣的意義

抽取樣本時,若所有可能抽出的樣本被抽出的機率均相 等,則稱該抽樣方法為簡單隨機抽樣。

簡單隨機抽樣的實施方式 1. 抽籤式

(26)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

簡單隨機抽樣

簡單隨機抽樣的意義

抽取樣本時,若所有可能抽出的樣本被抽出的機率均相 等,則稱該抽樣方法為簡單隨機抽樣。

簡單隨機抽樣的實施方式 1. 抽籤式

2. 以亂數表抽取樣本

(27)

0 1 2 3 4 5 6 7 8 9 10 1 6824 7709 3937 3289 9545 620 3904 5203 6590 8769 2 237 7574 8607 1502 4776 944 4946 1519 4834 2810 3 1336 8960 2192 7132 9267 4262 6070 7664 7690 3873 4 6840 3016 3991 8582 1813 12 3781 8635 286 3932 5 5577 7452 9477 7942 7328 822 7876 6379 9014 6845 6 3495 3500 9497 8688 7764 17 1221 5816 8840 8573 7 5163 5127 5955 7826 982 3563 7783 1575 7738 9146 8 3746 5767 5137 3846 9113 3394 5172 3745 2574 5275 9 596 6736 4273 7665 8229 6933 6510 93 4091 4567 10 6553 4267 4071 3532 593 3874 5368 5295 6303 2629

亂數表

(28)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

簡單隨機抽樣

簡單隨機抽樣的意義

抽取樣本時,若所有可能抽出的樣本被抽出的機率均相 等,則稱該抽樣方法為簡單隨機抽樣。

簡單隨機抽樣的實施方式 1. 抽籤式

2. 以亂數表抽取樣本 3. 用電腦做隨機抽樣

(29)

設定母體元素個數

(編輯 → 填滿 → 數列)

(30)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

設定母體元素個數

1~800

(編輯 → 填滿 → 數列)

(31)

設定母體元素個數

1~800

(編輯 → 填滿 → 數列)

進行隨機抽樣

(工具 → 資料分析 → 抽樣)

(32)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

設定母體元素個數

1~800

(編輯 → 填滿 → 數列)

進行隨機抽樣

(工具 → 資料分析 → 抽樣)

抽取 50 個樣本

(33)

抽樣分配

母體參數

母體參數是描述母體資料特性的統計測量數,一班簡稱為 參數或母數。參數是我們想要獲取的,是統計的核心。

(34)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

抽樣分配

母體參數

母體參數是描述母體資料特性的統計測量數,一班簡稱為 參數或母數。參數是我們想要獲取的,是統計的核心。

樣本統計量

樣本統計量為樣本的實體函數。通常用來描述樣本的資料 特性,或用來推論母體參數。

(35)

抽樣分配

母體參數

母體參數是描述母體資料特性的統計測量數,一班簡稱為 參數或母數。參數是我們想要獲取的,是統計的核心。

樣本統計量

樣本統計量為樣本的實體函數。通常用來描述樣本的資料 特性,或用來推論母體參數。

抽樣分配

(36)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

樣本平均數的抽樣分配

(37)

樣本平均數的抽樣分配

母體分配

母體分配是母體元素的機率分配。

(38)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

樣本平均數的抽樣分配

x f

22 1

25 2

28 1

30 1

N = 5

展示小姐的月薪的次數分配

母體分配

母體分配是母體元素的機率分配。

(39)

x f(x)

22 1 / 5 = 0.2

25 2 / 5 = 0.4

28 1 / 5 = 0.2

展示小姐的月薪的母體機率分配

樣本平均數的抽樣分配

母體分配

母體分配是母體元素的機率分配。

(40)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

樣本平均數的抽樣分配

0 0.1 0.2 0.3 0.4 0.5

22 25 28 30 x

f(x)

µ = 26,σ

2 = 7.6

展示小姐的月薪的母體機率分配

母體分配

母體分配是母體元素的機率分配。

(41)

樣本平均數的抽樣分配

母體分配

母體分配是母體元素的機率分配。

樣本平均數的抽樣分配

設母體為隨機變數 X,其機率分配為 f(x),若字母體中簡單 隨機抽取 n 個元素為一組樣本,表為 (X1

, X

2

, ... , X

n),若 令

,則 為樣本平均數。其機率分配表為 ,

稱為樣本平均數的抽樣分配。

X = n X

i i = 1

/

n

X f x

] g

(42)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

母體

N

(43)

母體

N

所有可能樣本

x

1

x

n

抽樣

x

1

x

n

S

1

S

2

S

(44)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

母體

N

所有可能樣本 所有樣本平均數

x

1

x

n

抽樣

x

1

x

n

x

1

x

n

S

1

S

2

S

CnN

x

1

=

n

/ x

x

2

=

n

/ x

x

CnN

=

n

/ x

(45)

x f x ] g

x

1

1 C

nN

x

2

1 C

nN

⠇ ⠇

x

CnN

1 C

nN

的平均數與變異數

E X ] g

V X ] g

X

樣本平均數的機率分配

(46)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

A = 22 B = 25 C = 25 D = 28 E = 30

展示小姐月薪的抽樣

(47)

A = 22 B = 25 C = 25 D = 28 E = 30

(ABC) (ABD) (ABE) (ACD) (ACE) (ADE) (BCD) (BCE) (BDE) (CDE)

展示小姐月薪的抽樣

(48)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

A = 22 B = 25 C = 25 D = 28 E = 30

(ABC) (ABD) (ABE) (ACD) (ACE) (ADE) (BCD) (BCE) (BDE) (CDE)

X = 3

X

1

+ X

2

+ X

3

定義

X

:樣本組的平均數 展示小姐月薪的抽樣

(49)

樣本 樣本平均數

(ABC) = (22 , 25 , 25) 24

(ABD) = (22 , 25 , 28) 25

(ABE) = (22 , 25 , 30) 25.66667

(ACD) = (22 , 25 , 28) 25

(ACE) = (22 , 25 , 30) 25.66667 (ADE) = (22 , 28 , 30) 26.66667

(BCD) = (25 , 25 , 28) 26

(BCE) = (25 , 25 , 30) 26.66667 (BDE) = (25 , 28 , 30) 27.66667

x

展示小姐月薪的樣本平均數

(50)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

x x

2

f x ] g x

2

f x ] g

24 576 1 / 10 = 0.10 57.6

25 625 2 / 10 = 0.20 125

25.66667 659.7779489 2 / 10 = 0.20 131.7555898

26 676 1 / 10 = 0.10 67.6

26.66667 711.1112889 2 / 10 = 0.20 142.2222578 27.66667 765.4446289 2 / 10 = 0.20 153.0999258

∑ f( ) = 1.00x 677.2667733

展示小姐的月薪的抽樣分配

(51)

0.1 0.2 0.3

展示小姐的月薪抽樣分配圖

f x ] g

(52)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

樣本平均數的平均數與變異數

抽樣分配的平均數

X

E X ] g

= nX = n

X

抽樣分配的平均數等於母體平均數,即

(53)

樣本平均數的平均數與變異數

抽樣分配的平均數

X

E X ] g

= nX = n

無限母體樣本平均數的變異數與標準差

v

2X

= V X ] g = n v

2

v

X

=

n v

X

抽樣分配的平均數等於母體平均數,即

(54)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

樣本平均數的平均數與變異數

抽樣分配的平均數

X

E X ] g

= nX = n

無限母體樣本平均數的變異數與標準差

有限母體抽出不放回樣本平均數的變異數與標準差

v

2X

= V X ] g = n v

2

v

X

=

n v

v

2X

= V X ] g = n v

2

$ N - 1 N - n v

X

=

n

v $ N - 1

N - n

X

抽樣分配的平均數等於母體平均數,即

(55)

常態母體樣本平均數的抽樣分配

常態母體 的抽樣分配

X

X X

設母體

X 為一常態分配,表為 X ~ N(µ , σ

2),自母 體中簡單隨機抽取 n 個為樣本,令 = ∑ X / n,

則不論樣本數為何

為一常態分配,且平均數為 µ、變異數為 σ

2

/ n 表為:

X ~N n, n a v

2

k

(56)

中央極限定理

中央極限定理(非常態母體 的抽樣分配)

X

無論母體為何種分配,自母體簡單隨機抽取

n 個為

一組樣本,若樣本數

n 夠大(一般認為 n ≥ 30),

則樣本平均數的抽樣分配會趨近於常態分配。

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

(57)

中央極限定理

中央極限定理(非常態母體 的抽樣分配)

X

無論母體為何種分配,自母體簡單隨機抽取

n 個為

一組樣本,若樣本數

n 夠大(一般認為 n ≥ 30),

則樣本平均數的抽樣分配會趨近於常態分配。

母體分配 A 母體分配 B

(58)

n = 5

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

抽樣分配 A 抽樣分配 B

µ µ

(59)

n = 10 n = 5

抽樣分配 A 抽樣分配 B

(60)

n = 30 n = 10

n = 5

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

抽樣分配 A 抽樣分配 B

µ µ

(61)

n = 30 n = 10

n = 5

抽樣分配 A 抽樣分配 B

(62)

中央極限定理

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

應用中央極限定理的注意事項

1. 一般而言,不論母體為何種分配,當 n ≥ 30 時,

漸趨於常態分配。

X

(63)

中央極限定理

應用中央極限定理的注意事項

2. 中央極限定理可適用於樣本統計量為隨機樣本 (X1, X2, ... , Xn) 線性函數的情況。

1. 一般而言,不論母體為何種分配,當 n ≥ 30 時,

漸趨於常態分配。

X

(64)

中央極限定理

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

應用中央極限定理的注意事項

2. 中央極限定理可適用於樣本統計量為隨機樣本 (X1, X2, ... , Xn) 線性函數的情況。

3. 若母體為非常態分配,雖是大樣本,則其抽樣分 配不是常態分配,而是近似常態分配。

1. 一般而言,不論母體為何種分配,當 n ≥ 30 時,

漸趨於常態分配。

X

(65)

中央極限定理

應用中央極限定理的注意事項

2. 中央極限定理可適用於樣本統計量為隨機樣本 (X1, X2, ... , Xn) 線性函數的情況。

3. 若母體為非常態分配,雖是大樣本,則其抽樣分 配不是常態分配,而是近似常態分配。

1. 一般而言,不論母體為何種分配,當 n ≥ 30 時,

漸趨於常態分配。

X

(66)

的抽樣分配

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

X

樣本 母體分配 抽樣分配

大樣本 母體為常態分配

(n ≥ 30)

母體非常態分配

小樣本 母體為常態分配

(n < 30)

母體非常態分配

X

的分配決定於母體分配

X ~N n, n a v

2

k

X ~N n, n a v

2

k

X ~N n, n a v

2

k

(67)

樣本平均數的抽樣分配 - Excel

工具 → 資料分析 → 亂數產生器

(68)

樣本平均數的抽樣分配 - Excel

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

(69)

工具 → 資料分析 → 敘述統計

樣本平均數的抽樣分配 - Excel

(70)

工具 → 資料分析 → 直方圖

樣本平均數的抽樣分配 - Excel

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

(71)

樣本比例的抽樣分配

母體比例

p = K N

(72)

樣本比例的抽樣分配

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

母體比例

樣本比例

p = K N

W p

= n k

= n X

i i = 1

/

n

(73)

樣本比例的抽樣分配

母體比例

樣本比例

樣本比例的平均數

p = K N

W p

= n k

= n X

i i = 1

/

n

E p a k W

= n = p

(74)

樣本比例的抽樣分配

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

變異數與標準差

1. 無限母體

V p a k

W

= vWp

2 = n

pq

v

Wp

= pq n

(75)

樣本比例的抽樣分配

變異數與標準差

1. 無限母體

2. 有限母體

V p a k

W

= vWp

2 = n

pq

v

Wp

= pq n

V p a k W

= v

Wp

2

= n pq

$ N - 1 N - n

(76)

樣本比例的抽樣分配

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

點二項分配

(77)

樣本比例抽樣分配的形狀

母體為一點二項分配 E(X) = p , V(X) = pq

母體無限 母體有限

大樣本

np > 5 , nq > 5

小樣本

W~N p, n p b pq l

W~N p, n p pq

N - 1 N - n

c m

超幾何分配

W~p p, npq

N - 1 N - n

c m

p

二項分配

W~

b p, n pq l

(78)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

分層抽樣-比例抽樣

第一層 第二層 ... K 層

n1 n2 nk

(79)

分層抽樣-比例抽樣

樣本

分 層 抽 樣 是 將 母 體 依 其 特 性,或依與調查目的有關的 性質,分成幾類或組。母體 中的每一個個體或元素都屬

第一層 第二層 ... K 層

n1 n2 nk

(80)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

部落抽樣

第一 母體

部落

第二 部落

K

... 部落

(81)

部落抽樣

部落抽樣是先將母體中相鄰 的某些群體劃分為 n 個不同 的部落,母體中的每一個元 素均屬於其中的一個部落,

且是唯一的一個部落。然後 再從這些部落中隨機抽取部

第一 母體

部落

第二 部落

K

... 部落

樣本

隨機抽樣

(82)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

系統抽樣

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 ... k (k+1) (k+2) ... N 母體

(83)

系統抽樣

系統抽樣法是自母體自然隨 機排列的資料中,每隔一定 間隔選取一個樣本,直到抽

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 ... k (k+1) (k+2) ... N 母體

樣本

6 12 18

(84)

以 Excel 做系統抽樣

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

工具 → 資料分析 → 抽樣

母體資料範圍

(85)

以 Excel 做系統抽樣

工具 → 資料分析 → 抽樣

母體資料範圍

抽樣週期

(86)

以 Excel 做系統抽樣

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

(87)

分段抽樣

... 母體

(88)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

分段抽樣

... 母體

部落抽樣或分層抽樣

(89)

分段抽樣

分段抽樣法是將母體按照某些 特性或某種分類標準分為數個 部落或層別,先由這些部落或 層別中抽出幾個部落或層別,

此為第一段。再由已經抽出的 部落或層別,依特性或分類標 準再抽出部落或層別,此為第 ... 母體

部落抽樣或分層抽樣

部落抽樣或分層抽樣

(90)

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006

判斷抽樣法

統計人員或調查研究人員根據自己的專長、知識、研究 的目的來選取代表性的樣本,此種抽樣方法稱為判斷抽 樣法,又稱為目的抽樣法。

非機率抽樣法

(91)

判斷抽樣法

統計人員或調查研究人員根據自己的專長、知識、研究 的目的來選取代表性的樣本,此種抽樣方法稱為判斷抽 樣法,又稱為目的抽樣法。

方便抽樣法

方便抽樣法式調查研究人員以現有的或方便取得的方式 來抽取樣本的方法。

非機率抽樣法

參考文獻

Outline

相關文件

[r]

18   狐狸說:「假如你馴服我,我的生活將如充滿了陽光般。我

[r]

估計兩母 體平均數 差時樣本 數的選擇 估計兩母 體比例差

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006... 了解大樣本與小樣本母體常態、變異數已知與未知 下,單一母體平均數區間估計的方法。知悉

我低着頭做算術習題,心裏卻翻騰得厲害,耳朵裏只聽見永瑛洗衣

演講辭格式 稱謂 稱謂:對在場人士的6. 稱呼。要注意稱謂的

[r]