• 沒有找到結果。

1-3 抽樣與統計推論 主題一 簡單隨機抽樣 1.

N/A
N/A
Protected

Academic year: 2022

Share "1-3 抽樣與統計推論 主題一 簡單隨機抽樣 1."

Copied!
23
0
0

加載中.... (立即查看全文)

全文

(1)

1-3 抽樣與統計推論 主題一 簡單隨機抽樣

1. 母體:在統計研究的調查對象中,所有個體所組成的集合。

2. 抽樣:

有些調查不適合普查,我們會考慮從母體中抽取一部分個體作為樣本來進行調查,稱為抽 樣或抽樣調查。

3. 簡單隨機抽樣:

從元素個數為 N 的母體中選取 n 個作為樣本,若在抽樣的過程中每種組合被選取的機 會相等,則稱這種抽樣方法叫做簡單隨機抽樣。

例題1 簡單隨機抽樣

有編號皆不同的壹佰元與壹仟元折價券各 50 張。今欲從全部 100 張中抽出 2 張,考慮下 列兩種抽樣方法:

(1) 直接從 100 張中任意抽取 2 張。

(2) 分別從壹佰元與壹仟元的折價券中各抽取 1 張。

試問(1)與(2)哪一種為簡單隨機抽樣?

解 (1) 由題意可知,任 2 張被抽中的機率都是 100

2

1

C 故為簡單隨機抽樣 (2) 若 A 與 B 皆為壹佰元折價券,而 C 為壹仟元折價券

由題意可知 A 與 C 這組被抽中的機率為 1

50 50 ,而 A 與 B 這組被抽中的機率為 0 故非簡單隨機抽樣

類題

1. 從 100 個燈泡中,以簡單隨機抽樣方式抽取 5 個為樣本,試問每個燈泡被抽中的機率為 何?

解 每個燈泡被抽中的機率均等

皆為

99 4 100 5

99 98 97 96

5 1 4 3 2 1

100 99 98 97 96 100 20 5 4 3 2 1

C C

  

  

  

   

   

2. 同濟高中三年級有 10 個社會組的班級(301 到 310),每班 45 人;10 個自然組的班 級(311 到 320),每班 55 人,三年級共 1000 人。在全校抽出 100 人進行問卷調查 的過程中,已知謙謙是 301 班 1 號,而芸芸是 311 班 55 號。下列各種抽樣的方式中,

哪些會使得兩人被抽中的機率相等?

(A) 以簡單隨機抽樣,從全校抽出 100 人 (B) 每班以簡單隨機抽樣抽出 5 人

(C) 每班抽出從 1 號開始的連續 5 位同學

(D) 全體社會組同學以簡單隨機抽樣抽出 45 位同學,而全體自然組同學以簡單隨機抽樣 抽出 55 位同學

(E) 全體社會組同學以簡單隨機抽樣抽出 50 位同學,而全體自然組同學亦以簡單隨機抽

(2)

樣抽出 50 位同學。

解 (A) ○:以簡單隨機抽樣,從全校抽出 100 人 每人被抽到的機率均為

999 99 1000 100

100 1 1

1000 10 10

C C

 

   

 

(B) × :每班以簡單隨機抽樣抽出 5 人

謙謙班上的人數共 45 人,所以謙謙被抽中的機率為 1 1 45 9 而芸芸班上的人數共 55 人,所以芸芸被抽中的機率為 5 1

55 11

(C) × :謙謙是 1 號,所以他被抽中的機率是 1;而芸芸是 55 號,所以她被抽中 的機率是 0

(D) ○:全體三年級社會組的學生共 450 人,抽出 45 位同學 所以謙謙被抽中的機率為 45 1

450 10

而全體三年級自然組的學生共 550 人,抽出 55 位同學 所以芸芸被抽中的機率為 55 1

550 10 (E) ×:謙謙被抽中的機率為 50 1

450  ;而芸芸被抽中的機率為9 50 1 550 11 故選(A)(D)

主題二 亂數表

實施簡單隨機抽樣的方法:

(1) 抽籤:

對母體所有個體編號,假設母體元素個數為 N,則從 1 編到 N,並將號碼寫在大小、形 狀相同的小球或卡片或籤條上,然後放在同一個容器內進行均勻攪拌,從中抽取 n 個,

就可得到數量為 n 的一個樣本。

(2) 亂數表:

先將母體所有個體編號,假設母體元素個數為 N,則從 1 編到 N。接著從亂數表中抽取 號碼,由抽出的號碼得一編號相同的個體,連續進行,重複出現與超出範圍的號碼應排除 在外,直至取得數量為 n 的一個樣本。(亂數表如書末附錄)

例題2 利用亂數表

某班 30 位同學依照座號列出第一次段考數學成績如下:

1. 2. 3. 4. 5. 6. 7. 8. 9. 10.

66 91 93 74 95 90 84 82 95 71

11. 12. 13. 14. 15. 16. 17. 18. 19. 20.

93 64 70 81 91 75 83 87 76 87

21. 22. 23. 24. 25. 26. 27. 28. 29. 30.

62 89 90 88 75 93 73 92 56 94

利用書末附錄亂數表的第 16,17 行,由第一列開始由上往下,找出 5 位同學的數學成績,

(3)

並求其平均值。

解 由附錄中的亂數表中第 1 列第 16,17 行為起點,抽樣順序由上往下進行,所得數字如 下:

47 01 11 07 80 38 20 84 25 81……

超出範圍的號碼排除在外,故抽取 01,11,07,20,25 五位同學的成績 其樣本平均數為66 93 84 87 75

5 81

     (分)

類題

試計算例題 2 中全班的平均,並比較此題母體平均數與樣本平均數的大小關係。

解 由例題 2 知取出的樣本平均數為 81(分)

將每位同學的成績減去 81 分,所得資料如下:

1. 2. 3. 4. 5. 6. 7. 8. 9. 10.

-15 10 12 -7 14 9 3 1 14 -10 11. 12. 13. 14. 15. 16. 17. 18. 19. 20.

12 -17 -11 0 10 -6 2 6 -5 6 21. 22. 23. 24. 25. 26. 27. 28. 29. 30.

-19 8 9 7 -6 12 -8 11 -25 13 若以 xi,i=1∼ 30 代表每位同學減去 81 分後的成績,則 30

1 i 30

i

x

 ∴母體平均數為

30

1 30

81 81 82

30 30

i

x

  

(分)

故母體平均數大於樣本平均數 主題三 常態分布與二項分布

1. 常態分布:當隨機試驗次數夠多時,相對次數直方圖的上緣都會近似一條中間高、兩邊低,

類似鐘形的曲線,如右圖。

例:下圖是 1000 個學生進行「投擲一枚質量均勻銅板 100 次,出現正面次數」試驗的 相對人數直方圖,我們可觀察得到它近似一個常態分布。

(4)

2. 常態分布的性質:

(1) 常態分布曲線圖形的最高點所對應的 x 坐標為資料的平均數 μ。

(2) 標準差 σ 愈小表示資料較集中,圖形略高陡;標準差 σ 愈大表示資料較分散,圖形 略低緩。如下圖所示。

(3) 任何平均數為 μ,標準差為 σ 的常態分布曲線中(68-95-99.7 經驗法則)

① 約有 68 %的資料介於區間 [μ-σ,μ+σ] 內,如圖(一)。

② 約有 95 %的資料介於區間 [μ-2σ,μ+2σ] 內,如圖(二)。

③ 約有 99.7 %的資料介於區間 [μ-3σ,μ+3σ] 內,如圖(三)。

圖(一) 圖(二) 圖(三)

3. 二項分布與常態分布的關係:

(1) 二項分布 B(n,p),若以隨機變數 X 表示成功的次數,則有:

① E(X)=np。

Var X( )  np(1p)。

(2) 二項分布 B(n,p),若以隨機變數 Y 表示成功的比率,則有:

(5)

① E(Y)=p。

② ( ) p(1 p) Var Y

n

  。

以 p=0.5 為例,如下三個圖所示,當 n 夠大時,Y 接近母體平均數(真正的比率)

的機率很大,即所謂的大數法則。

(3) 當我們把二項分布中隨機變數 Y 的取值經由數據標準化的轉換後,

即 (1 )

i i

i

Y Y p

Z p p

n

 

 

 得到圖形,如下三個圖所示。

從圖形中可看出:當 n 愈大時,隨機變數 Y 標準化後的分布會愈來愈趨近於標準常 態分布(即平均數是 0,標準差是 1 的常態分布),這就是中央極限定理。因此當 n 夠大時,我們可以利用常態分布的機率作為二項分布機率的近似值。

例題3 常態分布

某校高三學生 600 人,第一次段考數學成績呈常態分布,平均成績 70 分,標準差 10 分,

(1) 試估計大約有多少人不及格?

(2) 若小沛此次考 90 分,試問他的數學排名大約為何?

解 (1) 常態分布曲線為左右對稱的圖形,其平均分數 70 分位於圖形中心位置

不到 60 分的範圍為平均成績 70 分往下一個標準差的左側區域,如下圖所示 根據 68-95-99.7 經驗法則

所求人數約占全部人數 50 %-68%

2 =16 %

∴不及格的人數約有 600×16 %=96(人)

(2) 小沛考 90 分,比平均成績 70 分多兩個標準差,如下圖所示 根據 68-95-99.7 經驗法則

(6)

大於或等於兩個標準差的右側區域占全部人數5%

2 =2.5 % 約 600×2.5 %=15(人)

∴小沛的數學排名大約是 15 名

類題

1. 達利高中三年級有學生 1000 人,第一次段考數學成績呈常態分布,平均成績 60 分,標 準差 10 分,請估計數學成績介於 40 分到 70 分之間的人數大約有多少人?

解 常態分布曲線為左右對稱的圖形,其平均分數 60 分位於圖形中心位置 根據 68-95-99.7 經驗法則

介於 60 分與 70 分之間的人數占全部68%

2 =34 % 而介於 40 分到 60 分之間的人數占全部95%

2 =47.5 %

如右圖所示 ∴介於 40 分到 70 分之間的人數占全部 34 %+47.5 %=81.5 % 即人數大約有 1000×81.5 %=815(人)

2. 設隨機變數 X 的平均數為 85,標準差為 5 且呈常態分布,利用下列標準常態分布 Z 的 機率表示,

α 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 P(0 ≤Z ≤ α) 0.3413 0.3643 0.3849 0.4032 0.4192 0.4332 0.4452 0.4554 0.4641 0.4713 0.4772 求出 P(80 ≤ X ≤ 85)的值。

解 將隨機變數 X 進行數據標準化,令 Z= X

 ,其中 μ=85,σ=5

80 ≤ X ≤ 85 ⇒ -1 ≤ 85 5 X

≤ 0 ⇒ -1 ≤ Z ≤ 0 由表中我們可以看出 P(0 ≤ Z ≤ 1)=0.3413 ∵Z 的機率分布對稱於 Z=0

∴P(-1 ≤ Z ≤ 0)=0.3413 例題4 二項分布與常態分布

全校每位同學投擲一枚均勻硬幣 100 次,設隨機變數 X 代表每人所擲出正面的次數,試求:

(1) X 的期望值與標準差。

(2) 假設投擲 100 次可算夠多,試以 68-95-99.7 經驗法則估計出現正面次數在 45 次至 55 次之間的機率。

注意 當 n 夠大時,二項分布會趨近平均數為 np,標準差為 np(1 p)的常態分布。

(7)

解 投擲一枚均勻硬幣,出現正面的比率為1 2

(1) 投擲 100 次,此為獨立的重複試驗則 X 的期望值為 E(X)=np=100×1

2=50(次)

標準差為 ( ) (1 ) 100 1 1 5

Var Xnpp    2 2 (次)

(2) 因為 n=100 夠大,我們可以利用 μ=50,σ=5 的常態分布來估算此二項分布的結

出現正面次數在 45 次至 55 次之間的範圍位於平均數 50 次左、右各一個標準差(5 次)內的區間,如下圖所示

根據 68-95-99.7 經驗法則所求的機率為 68 %=0.68

類題

1. 某次考試有 48 題的單選題,每題都有 4 個選項,假設每個題目猜對的機率都是 1 4 。 宜君對於這 48 題單選題從頭到尾都亂猜,設隨機變數 X 代表宜君猜對的題數,試求:

(1) X 的期望值與標準差。

(2) 假設 48 題可算夠多,試以 68-95-99.7 經驗法則估計出現猜對題數在 6 題到 18 題之間的機率。

解 (1) 猜 48 題,每題猜對的機率都是 1

4 ,此為獨立的重複試驗 則 X 的期望值為 E(X)=np=48×1

4=12(題)

標準差為 ( ) (1 ) 48 1 3 3

Var Xnpp    4 4 (題)

(2) 因為 n=48 夠多,我們可以利用 =12,σ=3 的常態分布來估算此二項分布的 結果

猜對題數在 6 題至 18 題之間的範圍位於期望值 12 題左、右各兩個標準差(6 題)內的區間,如右圖所示

根據 68-95-99.7 經驗法則所求的機率為 95 %=0.95

2. 一枚不均勻的硬幣,其出現正面的機率為2

3。今投擲此硬幣 72 次,假設投擲 72 次可算 多,則出現正面的次數介於 44 次與 52 次之間的機率最接近下列哪個選項?

(A) 0.5 (B) 0.68 (C) 0.9 (D) 0.95 (E) 0.99 解 設隨機變數 X 代表出現正面的次數

(8)

E(X)=72×2 3=48

( ) (1 ) 72 2 1 4 Var Xnpp    3 3

n=72 夠大,我們可以利用 μ=48,σ=4 的常態分布來估算此二項分布的結果 根據 68-95-99.7 經驗法則

平均數 E(X)左、右各一個標準差的區間為 [44,52]約占全部的 68 %=0.68 故選(B)

主題四 信賴區間與信心水準的解讀

1. 樣本比率:研究母體某一特徵所占的比率時,隨機選取 n 個樣本,經檢驗後發現有 x 個 具有此一特徵,則 ˆ x

p ( ˆp 唸做 p hat),稱為樣本的比率。 n

2. 抽樣估計:利用樣本比率 ˆp 來估計母體比率 p,每次選取的樣本不同,就得到不同的 ˆp , 而且每執行一次就會得到一個 ˆp 。

3. 隨機變數 X 的機率分布近似於二項分布 B(n,p), ˆ x

p 之分布的期望值與標準差相n 當於 B(n,p) 的期望值與標準差分別除以 n,也就是

(1) 期望值為np

n =p;(2) 標準差為 Var X( ) np(1 p) p(1 p)

n n n

 

  。

4. 95 %信賴區間與信心水準:我們的研究對象是母體的某一特徵,假設 p 表示母體中具有 此一特徵所占的比率。今從母體中隨機選取 n 個為樣本(在樣本數 n 夠大時,樣本 比率 ˆp 的分布會近似於常態分布),若 ˆp 表示樣本中具有此一特徵所占的比率,則 (1) 區間 ˆ 2 pˆ(1 pˆ), ˆ 2 pˆ(1 pˆ)

p p

n n

     

 

 稱為 p 的一個「95 %的信賴區間」,

或「在 95 %信心水準下的信賴區間」。

(2) 2 pˆ(1 pˆ) n

 稱為此信賴區間的「抽樣誤差」。

5. 95 %信心水準的意義:100 個像 ˆ 2 pˆ(1 pˆ), ˆ 2 pˆ(1 pˆ)

p p

n n

     

 

 這樣的區間,大約會有 95

個包含真正母體比率 p。我們有 95 %的信心(非機率)認為:

母體真正的比率 p 會落在 ˆ 2 pˆ(1 pˆ), ˆ 2 pˆ(1 pˆ)

p p

n n

     

 

 這個區間。

例題5 信賴區間與信心水準

某民調公司做總統大選支持度民調,成功訪問了 600 位合格選民,其中有 360 位表示支持 甲候選人,試求:

(1) 此次調查甲候選人的支持度。

(2) 在 95 %的信心水準下,這次民調之信賴區間的抽樣誤差為多少個百分點?

(9)

(3) 在 95 %信心水準下的信賴區間。

(1) 此次調查甲候選人的支持度為 ˆp =360

600×100 %=60 %

(2) 在 95 %信心水準下,此信賴區間的抽樣誤差為2 ˆ(1 ˆ) 2 0.6(1 0.6) 4%

600

p p

n

 

 

(3) 在 95 %信心水準下的信賴區間為 [0.6-0.04,0.6+0.04]=[0.56,0.64]

類題

由生產線隨機抽樣 400 個產品,得到產品合格的個數為 360 個,試求:

(1) 此次抽檢產品的合格率。

(2) 在 95 %的信心水準下,這次抽檢合格率之信賴區間的抽樣誤差為多少個百分點?

(3) 在 95 %信心水準下的信賴區間。

(1) 此次抽檢產品的合格率為 ˆp =360

400×100 %=90 %

(2) 在 95 %信心水準下,此信賴區間的抽樣誤差為2 ˆ(1 ˆ) 2 0.9(1 0.9) 3%

400

p p

n

 

 

(3) 在 95 %信心水準下的信賴區間為 [0.9-0.03,0.9+0.03]=[0.87,0.93]

例題6 抽樣人數

民調公司對總統大選做支持度調查,並發表推論如下:「我們有 95 %的信心認為甲候選人的 支持度為 45 %,抽樣誤差為 3 個百分點」。試問:

(1) 此抽樣調查中成功地訪問多少位民眾?

(2) 此次調查 95 %信心水準下的信賴區間為何?

解 (1) 支持度 45 %,在 95 %信心水準下,此信賴區間的抽樣誤差為 3 個百分點

∴2 0.45 0.55 3%

n

  ,即 0.45 0.55 9 4 n 10000

   ⇒ n=1100 所以此抽樣調查成功地訪問 1100 位民眾

(2) 95 %信心水準下的信賴區間為 ˆ 2 pˆ(1 pˆ),ˆ 2 pˆ(1 pˆ)

p p

n n

     

 

 

即 [45 %-3 %,45 %+3 %],也就是 [0.42,0.48]

類題

1. 在公布的滿意度調查中,有 40 %回答肯定,且在 95 %信心水準下的抽樣誤差為 2 個百 分點,試問:

(1) 至少要抽樣多少人才能達到這個誤差範圍?

(2) 此次調查 95 %信心水準下的信賴區間為何?

解 (1) 滿意度 40 %,在 95 %信心水準下,此信賴區間的抽樣誤差為 2 個百分點 ∴2 0.4 0.6 2%

n

  ,即 0.4 0.6 4 4 n 10000

   ⇒ n=2400 應至少抽樣 2400 人 (2) 95 %信心水準下的信賴區間為 [40 %-2 %,40 %+2 %],也就是 [0.38,0.42]

2. 某校以問卷調查「全面管制手機」辦法的支持度,發現有 95 %的信心認為全校師生支持

「全面管制手機」的比例在 72 %到 88 %之間,則回收有效問卷為 張。

(10)

解 在 95 %的信心水準下,此信賴區間為 [0.72,0.88] ∴ ˆ 0.72 0.88 0.80 p 2  抽樣誤差為2 pˆ(1 pˆ)

n

 =0.08 2 0.8 0.2 n

 =0.08 0.4

n =0.04 可得 n=100,故回收的有效問卷為 100 張

例題7 利用亂數表模擬試驗

為講解信賴區間與信心水準,數學老師請全班 40 位同學使用附錄中的亂數表模擬投擲銅板 25 次,假設其出現正面的機率 p=0.5。模擬的過程如下:隨機指定給每位同學亂數表的某一 列,該列從左到右依序取 25 個數字;如果數字為 0,2,4,6,8 時,對應投擲銅板得到正 面;而數字為 1,3,5,7,9 時,對應投擲得到反面。某位同學拿到亂數表中第二列的前 25 個數字依序為 82816 32475 58748 01153 41876。試求:

(1) 樣本出現正面的比例。

(2) 95 %信心水準下的信賴區間,並檢查是否包含母體的 p(出現正面的比率)=0.5。

(已知 52 48 ≈50)

解 (1) 這 25 個數字中,偶數有 13 個,即正面出現 13 次 ∴ ˆ 13 0.52 p25 (2) ˆp ±2 pˆ(1 pˆ)

n

 =0.52±2 0.52 0.48 25

 ≈0.52±0.2

故在 95 %信心水準下的信賴區間為 [0.52-0.2,0.52+0.2]=[0.32,0.72]

而母體出現正面的比例為 0.5

模擬所得 95 %信心水準下的信賴區間為 [0.32,0.72] 包含 0.5 這個數值 類題

利用亂數表,模擬投擲一枚不均勻硬幣 25 次,假設其出現正面的機率 p=0.6。模擬過程如 下:隨機指定給每位同學亂數表的某一列,該列從左到右依序取 25 個數字;如果數字為 0∼ 5 視為正面,數字為 6∼ 9 則視為反面。某位同學拿到亂數表中第三列的前 25 個數字依 序為 64624 63027 19034 11561 56181。試求:

(1) 樣本出現正面的比例。

(2) 95 %信心水準下的信賴區間,並檢查是否包含母體的 p(出現正面的比率)=0.6。

(已知 68 32 ≈46.65)

解 (1) 0 ~ 5 出現 17 次,即正面出現 17 次,所以 ˆ 17 0.68 p25 (2) ˆp ±2 pˆ(1 pˆ)

n

 =0.68±2 0.68 0.32 25

 ≈0.68±0.1866

故在 95 %信心水準下的信賴區間為 [0.68-0.1866,0.68+0.1866]=[0.4934,0.8666]

而母體出現正面的比例為 0.6

模擬所得 95 %信心水準下的信賴區間為 [0.4934,0.8666] 包含 0.6 這個數值 例題8 信賴區間圖形的比較

(11)

甲、乙、丙三人投擲一枚不均勻的硬幣各若干次(每人投擲的次數可能不相同),在各自選 定的信心水準下,作擲出正面機率的信賴區間圖形如下(其中乙與丙的區間長度相同),試 問下列何者正確?

(A)丙擲出正面的比率最大 (B)甲的抽樣誤差最大

(C)若投擲次數相同,則甲的信心水準比乙高 (D)若信心水準相同,則甲的投擲次數比乙多 (E)若信心水準相同,則丙的投擲次數比乙多

注意 68 %信心水準下的信賴區間為 ˆ pˆ(1 pˆ),ˆ pˆ(1 pˆ)

p p

n n

     

 

 。

95 %信心水準下的信賴區間為 ˆ 2 pˆ(1 pˆ),ˆ 2 pˆ(1 pˆ)

p p

n n

     

 

 。

解 (A) ○:丙擲出正面的比率為 50 %;甲與乙擲出正面的比率同,皆不及 50 % (B) ×:甲所做出的信賴區間長度最小,所以抽樣誤差最小

(C) ×:在相同的 n 與 ˆp 下,信心水準愈高,則區間長度應愈大

(D) ○:甲與乙的 ˆp 相同,在相同的信心水準下, pˆ(1 pˆ) pˆ(1 pˆ)

n n

  

∴n >n (E) ○:乙與丙的信心水準相同,且區間長度相同

1 1 ˆ(1 ˆ) 2 1 2 p p

n n

  

 

   

,又 1 1

ˆ(1 ˆ) 1 2 2

pp    ,可得 n <n

故選(A)(D)(E) 類題

10 個人各丟一枚均勻硬幣 100 次,其正面比率在 68 %信心水準下的信賴區間如右圖所示。

若改以 95 %信心水準作信賴區間重新繪製信賴區間的圖形,則下列何者最可能是重新繪製後 的圖形?

(12)

(A) (B) (C) (D) (E)

解 68 %信心水準下的信賴區間為 ˆ pˆ(1 pˆ),ˆ pˆ(1 pˆ)

p p

n n

     

 

 

95 %信心水準下的信賴區間為 ˆ 2 pˆ(1 pˆ),ˆ 2 pˆ(1 pˆ)

p p

n n

     

 

 

∴95 %信心水準下的信賴區間長度約為 68 %信心水準下信賴區間長度的 2 倍 且約有 95 %的信賴區間會涵蓋真正的 p 值,故選(B)

重要性:★★★★☆

1-3 段考實力演練 一、基礎題

1. 某高中共有 50 個班級,每班各有 40 位學生,其中男生 25 人,女生 15 人。從全校 2000 人中以簡單隨機抽樣抽出 100 人,試問下列哪些選項是正確的?

(A) 每班至少有 1 人被抽中

(B) 抽出來的男生人數一定比女生人數多

(C) 已知大永是男生,雅娟是女生,則大永被抽中的機率大於雅娟被抽中的機率 (D) 若大永與大哲是兄弟,則他們同時被抽中的機率小於 0.01

(E) 改成每班隨機抽出 4 人,而大永與雅娟在同一班,大哲在另外一班,則大永、雅娟兩 人同時被抽中的機率跟大永、大哲兩人同時被抽中的機率一樣

解 (A) ×:在母體個數為 2000,選取 100 個樣本的簡單隨機抽樣中 任一個個體被選取的機率皆為 100 1

2000 20不代表每班至少有 1 人被抽中 (B) ×:每人被抽到的機率相同,抽出來男生的人數不一定比女生多

(C) ×:大永與雅娟被抽中的機率都是 1 20 (D) ○:大永與大哲同時被抽中的機率為

1998 98 2000 100

100 99 2000 1999 0.01 C

C   

(E) ×:每班隨機抽出 4 人,大永、雅娟兩人同時被抽中的機率為

38 2 40 4

4 3 40 39 C

C   而大永、大哲兩人同時被抽中的機率為

39 39

3 3

40 40

4 4

4 4 1 40 40 100 C C

CC    所以兩者並不相等

故選(D)

2. 某校高三學生有 1000 人,其中第二類組的學生有 200 人,為調查學生每天運動的時間,

(13)

若以簡單隨機抽樣方式,從高三學生中抽取一個 300 人的樣本,試問第二類組學生被選 入樣本人數的期望值有多少人?

解 簡單隨機抽樣中,取 1 人則第二類組學生每人抽中的機率都是

200 1 1000 1

200 1 1000 5 p C

C   假設隨機變數 X 代表第二類組學生被選入樣本的人數

則 1

( ) 300 60

E Xnp  5 (人)

3. 吳師傅嚴選其烘焙的荔香麵包,發現重量呈現平均值為 500 克,標準差為 10 克的常態 分布(以 68-95-99.7 經驗法則估算),假設王老闆批購 1000 個荔香麵包,試問:

(1) 重量超過 480 克的荔香麵包約有幾個?

(2) 若麵包每個成本 50 元,重量超過 480 克的每個賣 100 元,其餘的淘汰不賣,則 王老闆利潤的期望值為多少元?

解 (1) 常態分布曲線為左右對稱的圖形,其重量平均值 500 克位於圖形中心位置,480 克距平均值 500 克兩個標準差,如下圖所示

根據 68-95-99.7 經驗法則

重量超過 480 克的荔香麵包占全部 5%

100% 97.5%

 2  ,

故 1000 個荔香麵包中重量超過 480 克的約有 1000×97.5 %=975(個)

(2) 王老闆利潤的期望值

=(平均售出總金額)-(成本)=975×100-1000×50=97500-50000=47500(元)

4. 某民調公司對行政院長進行施政滿意度調查,報導如下:「滿意度為 40 %,本次調查共 成功訪問 1200 位臺灣地區 20 歲以上的民眾,在 95 %的信心水準下,信賴區間的抽樣 誤差為 3 個百分點。」。試問:

(1) 受訪者中對行政院長施政滿意者有幾人?

(2) 此次調查,在 95 %信心水準下的信賴區間。

解 (1) 樣本數是 1200 人 ˆ 40

p100,1200× 40

100=480(人)

(2) 2 pˆ(1 pˆ) n

 稱為「在 95 %信心水準下」信賴區間抽樣誤差∴2 pˆ(1 pˆ) n

 =0.03

而 ˆ 2 pˆ(1 pˆ), ˆ 2 pˆ(1 pˆ)

p p

n n

     

 

 為 95 %信心水準的信賴區間

故此區間為 [0.4-0.03,0.4+0.03]=[0.37,0.43]

5. 某民調公司對市長做施政滿意度的調查,從戶籍所在地的合格選民中成功訪問 1050 人,

其中有 735 人表示滿意市長的施政,試求:

(1) 此次調查市長的施政滿意度為何?

(2) 在 95 %信心水準下,這次民調之信賴區間的抽樣誤差是多少百分點?

(14)

(3) 此次調查在 95 %信心水準下的信賴區間。

解 (1) 施政滿意度為 735 7 1050 10 70%

(2) 抽樣誤差為 2 ˆ(1 ˆ) 2 0.7 0.3 2 0.03 1050 50

p p

n

 

  

(3) 95 %信心水準下的信賴區間為 [0.7-0.03,0.7+0.03]=[0.67,0.73]

6. 最近經濟不景氣,為提升樂透彩的買氣,銀行將宣布「加碼 2 億元」。為了解市場的反 應,特地委託民調公司做電話訪問,約有 65 %的受訪民眾表示會前往購買,在 95 %的 信心水準下,信賴區間的抽樣誤差為 5 個百分點,則接受電話訪問的樣本約有多少人?

解 假設此次接受電話訪問的樣本約有 n 人,則在 95 %的信心水準下,此信賴區間的 抽樣誤差為 2 pˆ(1 pˆ)

n

 ,而其中 65 13

ˆ 100 20 p 

13 7

5 1 20 20

2 n 100 20

   ⇒ 91 1

400n 1600⇒ n=91×4=364 故接受電話訪問的樣本約有 364 人

二、進階題

7. 想要了解臺灣地區的公民對某議題支持的程度所作的抽樣調查,依性別區分,所得結果如 下表:若在 95 %的信心水準之下,不區分性別,信賴區間寬度為  ,則下列何者正確?

女性公民 男性公民 抽樣調查人數 600 800 贊成此議題的比例 ˆp 0.6 0.81

(A) 0.01 ≤  <0.02 (B) 0.02 ≤  <0.03 (C) 0.03 ≤  <0.04 (D) 0.04 ≤  <0.06 (E) 0.06 ≤  <0.1 ˆ(1 ˆ)

4 p p n

  

 

 

提示:信賴區間寬度等於 

解 此次抽樣調查,女生贊成的人數 n1=600×0.6=360(人)

男生贊成的人數 n2=800×0.81=648(人)

則此次抽樣不區分性別贊成比例 360 648

ˆ 0.72

600 800

p

 

而不區分性別贊成比例 ˆp 的標準差為 ˆ(1 ˆ) 0.72 0.28 0.012 1400

p p

n

   

∴在 95 %的信心水準下,不區分性別,其信賴區間為 ˆ(1 ˆ) ˆ(1 ˆ)

ˆ 2 p p , ˆ 2 p p

p p

n n

     

 

 

故 =4 pˆ(1 pˆ) n

 =4×0.012=0.048 故選(D)

8. (1) 已知 0< ˆp <1,試求 pˆ(1pˆ)的最大值。

(15)

(2) 某報紙想要了解其市佔率 ˆp ,所以它委託民調公司進行一次抽樣調查,並且希望在 95 %信心水準下,信賴區間的抽樣誤差在 3 %內,請估計此民調公司至少需要成功 訪問的樣本數。

2

2 1 1

ˆ(1 ˆ) ˆ ˆ ˆ

2 4

p p p p p

          

   

   

提示:

解 (1)

2

2 2 1 1

ˆ(1 ˆ) ˆ ˆ ˆ ˆ ˆ

2 4 pp  p p  p   p p  

∴當 1 ˆ 2

p 時, pˆ(1pˆ)有最大值 1 1 4  2 (2) 在 95 %的信心水準下,抽樣誤差為2 pˆ(1 pˆ)

n

1 ˆ(1 ˆ) 4 1 2 p p 2

n n n

    故 1 3 10000

100 n 9

n   

取滿足此條件的最小整數為 1112即此民調公司至少需要成功訪問 1112 人 9. 利用亂數表,模擬投擲一顆不公正的骰子 25 次,假設其出現「6 點」的機率為 3

10,模 擬過程如下:隨機指定給每位同學亂數表的某一列,該列從左到右依序取 25 個數字;如 果數字為 0 或 1 或 2,則視為擲出點數為 6。某位同學拿到亂數表中第 15 列的前 25 個數字依序為 72324 54402 36565 35662 99654。試求:

(1) 樣本出現「6 點」的比例。

(2) 95 %信心水準下的信賴區間,並檢查是否包含母體的 p= 3 10。 ˆ(1 ˆ) ˆ(1 ˆ)

ˆ ˆ

95 % 2 p p , 2 p p

p p

n n

      

  

  

提示:在 信心水準下,信賴區間為 

解 (1) 0 或 1 出現 5 次,所以 ˆ 5 1 p25 5

(2)

1 4 ˆ(1 ˆ) 1 5 5

ˆ 2 2 0.2 0.16

5 25 p p

p n

 

    

故在 95 %信心水準下的信賴區間為 [0.2-0.16,0.2+0.16]=[0.04,0.36]

而母體出現6 點的比例為 3

10=0.3,

模擬所得 95 %信心水準下的信賴區間 [0.04,0.36] 包含 0.3 這個數值 三、歷屆試題

10. 若某校 1000 位學生的數學段考成績平均分數是 65.24 分,標準差是 5.24 分,而且已知 成績分布呈現常態分布。試問全校約有多少人數學成績低於 60 分?

(16)

(A)約 80 人 (B)約 160 人 (C)約 240 人 (D)約 320 人 (E)約 400 人

仿91.學測 11. 國一學生 30 萬人,智商測驗的結果是「平均數 100,標準差 15」的常態分布,若以智

商 130 以上做為甄選國一學生為資優生的門檻,則根據這次測驗的結果判斷下列選項中 的敘述,哪些是正確的?

(A) 約有 5 %的國一學生通過資優生甄選門檻 (B) 約有 15 萬名國一學生的智商在 100 以上

(C) 超過 20 萬名國一學生智商介於 85 至 115 之間 (D) 隨機抽出 1000 名國一學生,可期望有 25 名資優生

(E) 如果某偏遠學校有 14 名的國一學生,那麼該校不會有資優生 98.指考乙

(提示:常態分布曲線 68-95-99.7 經驗法則)

12. 某校要從高一的「忠、孝、仁、愛」四個班級中隨機選取一個班級進行數學抽測。考慮甲、

乙兩種抽樣方法:甲方法是從四個班級的導師中隨機選取一人,被選中導師的班級為抽測 班級;乙方法是從所有高一學生中隨機選取一名學生,被選中學生的班級為抽測班級。若 各班人數都不相同,其中「愛」班人數最多。則下列敘述有哪些是正確的?

(A) 甲方法中,每位高一學生被抽測的機率相等 (B) 乙方法中,每位高一學生被抽測的機率相等 (C) 甲方法中,四個班級被抽測的機率相等 (D) 乙方法中,四個班級被抽測的機率相等

(E) 「愛」班被抽測的機率,使用甲方法較使用乙方法高 93.指考乙

13. 某高中共有 20 個班級,每班各有 40 位學生,其中男生 25 人,女生 15 人,若從全校 800 人中以簡單隨機抽樣抽出 80 人,試問下列哪些選項是正確的?

(A) 每班至少會有一人被抽中

(B) 抽出來的男生人數一定比女生人數多

(C) 已知小文是男生,小美是女生,則小文被抽中的機率大於小美被抽中的機率

(D) 若學生甲和學生乙在同一班,學生丙在另外一班,則甲、乙兩人同時被抽中的機率跟 甲、丙兩人同時被抽中的機率一樣

(E) 學生 A 和學生 B 是兄弟,他們同時被抽中的機率小於 1

100 97.學測

14. 為講解信賴區間與信心水準,數學老師請全班 40 位同學使用老師提供的亂數表模擬投擲 均勻銅板 16 次,模擬的過程如下:隨機指定給每位同學亂數表的某一列,該列從左到右 有 16 個數字,如果數字為 0,1,2,3,4 時,對應投擲銅板得到正面;而數字為 5,6,

7,8,9 時,對應投擲得到反面。某同學拿到的一列數字依序為:0612 9683 4251 9438,

該同學計算銅板出現正面的機率在 95 %信心水準下的 信賴區間: ˆ 2 pˆ(1 pˆ),ˆ 2 pˆ(1 pˆ)

p p

n n

     

 

 。則該同學所得到的結果中,

ˆ(1 ˆ)

2 p p

n

 = 。(提示:求出正面出現的比例 ˆp ) 100.指考乙 15. 甲、乙兩校有一樣多的學生參加數學能力測驗,兩校學生測驗成績的分布都很接近常態分

(17)

布,其中甲校學生的平均分數為 60 分,標準差為 10 分;乙校學生的平均分數為 65 分,

標準差為 5 分。若用粗線表示甲校學生成績分布曲線;細線表示乙校學生成績分布曲線,

則下列哪一個分布圖較為正確?

(A) (B) (C) (D) (E)

101.學測 16. 某縣市教育局欲瞭解高中生參加課外活動社團的意願,開學日隨機調查高一、高二、高三

學生各 1067 名,詢問本學期是否要參加課外活動社團。已知該縣市的高一、高二、高三 學生人數幾乎一樣多,各年級學生調查結果如下圖:

試問下列選項中的敘述,哪些是正確的?

(A) 學生要參加課外活動社團之比例隨著年級增加而遞減 (B) 由上述資訊可以估算全體學生要參加課外活動社團的比例

(C) 在 95 %信心水準下,每一個年級學生要參加課外活動社團的比例之信賴區間,都可以 由題目中已知的數據算出

(D) 在 95 %信心水準下,三個年級的調查結果,以高一學生要參加課外活動社團的比例的 信賴區間最長

(E) 在 95 %信心水準下,三個年級的調查結果,以高三學生要參加課外活動社團的比例的

信賴區間最短 98.指考乙

ˆ 1 ˆ(1 ˆ) p 2 p p

   

 

提示:當 時, 有最大值 

17. 想要了解選民對某候選人真正的支持度(支持率)p,四家媒體所做的民意調查結果如下 表所示:

媒體 A 媒體 B 媒體 C 媒體 D ˆp 0.30 0.40 0.30 0.28

 ˆ 0.02 ˆB 0.01 0.01 其中 ˆp 表示抽樣支持度, ˆ pˆ(1 pˆ)

  n ,n 為抽樣人數。請選出正確的選項。

(A)在 95 %的信心水準下,媒體 A 抽樣所得的 p 的信賴區間為 [0.28,0.32]

(B)如果媒體 B 抽樣的人數與媒體 A 相同,則 ˆB大於 0.02 (C)媒體 C 抽樣人數約為媒體 A 抽樣人數的兩倍

(D)媒體 A 的抽樣支持度比媒體 B 的抽樣支持度更接近候選人真正的支持度 p

(18)

(E)在 95 %信心水準之下,至少有一家媒體抽樣所得 p 的信賴區間會包含真正的支持度 p 102.指考乙 ˆ(1 ˆ) ˆ(1 ˆ)

ˆ ˆ

95 % 2 p p , 2 p p

p p

n n

      

  

  

提示:在 信心水準下的信賴區間為 

簡 答 一、基礎題

1.(D) 2.60 人 3.(1) 975 個;(2) 47500 元 4.(1) 480 人;(2) [0.37,0.43]

5.(1) 70 %;(2) 0.03;(3) [0.67,0.73] 6.364 人 二、進階題

7.(D) 8.(1)1

2;(2) 1112 人 9.(1)1

5;(2) [0.04,0.36],是 三、歷屆試題

10.(B) 11.(B)(C)(D) 12.(A)(C) 13.(D)(E) 14.3 7

32 15.(A) 16.(A)(B)(C)(E) 17.(B)

能力提升特訓

範例1 信賴區間與信心水準的解讀(一)

連續投擲一枚材質均勻的硬幣 n 次,計算從第 1 次到第 n 次投擲後出現正面次數減去出現 反面次數的值,將之記為 f(n),下圖是將(n,f(n))的點連成折線圖,已知圖中折點坐 標有(70,28)與(100,12)兩點,下列哪些敘述是正確的?

(A)圖中的折線若與 x 軸交於(m,0),代表投擲 m 次後出現正反面次數各半 (B)若此試驗投擲 10000 次後,f(10000)的絕對值一定比 f(100)的絕對值小 (C)圖中任一段折線的斜率必定是 1 或-1

(D)此試驗投擲 70 次後,在 95 %的信心水準下,做出出現正面比率的信賴區間會包含1 2 注意 ① 在 95 %信心水準下的信賴區間為 ˆ 2 pˆ(1 pˆ),ˆ 2 pˆ(1 pˆ)

p p

n n

     

 

 。

② (n,f(n))與(n+1,f(n+1))所形成的斜率為 ( 1) ( )

( 1) ( ) ( 1)

f n f n

f n f n

n n

    

  。

解 投擲一枚材質均勻的硬幣,不是出現正面,就是出現反面,機率都是1 2

(19)

(A) ○:折線與 x 軸交於(m,0),代表 f(m)=0

即第 m 次之後出現正面次數減去出現反面次數的值等於 0,所以出現正反面次 數各半

(B) ×:f(10000)的絕對值與 f(100)的絕對值並沒有一定的大小關係 (C) ○:(n,f(n))與(n+1,f(n+1))兩點所形成的斜率為 ( 1) ( )

( 1) ( ) ( 1)

f n f n

f n f n

n n

    

 

而 f(n+1)的值可能等於 f(n)+1 或 f(n)-1 ∴斜率必定是 1 或-1 (D) ×:假設投擲 70 次後,出現正面 a 次,出現反面 b 次

則 70 28 a b a b

  

  

 ,解得 a=49,b=21 ∴此次試驗出現正面比例為49

70=70 % 在 95 %信心水準下的信賴區間為 ˆ 2 pˆ(1 pˆ),ˆ 2 pˆ(1 pˆ)

p p

n n

     

 

 

抽樣誤差為2 ˆ(1 ˆ) 2 0.7 0.3 30 0.11

70 50

p p

n

 

  

∴信賴區間為 [0.7-0.11,0.7+0.11]=[0.59,0.81],不包含 0.5 故選(A)(C)

類題

甲投擲一枚硬幣 100 次,得到 36 個正面。乙投擲同一枚硬幣 50 次,計算出得到正面的比 例,並算出在 95 %信心水準下的信賴區間為 [0.224,0.496] 。則下列哪些選項正確?

(A)此硬幣必然不是均勻的硬幣

(B)甲、乙兩人所得到的正面比例相同 (C)甲的 95 %信賴區間為 [0.264,0.456]

(D)在 95 %信心水準之下,甲的信賴區間長度為乙的信賴區間長度的一半 (E)甲的 68 %信心水準的信賴區間長度小於甲的 95 %信心水準的信賴區間長度

ˆ(1 ˆ) ˆ(1 ˆ)

ˆ ˆ

68 % p p , p p

p p

n n

      

  

  

提示:在 信心水準下的信賴區間為 

解 (A) ×:信賴區間可用在統計上的推論,並非必然的關係 所以無法由題目得知此結論

(B) ○: ˆp= ˆp=0.36 0.224 0.496

ˆ 2

p

  

 

 

(C) ○:甲在 95 %信心水準下的抽樣誤差為 ˆ (1 ˆ ) 0.36 0.64

2 2 0.096

100 100

pp

 

故信賴區間為 [0.36-0.096,0.36+0.096]=[0.264,0.456]

(D) ×:甲、乙信賴區間的長度應分別為4 0.36 0.64 100

 與4 0.36 0.64 50

 ∴甲信賴區間長度應為乙信賴區間長度的 1

2

(20)

(E) ○:甲在 68 %信心水準下的信賴區間長度為 ˆ (1 ˆ ) 2 100

pp

是 95 %信心水準下信賴區間長度的1 2 故選(B)(C)(E)

範例2 信賴區間與信心水準的解讀(二)

某民調中心在甲、乙兩個城市調查民眾是否擔心「體內塑化劑含量過高」的比率(以下簡稱

「擔心率」)。結果如下:在 95 %信心水準之下,在甲、乙兩城市的「擔心率」之信賴區間 分別為 [0.36,0.44]、[0.58,0.62]。試判斷下列哪些選項是正確的?

(A)此次調查中,甲城市抽出的民眾有 40 %擔心「體內塑化劑含量過高」

(B)乙城市全體民眾有 60 %擔心「體內塑化劑含量過高」

(C)甲城市的受訪人數比乙城市的受訪人數少 (D)甲、乙兩個城市的受訪人數皆超過 1000 人

(E)民調中心在甲城市再次進行民調,並增加訪問人數達原人數的四倍,則在 95 %信心 水準之下,甲城市的「擔心率」之信賴區間寬度會減半

注意 在 95 %信心水準下的信賴區間為 ˆ 2 pˆ(1 pˆ),ˆ 2 pˆ(1 pˆ)

p p

n n

     

 

 。

解 若 n1 與 n2 分別為甲與乙兩城市抽樣的樣本數,而 ˆp 與1 ˆp 分別為甲與乙兩城市此次調 2 查的擔心率

(A) ○:甲城市「擔心率」的信賴區間為 [0.36,0.44] ∴ ˆp =0.4 1 (B) ×:乙城市「擔心率」的信賴區間為 [0.58,0.62] ∴ ˆp =0.6 2

此值表示此次接受調查民眾的擔心率,但並不一定是全體民眾的擔心率 (C) ○:2

1

0.4 0.6 n

 =0.04,2

2

0.6 0.4 n

 =0.02 ∴n2>n1

(D) ×:由(C),解得 n1=600,n2=2400

(E) ×:再次進行民調時, ˆp 通常會改變,故信賴區間的寬度減半是錯的 1 故選(A)(C)

類題

某民調中心在甲、乙兩個城市調查民眾是否贊成 12 年國教的比率(以下簡稱「贊成率」)。

結果如下:在 95 %信心水準之下,在甲、乙兩城市的「贊成率」之信賴區間分別為 [0.16,

0.24]、[0.78,0.82]。試判斷下列哪些選項是正確的?

(A)甲城市的受訪民眾中有 20 %的民眾贊成 12 年國教 (B)乙城市的全體民眾中有 80 %的民眾贊成 12 年國教 (C)甲城市的受訪人數比乙城市的受訪人數少

(D)甲、乙兩個城市的受訪人數皆超過 1200 人

(E)甲城市的全體民眾的「贊成率」有 95 %的機率落在區間 [0.16,0.24]

(21)

解 (A) ○:0.16 0.24 2

 =0.2=20 %

(B) ×:0.78 0.82 2

 =0.8=80 %,為樣本的贊成率,

並非乙城市全體民眾贊成 12 年國教的比率 (C) ○:2 0.2 0.8

n

=0.04,2 0.8 0.2 n

=0.02 ∴n>n

(D) ×:2 0.2 0.8 n

=0.04 ⇒ 4×0.2 0.8 n

=0.04×0.04 ⇒ n=400

(E) ×:信賴區間要不就涵蓋真正的贊成率,要不然就沒有涵蓋,此機率不是 1 就是 0 故選(A)(C)

範例3 資料合併計算的標準差

想要了解臺灣的公民對某議題支持的程度所作的抽樣調查,依性別區分,所得結果如下表。

請問從此次抽樣結果可以得到下列哪些推論?

女性公民 男性公民

贊成此議題的比例 ˆp 0.52 0.59

ˆp 的標準差 pˆ(1 pˆ) n

 0.02 0.04

(A) 全臺灣男性公民贊成此議題的比例大於女性公民贊成此議題的比例

(B) 在 95 %的信心水準之下,全臺灣女性公民贊成此議題之比例的信賴區間為 [0.48,0.56] (計算到小數點後第二位,以下四捨五入)

(C)此次抽樣的女性公民數少於男性公民數

(D)如果不區分性別,此次抽樣贊成此議題的比例 ˆp 介於 0.52 與 0.59 之間 (E)如果不區分性別,此次抽樣 ˆp 的標準差 pˆ(1 pˆ)

n

 介於 0.02 與 0.04 之間 99.學測

注意 在 95 %信心水準下的信賴區間為 ˆ 2 pˆ(1 pˆ),ˆ 2 pˆ(1 pˆ)

p p

n n

     

 

 。

解 (A) ×:此為抽樣調查的結果,並不代表母體實際的比例 (B) ○:在 95 %的信心水準下

臺灣女性公民贊成此議題之比例的信賴區間為 [ ˆp -2σ, ˆp +2σ]=[0.48,0.56]

(C) ×:設 n1 為此次抽樣的女性公民數,故 1

1

0.52 0.48 0.52 0.48 0.02 n 0.0004 n

    

設 n2 為此次抽樣的男性公民數,故 2

2

0.59 0.41 0.59 0.41 0.04 n 0.0016 n

    

可判斷出 n1>n2

(22)

(D) ○: 1 2

1 2

0.52 0.59 ˆ =n n

p n n

  

∴ ˆp 在數線上為 0.52 與 0.59 的內分點,故 ˆp 介於 0.52 與 0.59 之間 (E) ×:

1

ˆ(1 ˆ) 0.52 0.48 0.52 0.48

2 p p 0.02

n n n

      ,其中 n=n1+n2

2

2 1 1

ˆ(1 ˆ) ˆ ˆ ˆ 0.52 ˆ 0.59 ˆ 0.52 2 4

p p p p p p p

            

   

   

 ,但 ,故 = 時有最大值

故選(B)(D) 類題

1. 某民調中心在甲、乙兩個城市調查民眾是否擔心被傳染新流感(H1N1)的比率(以下簡 稱「擔心率」)。結果如下:在 95 %信心水準之下,在甲、乙兩城市的「擔心率」之信 賴區間分別為 [0.36,0.44]、[0.58,0.62]。試判斷下列哪些選項是正確的?

(A) 乙城市的全體民眾比甲城市的全體民眾更擔心被傳染新流感

(B) 在 99.7 %信心水準之下,甲城市的「擔心率」之信賴區間為 [0.34,0.46]

(C) 如果不區分城市,此次抽樣「擔心率」的標準差介於 0.01 與 0.02 之間

(D) 民調中心在甲城市再次進行民調,並增加訪問人數達原人數的四倍,則在 95 %信心水 準之下,甲城市的「擔心率」之信賴區間寬度會減半

(E) 在 95 %信心水準之下在甲城市再次進行很多次民調,得到很多個信賴區間,這很多個 信賴區間中約有 95 %含全體民眾的「擔心率」

99.7 % ˆ 3 pˆ(1 pˆ),ˆ 3 pˆ(1 pˆ)

p p

n n

      

  

  

提示:在 信心水準下的信賴區間為 

解 (A) ×:此為統計上的推論,無法得知母體的資料 (B) ○:在 95 %信心水準下的抽樣誤差為2 pˆ(1 pˆ)

n

但在 99.7 %信心水準下的抽樣誤差為3 pˆ(1 pˆ) n

∴甲城市擔心率的信賴區間為 0.4 3 0.04,0.4 3 0.04

0.34,0.46

2 2

     

 

 

(C) ×: 0.4 0.6 2 n

=0.04 ⇒ 4×0.4 0.6 n

=0.04×0.04 ⇒ n=600(人)

0.6 0.4 2 n

=0.02 ⇒ n=2400(人)

若不區分城市,則 ˆ 600 0.4 2400 0.6 0.56 600 2400

p    

(23)

故不區分城市的標準差為 0.56 0.44 0.5 0.5 0.01

3000 3000

 

 

(D) ×:再次進行民調, ˆp

也會改變

(E) ○:95 %信心水準的意義即表示;每 100 個區間約有 95 個涵蓋真正的擔心率 故選(B)(E)

2. 某廠商委託民調機構在甲、乙兩地調查聽過某項產品的居民占當地居民之百分比(以下簡 稱為「知名度」)。結果如下:在 95 %信心水準之下,該產品在甲、乙兩地的知名度之 信賴區間分別為 [0.50,0.58]、[0.08,0.16]。試問下列哪些選項是正確的?

(A) 甲地本次的參訪者中,54 %的人聽過該產品

(B) 此次民調在乙地的參訪人數少於在甲地的參訪人數

(C) 經密集廣告宣傳後,在乙地再次進行民調,並增加參訪人數達原人數的四倍,則在 95 %信心水準之下該產品的知名度之信賴區間寬度會減半(即 0.04)

(D)如果甲、乙兩地抽樣資料合併計算,此次抽樣的知名度 ˆp 介於 0.12 與 0.54 之間 (E)如果甲、乙兩地抽樣資料合併計算,此次抽樣的知名度 ˆp 之標準差 pˆ(1 pˆ)

n

 大於 0.02 解 若 n1 與 n2 分別為甲、乙兩地抽樣的樣本數,而 ˆp 與1 ˆp 分別為甲、乙兩地此次調查2

的產品「知名度」

(A) ○:甲地「知名度」的信賴區間為 [0.50,0.58] ∴ ˆ1 0.50 0.58 0.54 54%

p  2   (B) ○:乙地「知名度」的信賴區間為 [0.08,0.16] ∴ ˆ2 0.08 0.16 0.12 12%

p  2  

1

2

0.54 0.49

2 0.04

0.12 0.88

2 0.04

n n

  



 

 



,而 0.54×0.46>0.12×0.88 ∴n1>n2

(C) ×:再次進行民調時, ˆp 通常會改變,故信賴區間的寬度減半是錯的 2 (D) ○: 1 2

1 2

0.54 0.12 ˆ =n n

p n n

  

∴ ˆp 在數線上為 0.12 與 0.54 的內分點,故 ˆp 介於 0.12 與 0.54 之間 (E) ×:

1 2 1

ˆ(1 ˆ) 0.54 0.46 p p 0.02

n n n

   

 故選(A)(B)(D)

參考文獻

相關文件

《數學摺 紙計畫 : 30 個課程活動探索》[1] 針對子母線性質提供初步探討, 在正方形的簡 單架構下, 得到 「子母線性質」 十分漂亮以及簡潔的結論,

33 (3) 對需考慮資訊安全的公司或單位,下列何者是屬於進出公司 必要進行安全管制的可攜式設備或可攜式儲存媒體?手

Network(O*NET)就在這樣的因素下進行發展並計畫取代 DOT 這樣的職業資訊系統 (occupational information system)。發展 O*NET

A light beam incident on a small circular aperture becomes diffracted and its light intensity pattern after passing through the aperture is a diffraction pattern with circular

[r]

〔備註 1:小學數學科修訂課題有關圓形圖的學習重點雖然只要求學生闡釋 涉及簡單計算的圓形圖,例如每個扇形的圓心角須為 30º 或

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006... 了解大樣本與小樣本母體常態、變異數已知與未知 下,單一母體平均數區間估計的方法。知悉

2-1 化學實驗操作程序的認識 探究能力-問題解決 計劃與執行 2-2 化學實驗數據的解釋 探究能力-問題解決 分析與發現 2-3 化學實驗結果的推論與分析