108年公務人員高等考試三級考試試題
類 科:統計 科 目:抽樣方法
考試時間: 2 小時 座號:
※注意: 可以使用電子計算器,須詳列解答過程。
不必抄題,作答時請將試題題號及答案依照順序寫在試卷上,於本試題上作答者,不予計分。
本科目除專門名詞或數理公式外,應使用本國文字作答。
代號:21670 頁次:3-1
註:本試題可能使用之標準常態值如下:
Z
0.05= 1 . 645
,Z
0.025= 1 . 96
一、臺灣地區有 525 家 IC 設計公司,其中有 5 家公司規模特大。為了估計 臺灣地區 IC 設計產業的總員工人數 Y,除了將 5 家特大 IC 設計公司調 查其員工人數得 , ,…, 以外,另以簡單隨機抽樣法(不歸還)從 剩餘的 520 家 IC 設計公司中抽出 20 家公司為樣本,調查其員工人數得 , ..., 。現欲採用下列兩種估計式以估計臺灣地區 IC 設計公司之 總員工人數 Y:
y
1y y
y y
2 5
6 25
∑
=
25= 11
25
ˆ 525
i
y
iY
, ∑ ∑=
=
+
=
256 5
1
2
20
ˆ 520
i i i
i
y
y Y
試證
Y
ˆ1及Y
ˆ2 是否皆為 Y 之不偏估計式。(6 分)請分別寫出 及 之均方誤差(Mean Square Error;MSE)的定義。
(4 分)
ˆ1
Y Y
ˆ2又已知 5 家特大 IC 設計公司員工總人數為 5,062,而其他 520 家 IC 設計公司員工總人數為 60,320;其他 520 家 IC 設計公司之員工人數 的平方和為 11,842,980。試利用上列資料求估計式 及 的均方誤差 之值,並請說明估計 Y 時,那一個估計式較好?(4 分)
ˆ1
Y Y
ˆ2二、自來水公司想調查臺中市某區住戶在 108 年 1~3 月的用水情況,該區共 有 N=20,000 戶,今以簡單隨機抽樣法調查了 n=800 戶,得到下列統計 資料:
y
=22.5噸,s = 36
噸,有 320 戶用水總量超過了規定的用量標準。請估計該區住戶在 108 年 1~3 月的總用水量 Y 及其該估計之 95%的信 賴區間。(6 分)
請估計該區在 108 年 1~3 月的總用水量超過了規定的用量標準的住戶 數 T。(6 分)
又自來水公司想在 6 月份再做一次該區住戶用水總量的抽樣調查,若 要求在 95%水準下估計的相對誤差不超過 10%,則應該抽多少樣本
(戶)才能達到上述之要求?(6 分)
代號:21670 頁次:3-2
三、若一母體共分為三層,其中各層母體大小分別為 =300, =600 與
=100。根據過去的調查結果知道這三層的母體標準差分別為
N
1N
2N
3σ
1=150,σ
2=75 與σ
3=100。若調查總預算(C)只有 20,000 元,又固定成本( )為 2,000 元,每一 層調查單位成本均相同為 50 元,即 元,我們想以分層隨機 抽樣法估計式
c
0 350
2
1
= c = c =
c
y
st估計母體平均數μ,試依紐曼配置(Neyman Allocation)法,求滿足要求之總樣本大小 n 及各層所需之樣本大小 (i = 1,2,3)分別
為若干?(10 分) i
n
若我們想以分層隨機抽樣法估計式
y
st估計母體平均數μ的 95%的誤差 界限不超過 B=20,試依紐曼配置法,求滿足要求之總樣本大小 n 及 各層所需之樣本大小 (i = 1,2,3)分別為若干?(10 分)n
i四、某市轄區有 N = 250 個里,共有 M = 16,800 戶。今電力公司營業處想估 計該市每戶裝置冷氣機之平均台數
μ
Y,以簡單集體抽樣法自該市隨機抽 出 10 個里進行調查,得如下調查資料:里
(集體)
戶數
(
M
i)該里住戶裝 置冷氣機之 總台數(yi)
里
(集體)
戶數
(
M
i)該里住戶裝 置冷氣機之 總台數(yi)
1 150 480 6 120 216
2 72 252 7 50 240
3 80 440 8 100 230
4 90 162 9 71 213
5 125 200 10 42 252
註 : 上 述 調 查 資 料 經 計 算 得∑ , , ,
, ,在簡單集體抽樣法下,電力公司營
業處利用
900 M
10 1 i
i
=
=
514 , 91 M
10 1 i
2 i
=
∑
=685 , 2 y
10 1
i i
=
∑
=777 , 819 y
10 1 i
2 i
=
∑=
551 , 251 y
M
10 1
i i i
=
∑
=∑
∑
=
= 10= 1 i
i 1
i
M y
10
i
yC1 ,
∑
=
10= 1 ii
C2
y
n 1 M
y N
,∑
=
10= 1 ii
C3
y
n
y 1
等 3 個估計式(其中
i i
i
M
y = y
)來估計該市每戶裝置冷氣機之平均台數μ
Y。則:試以
y
C1、y
C2、y
C3來估計該市每戶裝置冷氣機之平均台數μ
Y,則μ
Y估 計值分別為何?(9 分)若以估計式
y
C1估計μ
Y, 則該估計在 95%的信賴度下,其最大可能估 計誤差界限 B 為何?(9 分)請根據上述調查資料,試分別求
y
C1、y
C2、y
C3等 3 個估計式的估計變 異數Vˆ(yci
), i =1,2,3之值為何 ? 並請說明哪一個估計式在估計μ
Y時有 較好的估計效率?(6 分)代號:21670 頁次:3-3
五、某市政府之行政區按區域別分為南區與北區,該市人事長想了解該市職 工去年上半年(1~6 月份)與今年上半年(1~6 月份)因生病請假時數 之變動比率,分別自南、北兩區各以簡單隨機抽樣抽出 100 名職工進行 調查,得相關統計資料如下:
區域別
職工總數 (
N
i)(人)樣本數 (
n
i)(人)去年上半 年樣本平 均數(
X
i)今年上半 年樣本平 均數(
Y
i)去年上半 年樣本標 準差(
S
Xi)今年上半 年樣本標 準差(
S
Yi)去年與今年上 半年樣本相關 係數 (
ρ ˆ
XYi)1(南區) 1,000 100 18.0 18.9 10.0 10.36 0.9841 2(北區) 1,500 100 7.5 4.8 5.45 3.50 0.5576
其中:
設
X
i:去年上半年第i
位職工因生病請假的時數;Y
i:今年上半年第i
位職工因生病請假的時數;X
i:去年上半年因生病請假的樣本平均時數;Y
i:今年上半年因生病請假的樣本平均時數;S
Xi:去年上半年因生病請假時數的樣本標準差;S
Yi:今年上半年因生病請假時數的樣本標準差;XYi
ρ ˆ
:去年與今年上半年因生病請假的時數的樣本相關係數。又已知去年上半年(1~6 月份)南區職工因生病請假的總時數τX1
= 16 , 300
小時,北區職工因生病請假的總時數τX2= 13 , 800
小時。根據上述資料:試估計該市南區職工去年上半年(1~6 月份)至今年上半年(1~6 月 份)因生病請假的時數之變動比率 R 為何?又在 95%的信賴度下,其 最大可能估計誤差界限 B 為何?(6 分)
對於之估計問題,若要求在 95%的信賴度下,其最大可能估計誤差 界限 B 不超過 0.02,試問應抽出多少樣本才足夠?(6 分)
試以比率估計(ratio estimation)估計該市南區職工今年上半年(1~6 月份)因生病請假的平均時數μ 及該市北區職工今年上半年(1~6 月Y1 份)因生病請假的平均時數μ 。(6 分) Y2
若視上述調查資料為分兩層(南區及北區),利用分層隨機抽樣法調 查所得,請你 幫忙該市人 事 長 用 層 別 比 率 估 計 式 ( separate ratio estimator)估計該市 2,500 位職工今年上半年(1~6 月份)因生病請假 的平均時數μ 。又其在 95%的信賴度下,其最大可能估計誤差界限 BY 為何?(6 分)