等 別:初等考試 類 科:統計
科 目:統計學大意
考試時間: 1 小時 座號:
※注意:
本試題為單一選擇題,請選出一個正確或最適當的答案,複選作答者,該題不予計分。
本科目共40 題,每題2.5 分,須用2B 鉛筆在試卡上依題號清楚劃記,於本試題上作答者,不予計分。
可以使用電子計算器。
作答時請參閱附表一、附表二、附表三。
1 假如樣本空間是{1, 2, 3, 4},而且個別出現事件{1}、{2}、{3}、{4}的機率都是 1/4。我們進一步假設 三個事件分別是A={1, 2}、B={1, 3}、C {1, 4}。下列敘述何者錯誤? =
事件 A 與事件 B 是獨立的 事件 A 與事件 C 是獨立的
事件 B 與事件 C 是獨立的 事件 A、事件 B 與事件 C 是獨立的 2 若P(A)=0.4,P(AIB)=0.1,而(A UB)之補集的發生機率為 0.2,那麼P(B)=?
0.3 0.4 0.5 0.6
5 / 2 ) (A =
3 令A 、 B 和C是三個獨立事件,Ac、B 和c Cc代表補集。設P ,P(B)=1/4,P(C)=2/3, 那麼P(AIBcICc)=?
1/10 1/15 11/15 17/30
4 調查一家公司雇員的教育程度(大專畢業與否)與結婚狀況(已婚或未婚)結果:全部員工人數為 600 人,其中 400 人擁有大專學歷,100 人為未婚,未婚且有大專學歷者 60 人。若任選一人,其為 已婚且為大專學歷者之機率為何?
0.0667 0.567 0.667 0.833
5 根據柴比雪夫定理(Chebyshev’s Theorem),至多有多少比例的觀察值與其算術平均數的差距會超 過兩個標準差?
5% 11% 25% 32%
4 / 1 ) , ( f x y =
6 令隨機變數 X 和 Y 的聯合機率分配為 ,其中(x, y)∈{(0,0),(1,1),(1,-1),(2,0)}。試問 X 和 Y 的相關係數為何?
-1/2 0 1/3 1/2
7 設 X 與 Y 為兩個隨機變數,並以 E 與 V 各代表隨機變數之期望值與變異數,若已知E(X)= ,5
, , , ,則以下何者之敘述最正確描述 X 與 Y 的關係?
6 ) Y (
E = E(XY)=21 V(X)=9 V(Y)=10
X 與 Y 的關係為高度正相關 X 與 Y 的關係為高度負相關
X 與 Y 的關係為低度正相關 X 與 Y 的關係為低度負相關
8 從一群病人隨機挑選 8 個人,得知他們的總膽固醇指數分別是 197, 212, 211, 184, 260, 233, 245, 218,
則這 8 位病人總膽固醇指數的算術平均數等於:
220.000 220.125 220.100 220.120
9 若已知一分配為右傾(或正偏,positively skewed),則以下敘述何者為正確?其中 、 及 各 代表第一、二與第三個四分位數,則:
Q1 Q2 Q3
Q 至1 Q2之距離大於Q 至2 Q3之距離 Q 至1 Q2之距離小於Q 至2 Q3之距離
Q 至1 Q2之距離為Q 至2 Q3之距離的 2 倍 Q 至1 Q2之距離等於Q 至2 Q3之距離
10 若 26 位參加統計學測驗之考生的成績皆不相同,在進行複閱之後,發現最高分者分數有誤,還要再 加 2 分。試問以下統計量何者不受最高分者加分影響?
算術平均數 標準差 中位數 全距
11 關於來自常態分配的隨機變數 X,假設它的算術平均數等於 a、中位數等於 b、眾數等於 c。下列敘 述何者正確?
P(X > a) > P(X > b) > P(X > c) P(X≧a) > P(X≧b) > P(X≧c)
P(X≦a) < P(X≦b) < P(X≦c) P(X > a) = P(X≦b) = P(X > c) 12 假如我們想請國內教學醫院內 100 位住院病人填寫一份問卷。下列敘述何者錯誤?
簡單隨機抽樣(simple random sampling)可能會沒問到某一些教學醫院的住院病人
如果採用「一家教學醫院一層」的分層抽樣(stratified sampling),分層抽樣會問到每一家教學醫 院的住院病人
如果採用「一家教學醫院一群」的群集抽樣(cluster sampling),群集抽樣會問到每一家教學醫院 的住院病人
只問某一家教學醫院的方便樣本(convenience sample)不是一種簡單隨機樣本
13 若常態母體的平均數為 180,標準差為 24。今由此母體隨機抽取一個大小為 64 之樣本,試問樣本平 均數介於 183 和 186 之間的機率近似於:
0.1359 0.8185 0.3413 0.4772
14 丟擲一個公正無偏的六面骰子三次,在已知「一點」至少出現一次的條件下,「一點」正好僅出現 一次的機率為何?
29/36 65/72 75/91 157/182 15 X 為隨機變數,並以 E 與 V 各代表此隨機變數之期望值與變異數,下列敘述何者錯誤?
E(3X)=3E(X) V(2)= 0
E(X+1)=E(X)+1 V(2X+1)=2V(X)+1
16 自一有限母體抽取樣本,如果樣本數大於等於 2。下列關於樣本平均數的敘述何者錯誤?
如果樣本是一種「取後放回的簡單隨機抽樣樣本」,樣本平均數的期望值(expected value)等於 母體的平均數
如果樣本是一種「取後不放回的簡單隨機抽樣樣本」,樣本平均數的期望值等於母體的平均數
如果樣本是一種「取後放回的簡單隨機抽樣樣本」,樣本平均數的標準差小於但不會等於母體的 標準差
如果樣本是一種「取後不放回的簡單隨機抽樣樣本」,樣本平均數的標準差小於且有可能等於母 體的標準差
17 一組來自平均數為 5 之指數分配(exponential distribution)且樣本數等於 100 的隨機樣本。下列敘述 何者正確?
樣本平均數的期望值(expected value)等於 0.5
樣本平均數的期望值等於 0.05
樣本平均數的標準差等於 0.5
樣本平均數的標準差等於 2.5
2 1
2 ( )
1
1 X X
S n n
i i−
= −
∑
=∑
== n
i Xi
X n
1
18 若X1,L,Xn為來自常態分配N(μ,σ2)的隨機樣本,令 1 , ,
2 1
2 1 ( )
ˆ X X
n
n
i i−
=
∑
=σ 。則以下何者錯誤?
X 是μ的不偏估計量 X 是N(μ,σ2)中位數的不偏估計量
S2是σ2的不偏估計量 σˆ2是σ2的不偏估計量
19 在進行點估計時,隨著樣本數的增加,點估計值會越來越接近母體母數(parameter),這個性質稱 為:
一致性(consistency) 不偏性(unbiasedness)
有效性(efficiency) 充分性(sufficiency)
20 臺灣南投民宿業者欲研究住宿該地區旅客之平均消費金額:由過去經驗得知當地消費金額母體標準 差為$1,000(新臺幣),隨機抽取 50 個住宿旅客並計算其樣本平均數為$15,000(新臺幣),則投宿 該地區旅客平均消費金額的 90%信賴區間的寬度(width)約為:
$232.60 $364.30 $465.23 $728.60
25 2 1
2 ( )
24S X X
i i−
=
∑
=21 假設X L1, ,X25為一組來自常態分配N(147.8,(12.3)2)的隨機樣本,定義 。下列 選項中那一對常數 u 和 v 會使得P(u≤S2≤v)=0.9?
u=82.5192, v=221.7186 u=87.2968, v=229.5517
u=92.1066, v=237.3519 u=96.9460, v=245.1226
22 某洗車廠的洗車服務包括機器自動沖洗和人工擦乾兩階段。若此兩階段的服務時間皆為常態分配且 彼此互相獨立,其平均數分別為 15 及 10 分鐘,標準差分別為 3 及 4 分鐘,則洗一部車兩階段共費 時超過 30 分鐘的機率為何?
0.3413 0.1587 0.4706 0.0294
23 若要在 95%的信心水準下據調查所得之樣本比例來估計母體比例數,且希望估計的誤差不要超過 3%,
則樣本數至少要多少?請問下列選項中,那個最接近?
95 285 500 1110
24 研究者根據抽樣結果,計算得到母體平均數μ的 95%信賴區間為 。如果使用相同的抽樣結果 對
] 92 , 88 [
μ進行雙尾檢定(two-tailed test),試問下列那個假設會被接受(或不會被拒絕)?
93
0:μ=
H H0:μ=90 H0:μ=87
無法決定
25 一組樣本數 100 且抽自伯努利分配(Bernoulli distribution)b(1, p)的隨機樣本以估計母數 P。設 T 為 p 的最大概似估計量(maximum likelihood estimator),下列敘述何者錯誤?
T 等於樣本平均數 T 等於樣本比例
p(1−p)的最大概似估計量等於 1/4 p(1−p)的最大概似估計量等於T(1−T) 26 以下是一張遺失某些資訊的單因子變異數分析表:
變異來源 平方和 自由度 均方 處理 9.22 2
誤差 23.18 25
總和 27
下列敘述何者錯誤?
總共有 28 個觀察值
3 2 1
0:μ =μ =μ
題意的變異數分析表所要檢定的虛無假設為H
總平方和等於 32.40
檢定統計量F 等於 3.39
27 以下是隨機化區集設計(Randomized Block Design)所得變異數分析(ANOVA)表格,部分數據並 未顯示。
變異來源 平方和 自由度 均方 F
處理之間(Between Treatments) 3 1,198.8
集區之間(Between Blocks) 5,040 6 840
誤差(Error) 5,994 18
總和(Total) 27
試問處理之間(Between Treatments)的平方和(sum of squares)是多少?
3,596.4 11,034 3,678.2 14,630.4
28 二因子隨機實驗中:A 因子有四個水準,B 因子有五個水準,兩因子之各種組合中均各有三個觀察值,
則在此實驗中處理的個數(the number of treatments)為:
60 25 20 16
29 通常以下那一種假設檢定的情況不會用到F 分配?
2 1 0:μ =μ
H H0:μ1=μ2 =μ3 H0:σ1=σ2 H0:σ1=1.0
30 設 X 與 Y 的相關係數為Rxy,Z 與 Y 的相關係數為Rzy。若Z=3(9−x),則 與 的關係,下列 敘述何者正確?
Rxy Rzy
Rzy=3(9−Rxy) Rzy =3Rxy Rzy =Rxy Rzy =−Rxy 31 迴歸分析中所使用之最小平方法(least square method)估計原則是指:
使 SST(總平方和)最小 使 SSE(誤差平方和)最小
使 SSR(迴歸平方和)最小 使迴歸估計係數的標準誤(standard error)最小 32 如果簡單線性迴歸所得判定係數(coefficient of determination)是 0.81,那麼相關係數(coefficient of
correlation)為:
0.6561 0.9 或者-0.9
任何介於-1 和 1 之間的數 無法判斷
33 包括 3 個解釋變數的複迴歸模式中,抽取 25 個觀察值以檢定這三個迴歸係數是否皆為零。則迴歸自 由度、殘差自由度、總自由度,各別為何?
3;21;24 3;22;25 21;3;24 4;20;24
34 研究 17 筆關於產品銷售金額(Y,單位:1,000 元)和廣告費用(X,單位:100 元)之間的線性關係,
得到迴歸式如右: ,依據此迴歸分析的結果,若廣告費用為 3,000 元,那麼預估銷售金 額可為:
X Yˆ=12+1.8
66,000 元 5,412 元 66 元 17,400 元
35 為了研究兩隨機變數X 跟 Y 的是否獨立,收集了一組 1000 名大學生的數據,並且將它們整理成列聯 表。進一步假設隨機變數 X 有四個水準(大一、大二、大三、大四),而隨機變數 Y 有兩個水準
(是、否)。下列敘述何者錯誤?
題意中的列聯表是一種 4×2 或是 2×4 的兩維表格
列聯表的次數總和等於 1000
檢定用的分配是有 3 個自由度的卡方
虛無假設陳述兩變數不是獨立的
36 當檢定母體變異數: , ,樣本數為 15,在顯著水準 10%下,檢定統計量的 拒絕區(critical region)為:
100 : 2
0 σ =
H H1:σ2≠100
χ2<6.571或χ2>23.685 χ2<7.790 或χ2 >21.0
χ2<8.547或χ2>22.307 χ2 <7.261或χ2 >24.96
37 某高中規定學生必須選修第二外語。去年的修課紀錄顯示有 30%的學生選修日文,24%的學生選修韓 文,26%的學生選修法文,以及 20%的學生選修西班牙文。今年在抽樣調查 300 位學生的修課情況 後,所得資料如下:
第二外語 日文 韓文 法文 西班牙文
修課人數 83 68 85 64
我們想要了解:今年學生在四種外語的修課比例和去年比較,是否有顯著的差異?於是進行適合度 檢定(goodness of fit test)。如果今年學生修課比例維持和去年相同,那麼所抽樣的學生中預期會有 多少學生選修日文?
10 30 83 90
38 承上題,依照樣本修課人數以及預期修課人數,計算所得卡方檢定統計量為:
0.5444 1.6615 6.6615 300 39 時間數列資料在多年期間環繞著趨勢線上下波動的情形稱為:
長期趨勢(trend) 季節變動(seasonal variation)
循環變動(cyclical movement) 不規則變動(irregular variation)
40 以下時間數列資料為某房屋仲介公司前四個月的銷售量,若使用 4 期移動平均法(moving average method),則第五個月銷售量的預測值為何?
月 1 2 3 4
銷售量 18 20 25 17
25 17 20 10
DEGREES OF 2 2 2 2 2 2 2 2 2 2
χ .995 χ .990 χ .975 χ .950 χ .900 χ .100 χ .050 χ .025 χ .010 χ .005 FREEDOM