• 沒有找到結果。

抽樣方法

N/A
N/A
Protected

Academic year: 2021

Share "抽樣方法"

Copied!
4
0
0

加載中.... (立即查看全文)

全文

(1)公職王歷屆試題. (104 地方政府特考). 104 年特種考試地方政府公務人員考試試題 等 別:三等考試 類 科:統計 科 目:抽樣方法 一、假設 F  {u1 , u 2 , u 3 , u 4 } 是一個緊緊包含四個元素的小規模有限母體(finite population),而 我們採用簡單隨機抽樣(simple random sampling)從母體 F 之中抽出樣本大小(sample size) 為n 2 的樣本組合,那麼總共會有多少種不同的樣本組合?如果我們改用機率均等的隨機 置回抽樣(sampling with replacement),那麼總共會有多少種不同的樣本組合?如果母體 F 之中四個元素的研究變數(study variable)值分別為 y1 1、y2 3、y3 3、以及 y4 9, 那麼母體 F 的母體平均數(population mean)是多少?母體變異數(population variance) 是多少? 【擬答】: C 24  6 種樣本組合。 4 2  16 種樣本組合,但在此我們並不考慮抽出的順序,所以 此方式共有 10 種樣本組合。 . 公 職 王. Y1  Y2  ...  Y N 1  3  3  9  4 N 4 N.   2.  (Yi   ) 2 i 1. N. (1  4 ) 2  ( 3  4 ) 2  ( 3  4 ) 2  ( 9  4 ) 2  9 4. 二、假設第一題之中從母體 F 抽出簡單隨機樣本的樣本數據為 Y1 與 Y 2 (註:採用大寫英文字母 Y , 表 示 樣 本 數 據 皆 為 隨 機 變 數 ) 。 我 們 分 別 使 用 下 列 三 種 不 同 的 點 估 計 量 ( point estimator)來估計母體變異數  2 :. ˆ (21) . N 1 n 1 n 1 n 2 2 2 2 ˆ ˆ     ( Y ( Y (Yi  Y ) 2   Y Y ) ) , ,    ( 3) ( 2) i i N ( n  1) i 1 n i 1 n  1 i 1. 其中 Y 為樣本平均數(sample mean)、N 為母體大小(population size)。 (sampling distribution)與均方誤差(mean square error),並判別它們是否為不偏估計量(unbiased estimator)。 無需計算或證明。 【擬答】:. ˆ (21) . 1 n (Yi  Y ) 2  n i 1. 單位編號. ˆ (21). 機率. {1,2}. 1. 1/6. {1,3}. 1. 1/6. {1,4}. 16. 1/6. {2,3}. 0. 1/6. {2,4}. 9. 1/6. {3,4}. 9. 1/6. 所以抽樣分配如下 ˆ (21) 0 1. 共4頁. 第1頁. 9. 16. 全國最大公教職網站 http://www.public.com.tw.

(2) 公職王歷屆試題. (104 地方政府特考). 1 1 2 2 6 6 6 6 1 2 2 1 E (ˆ (21) )  0   1   9   16   6   2 ,為有偏估計量 6 6 6 6 2 2 2 MSE (1)  bias  Var ˆ (1)  (6  9)  34  43. f (ˆ (21) ).  . ˆ (22 ) . 1 n (Yi  Y ) 2  n  1 i 1. 單位編號. ˆ (22 ). {1,2}. 2. {1,3}. 2. {1,4}. 32. {2,3}. 0. {2,4}. 18. {3,4}. 18. 1 6. 1/6 1/6 1/6 1/6 1/6. 18. 2 6. 2 6. ˆ (23) . 32 1 6. 1 2 2 1  2   18   32   12   2 ,為有偏估計量 6 6 6 6 2 2 2  bias  Var ˆ ( 2 )  (12  9)  136  145. E (ˆ (22 ) )  0 . MSE ( 2 ). 公 職 王 1/6. 所以抽樣分配如下 ˆ (22 ) 0 2 f (ˆ (22 ) ). 機率.  . N 1 n  (Yi  Y ) 2 N ( n  1) i 1. 單位編號. ˆ (23). {1,2}. 1.5. {1,3}. 1.5. {1,4}. 24. {2,3}. 0. {2,4}. 13.5. {3,4}. 13.5. 所以抽樣分配如下 ˆ (23) 0 1.5. 機率 1/6 1/6 1/6 1/6 1/6 1/6. 13.5. 24. 1 6 1 2 2 1 E (ˆ (23) )  0   1.5   13 .5   24   9   2 ,為不偏估計量 6 6 6 6 2 2 2 MSE ( 3)  bias  Var ˆ ( 3)  (9  9)  76 .5  76 .5. f (ˆ (23) ). 1 6. 2 6. 2 6.  . E (ˆ (22 ) )   2 為不偏估計量 n 1 2 N 1 2  ; E (ˆ (23) )   n N 所以 ˆ (21) 與 ˆ (23) 皆為有偏估計量. 而 E (ˆ (21) ) . 三、假設某一間大學共有 8000 位學生,其中 2000 人為男生,6000 為女生。同時,8000 位學生之. 共4頁. 第2頁. 全國最大公教職網站 http://www.public.com.tw.

(3) 公職王歷屆試題. (104 地方政府特考). 中有 7000 人屬於日間部,1000 人屬於夜間部。 (stratified random sampling)之方法從 8000 位學生之中抽出 n 16 位學生,來估計 8000 學生的平均身高。那麼應當依照男女性別來分層,抑或依照 日間、夜間部別來分層較為恰當?如果依據比例配置(proportional allocation)來進行抽 樣,須要分別從各層抽出多少人?抽出樣本並取得樣本觀測值之後,應如何估計 8000 位學 生的平均身高?另外,如果我們想用採用分層隨機抽樣來調查 8000 位學生的月平均收入( 例如校外打工或兼差之收入),那麼應當依照男女性別來分層,抑或依照日間、夜間部別 來分層較為恰當? 8000 位學生之平均身高的問題,如果依據尼門配置(Neyman allocation)來進行抽樣,須要分別從各層抽出多少人?假設母體之中男生層之身高的變數 為女生層之身高變異數的 1.96 倍,日間部與夜間部學生身高的變異數比例數為 1.1。 8000 位學生之平均身高問題,如果我們改用事後分層(post-stratification)之 方法來抽樣與推估,那麼整個調查過程應該如何進行?從樣本配置的觀點來看,事後分層 可以被視為何種類型之配置?由於 n 16 層中小樣本,萬一發生空事後層(empty poststratum)之情形,應當如何處理或補救? 【擬答】: 8000 名學生的平均身高,應以性別來作分層,因為分層隨機抽樣適用於層內同質 性高,層外異質性高的母體型態,故性別之間的變異較高,故應採用男女性別作為分層。 採用比例配置 nh . Nh. n. L. N h 1. 公 職 王. h. 2000  16  4 ,男生抽取 4 人 8000 6000   16  12 ,女生抽取 12 人 8000. 故 n男  n女. 若欲估計 8000 名學生的平均收入,應採用日間、夜間部來作分層,因為日間部與夜間部的 收入變異較大,即同樣日間部的學生收入或同樣夜間部的學生收入應同質性較高。故應採 用日間、夜間部作為分層。 假設男生身高變異數為 s12  1.96 k ,男生身高變異數為 s 22  k N S 採用紐門配置 nh  L h h  n  N hSh h 1. 2. N. h. S h  2000  1.96 k  6000  k  8800 k. h 1. 故 n男  n女 . 2000  1.96 k 8800 k. 6000  k.  16  5.09 ,男生抽取 5 人.  16  10 .91 ,女生抽取 11 人 8800 k 在實務上的抽樣問題,有時並無完整的分層母體資訊,我們只能在樣本被選取之後,才可 能設定抽樣單位到正確的層,但此時我們若僅瞭解各分層的配置,在一組樣本選取後再進 行分層,即事後分層。以本例來說,當我們不知道此大學男女實際人數時,僅可就過去的 經驗大致推估母體的性別比例後,再作分層估計,即 L N N y pst   Ah y h  男 y 男  女 y 女 N N h 1 但當我們亦缺乏此資訊時,便僅能以合理的男性女性比例 1:1 來作估計。即 L. y pst   Ah y h  0.5  y 男  0.5  y 女 h 1. 共4頁. 第3頁. 全國最大公教職網站 http://www.public.com.tw.

(4) 公職王歷屆試題. (104 地方政府特考). 1  N n L 2 var( y pst )    Ah  s h  2 n  Nn  i 1. L.  1  A   s h. 2 h. i 1. 其中第一項是從一組比例配置的分層樣本的平均數中所獲得的變異數,所以事後分層可以 視為比例配置。 程中,卻很容易因為層數過多而樣本數 卻不甚大,就很可能造成某些層為零。處理這個問 題的方法,最常用的就是合併鄰層法,也就是將空事後層與鄰近層合併以減少總層數的方 法。合併鄰層後,兩層的權重放大,並以鄰層的樣本平均數作為合併兩層的平均數來作後 續的事後分層估計。. 公 職 王. 四、何雙重抽樣(double sampling)試就分層隨機抽樣以及比值估計兩種情況分別說明,並寫出 點估計量的數學式。 【擬答】: 雙重抽樣是指在抽樣時分兩次抽取樣本的一種抽樣方式。首先抽取一個初步樣本,並搜取一 些簡單專案以獲得有關總體的資訊;然後,在此基礎上再進行深入抽樣。 分層雙重抽樣是在分層隨機抽樣法中執行雙重抽樣的抽樣法。首先第一重是從抽樣母體中 ,採用簡單隨機抽樣抽出第一重抽樣單位 n ' ,其分布在不同的分層,各分層大小為 nh ' 。然 後再從第一重抽樣單位每一層 nh ' 中,以簡單隨機抽樣法分別抽出第二重抽樣單位 nh ,計 算第二重各層樣本平均數 y h 作分層估計。 y st   g h y h  . nh '   Y y h  估計 n'. 比值估計雙重抽樣是在比值估計法中執行雙重抽樣的抽樣法。首先第一重是從抽樣母體中 ,採用簡單隨機抽樣抽出 n ' 個配對資料作為第一重樣本,並以第一重樣本中的樣本平均數 x ' 估計輔助變數的母體平均數 X 然後再從每一層第一重抽樣單位中以簡單隨機抽樣法分別 抽出第二重抽樣單位做比率估計。 y r  rx ' . y x ' 估計   Y x. 五、集群抽樣(cluster sampling)以及二階段集群抽樣(two-stage cluster sampling)與比 值估計有何關聯性?試就估計母體平均數之情況予以分別說明並寫出點估計量的數學式。 【擬答】: 比值集群抽樣法即是集群抽樣法中執行比值估計的方法,而二階段比值集群抽樣法即是二階段 集群抽樣法中執行比值估計的方法。比值估計法最主要的想法是採用輔助變數來增加估計的準 確度,所以在這兩種方法下,皆是將各個集群的母體大小 M i 視為輔助變數,用以提升推估集群 母體參數準確度的估計方法。 y rc . Y1  Y2    Yn / n y  t 估計   Y M1  M 2  M n / n M. 二階段比值集群抽樣法平均數估計 N 1  M i yi 估計 y rc  yt    Y M n Mˆ. 共4頁. 第4頁. 全國最大公教職網站 http://www.public.com.tw.

(5)

參考文獻

相關文件

請仲介機構提出所有承辦之雇主或國外仲介機構及 本國人(求職人)之文件卷宗及相關契約書,評鑑 人員於現場以抽查方式抽出

二、查現行法務部所屬矯 正機關辦理收容人專 案檢定之主體包含監 獄、技能訓練所、看 守所、矯正學校、戒 治所等單位,為使實

(一)經提名單位(機關、學校及具法人資格之附屬單位、團體、公司行號及

兒院門口,A 一直是孤單的 一個人生活著,直到上小學 的時候認識 BC 這兩位好朋 友,ABC 之間的關係就像家 人一樣,之間一點秘密也沒

一移龕之時。請尊宿一人。舉靈座。 (有法語) 方移下法語。西間置龕。又請一人。鎖 龕。

(二)計算方式:雇主繼續僱用於前款計算期間內,預估成就勞動基準

  如來一代時教。始自道場。迄乎雙樹。其間頓漸權實之部。偏圓半滿之談。於法

巴斯德研究院(法語:Institut Pasteur)總部位於巴黎,是法國的一個私立的非營利研究 中心,致力於生物學、微生物學、疾病和疫苗的相關研究,其創建者巴斯德於