根據過去的研究或相關資料庫的數據計算出叢集的分層輔助變項與叢集平均值的相關,
藉以估算出抽樣設計效應以及所需樣本數的近似下限。
如果進行叢集抽樣之前能夠先將所有的叢集根據與主要調查變項相關的輔助變項對所有 的叢集進行分層,可以在與一階段叢集抽樣具相同精確性的要求下,令所需的樣本大幅減少。
若事前可以估計出叢集的分層輔助變項與叢集平均值的相關,藉由本研究所推導的式(21)加上 叢集內相關的近似值,研究者得以估計抽樣設計效應的下限。延續先前的例子,假若已知學
• 58 .減少標準誤之抽樣設計 任宗浩、譚克平、張立民
校分層輔助變項與學校平均值的相關為 0.67 '且班級內相關為 0.22 '班內樣本大小約為 28 '
則由式(21)可求得抽樣設計效應約為 4.2 。也就是說,欲達到抽樣誤差為 0.034 個標準差的精確 性要求,所需要的樣本數約為 3 ,600 '這大約是一階段叢集抽樣所需樣本數的五分之三。
(四)階段四
根據所擁有的人力、時間和經費等資源,判斷採二階段分層叢集抽樣是否可以滿足對於 誤差範圓的要求?若所需樣本數的下限能夠被接受,進一步估算叢集的最小分層數量以確保 叢集的分層作業能夠達到對抽樣誤差的要求。
由前兩個步驟的評估結果可以得知,在誤差小於 0.034 個標準差的要求下,利用與叢集平 均值相關為 0.67 之分層輔助變項,對於叢集進行分層後,再在各層內進行叢集抽樣,若叢集 樣本大小為詣,則最少需樣本數為 3 ,600 '此時各層內所有叢集之分層輔助變項必須相同;但 若叢集的分層輔助變項與叢集平均值零相關時,等同於進行一階段的叢集抽樣,則需要 6,000 樣本才能達到相同精確度的要求。
由於樣本數會直接影響調查所需要的人力、經費與時間,例如實測、閱卷、資料輸入等 步驟,經常是耗費資源的重要原因 O 因此研究者在擬訂計畫時,應考慮每個不同的步驟所需 要花費的經費與時間,決定可以負擔的樣本數 O 若這個數目大於前一階段所估算出利用輔助 變項對叢集進行分層後,再進行叢集抽樣的最少樣本數,就表示只要分層數夠多,應可達到 研究對於誤差範圍的要求 C 對於最少分層數的要求則需要考慮預計的總樣本數 (n) 、叢集內 樣本數( b') 、叢集內相關 (ρ) 、分層輔助變項與叢集平均值的相關 (r) , 以及可容許的最大 抽樣誤差等資訊(SEtwo-stage ) ,帶入式(3 0)算出在特定分層數下,叢集間變異量被分層解釋的比
例 (R\的)之最小值,再利用表 6 找出對應的分層數 (H) , 即可決定出最少分層數。
以我國參加 TIMSS 2011 八年級調查的抽樣架構為例:預估學校分層輔助變項與主要調查 變項學校平均值的相關 (r) 為 0.67 '主要調查變項之校內相關 (ρ) 為 0.22 '校內樣本大小(b')
為 28 。由前一步驟可以得知,在可容許抽樣誤差為0.034 個標準差(約相當於3.0 量尺分數) 的要求下,估算出所需最小樣本數為約為3,600 。根據我國參加TIMSS 2011 的預算與抽樣方 式,預估樣本數 (n) 約為 4,200 '大於所需最小樣本數,表示有機會達到對於抽樣誤差小於 0.034 個標準差的要求。接下來可由式(30)和表 6 推論出採均等分層的等比例配置法(PAES) 進行抽樣時,能滿足抽樣誤差要求的最小的分層數。首先,將上述數據帶入式(30) ,可求得當
R\H)等於 0.75 時,抽樣誤差剛好為0.034 個標準差;再比對表6 的數據,可知最小分層數為
3'才能令 R\H)的數值大於 0.75 0 由此這個結果可以推論,當調查參數與近似參數大約相同
時,至少需將學校依據其基測平均成績以及均等分層的方式分成主層,始能達到抽樣誤差小 於 3.0 量尺分數的要求。但由於實際抽樣時的參數值可能與預估值不間,且分層數愈多,抽樣 誤差愈小,所以建議條件許可的話,可以增加抽樣架構中叢集的分層數。這也是我國在 TIMSS 2011 的學校抽樣架構中,將八年級群學校分層數定為八層的主要原因。陸、研究限制
本研究期能藉由所推導的公式,幫助研究者在事前對於調查抽樣的精確性進行有效的評 估。一個調查研究誤差的主要來源,如本研究在一開始所描述,除了抽樣誤差所造成的影響,
另一個部分為測量誤差 O 本研究的討論範間僅限於抽樣誤差的估計,在 TIMSS 和 PISA 等大 型調查的研究中,對母群的平均值而言,抽樣誤差遠比測量誤差來得大;以 TIMSS 2007 為例,
大部分國家(地區)成就平均值的測量誤差對標準誤的校正為 0.1-0.2 個量尺分數,約為抽樣 誤差的數十分之一(lEA, 2009) 。此外,本研究所推導的公式乃立基於三個較為嚴格的假設上,
當這些假設違犯程度不同時,會對所推導公式的偏誤有多大的影響,也將是研究者下一步的 研究方向。
誌謝
本研究承要行政院國家科學委員會科學教育發展處專案計畫經費補助(計畫編號:
NSC97-2511-S-003-045-M Y5 、 NSC97-2522晶晶的 -001 )以及國立臺灣師範大學基本學力測驗 中心協助提供相關數據:此外,審查者所提供的專業建議也提升本研究的可讀性,特此感謝。
• 60 ·減少標準誤之抽樣設計