重複取樣程序及其權重計算

第二章文獻回顧與評述

第四節重複取樣程序及其權重計算

以下分別說明本研究中採用的JRR、Bootstrap、ABB及RG重複取樣程序，並以實際例子分別說明在Str. RS及PPS取樣設計下，取樣權重的計算。

壹、Jackknife Repeated Replication (JRR)

JRR是由Queneouille(1956)提出的一種重複取樣程序，目的用來減少複雜取樣資料的參數估計偏誤（Lohr, 1999; Roy & Safiquzzaman, 2003）。JRR的資料蒐集主要應用於多階段的取樣設計，取樣的過程是在相同資料中進行重複取樣，且每一次的取樣中，掉落（dropping）一個PUS的樣本，直到每一個分層中的PSU都掉落過一次（Lohr, 1999; Stapleton, 2008; Wolter, 2007）。因此JRR重複取樣的權重計算方法為：當PSU j掉落時，則抽取的樣本取樣權重設定為0，而相同分層中保留的其他PSU樣本取樣權重則必須乘以n_h/(n_h−1)的一個比例因子（scale factor），以適當反應分層中的樣本，其中n_h代表分層h中的PSU個數。取樣權重計算公式如下所示（Lohr, 1999; Stapleton, 2008; Wolter, 2007）：

⎪⎪

P23及P₂₄，第二階段再從已抽取的4個PSU中各隨機抽取3個樣本。則每個樣本依

延續上述例子，分層S₁中的PSU樣本數分別為60、30、30、30。因此第一階的樣本數。因此分層S₁中四個PSU被抽中的機率分別為0.4、0.2、0.2及0.2，而第二階段以簡單隨機取樣方式進行PSU內的樣本抽取。因第一階段的取樣已修改為

表2 PPS 設計之 JRR 重複取樣權重計算實例後的參數估計標準誤可由公式（7）計算得到（Lohr, 1999; Stapleton, 2008; Wolter, 2007）：是一個有彈性且有效的方法（Chernick, 2007; Lahiri, 2003; Stapleton, 2008; Davison

& Hinkley, 1998; Efron & Tibshirani, 1993）。許多研究（Kaufman, 1998, 2006; Lahiri, 2003; Stapleton, 2008; Davison, Hinkley, & Young, 2003; Li, Lync, Shimizu, &

Kaufman, 2004; Rust & Rao, 1996）證實複雜取樣設計的大型資料庫應用中，

Bootstrap程序可直接應用在多階段取樣中的任一階段。例如：具有J個PSU分層中，可重複抽取J−1個PSU代表整個分層資料；或是在具有I 個樣本的PSU內，

抽取I −2個樣本代表PSU的資料。以Bootstrap進行取樣時，要抽取多少個PSU或是樣本來代表整個分層的資料，才能得到最佳的參數估計，一直都是研究者所關心的議題。根據Efron(1982)、Stapleton(2008)及Rust與Rao(1996)建議，以分層中抽取J −1個PSU代表J 個PSU的分層資料或是抽取I−1個樣本取代I 個樣本的

表3呈現Str. RS設計下，6次Bootstrap取樣及權重計算結果。WBoot₁一欄代表第 1次Bootstrap取樣的權重計算，分層S₁及S₂分別隨機抽取P₁₂及P₂₄代表分層的樣本，因此重新計算的取樣權重為原始權重W_R的2倍，其餘樣本權重則為0。同理，

表4為PPS設計下的Bootstrap重複取樣權重計算結果。從表3中可發現權重的總和

（240）並不等於母體總數，而表4以PPS設計的取樣權重總和（300）則會等於母

體總數。數決定，而Bootstrap的取樣次數則由研究者自行決定。假設重複取樣R次，並經由R次模式分析後，其參數估計的標準誤可由公式（9）計算得到（Stapleton, 2008;

Wolter, 2007）：

參、Adjusted Balanced Bootstrap (ABB)

ABB取樣程序是從Balanced Bootstrap程序中進行修正。Balanced Bootstrap是利用Bootstrap重複取樣時，修正其取樣程序讓每一PUS在重複B次取樣後，被抽到的次數都能相同，使重複取樣方法對於每一個PSU都能達到公平的狀態，以增加參數估計的準確性（Wu, 1991; Nigam & Rao, 1996）。Balanced Bootstrap取樣方法僅針對取樣程序進行修正，因而具有與Bootstrap程序相同可直接應用在多階層取樣中的任一階段取樣的優點（Wu, 1991; Booth et al., 1993; Saigo, Shao, &

Sitter, 2001），但相對在執行取樣程序時，需抽取多少個PSU或是樣本才能得到最佳的參數估計仍舊沒有確定的標準。

Bootstrap重複取樣中，儘管已經使用簡單隨機取樣進行PSU或PSU內的樣本抽取，但此方法僅代表取樣機率的相等而非實際取樣次數的相等（Booth et al., 1993; Davison & Hinkley, 1998; Efron & Tibahirani, 1993）。Balanced Bootstrap的目的即修正相等機率取樣為次數相等的取樣。假設研究者欲從一組N 筆調查資料的次數皆為B次，使得Balanced Bootstrap重複取樣對每一筆資料達到公平的狀態。

然而本研究中並未對分層中的所有PSU或是PSU內的所有樣本進行重複取

樣，而僅抽取其中一部份作為分析資料，因此必須將Balanced Bootstrap進行修正，

表5 Str. RS 設計之 ABB 重複取樣權重計算實例

肆、Random Group (RG)

RG重複取樣程序，主要是利用等分的概念，也就是從母群體中所抽取的樣本，以不重複的方式將抽取的樣本等分為數個新的分群，並以此分群代表母體資料。而RG取樣的參數估計方法為分群完成後，再依序進行各分群的估計，並以各分群的估計結果計算估計參數變異數（Lohr, 1999; Wolter, 2007）。

複雜取樣設計的資料應用中，RG取樣程序是一個相當具有彈性的取樣方

表8 PPS 設計之 Random Group 取樣權重計算實例耗費相當多取樣及估算時間（Lahiri, 2003; Wolter, 2007）。

RG取樣程序的分群個數可由研究者依取樣的PSU數或是樣本數所決定。假設研究中的一次取樣分群程序的分群數為G，並重複M次的RG分群程序，因此必須進行M×G次的模式估計，模式估計後的參數估計標準誤，可由公式（11）及公式（12）計算（Lohr, 1999; Wolter, 2007）。

在文檔中運用重複取樣方法探究複雜資料的取樣設計及權重於CFA參數估計之效應 (頁 20-31)

第二章 文獻回顧與評述

第四節 重複取樣程序及其權重計算

壹、Jackknife Repeated Replication (JRR)

參、Adjusted Balanced Bootstrap (ABB)

肆、Random Group (RG)

第二章文獻回顧與評述

第四節重複取樣程序及其權重計算