• 沒有找到結果。

第二章 文獻回顧與評述

第四節 重複取樣程序及其權重計算

以下分別說明本研究中採用的JRR、Bootstrap、ABB及RG重複取樣程序,並 以實際例子分別說明在Str. RS及PPS取樣設計下,取樣權重的計算。

壹、Jackknife Repeated Replication (JRR)

JRR是由Queneouille(1956)提出的一種重複取樣程序,目的用來減少複雜取 樣資料的參數估計偏誤(Lohr, 1999; Roy & Safiquzzaman, 2003)。JRR的資料蒐集 主要應用於多階段的取樣設計,取樣的過程是在相同資料中進行重複取樣,且每 一次的取樣中,掉落(dropping)一個PUS的樣本,直到每一個分層中的PSU都掉 落過一次(Lohr, 1999; Stapleton, 2008; Wolter, 2007)。因此JRR重複取樣的權重計 算方法為:當PSU j掉落時,則抽取的樣本取樣權重設定為0,而相同分層中保留 的其他PSU樣本取樣權重則必須乘以nh/(nh−1)的一個比例因子(scale factor),以 適當反應分層中的樣本,其中nh代表分層h中的PSU個數。取樣權重計算公式如 下所示(Lohr, 1999; Stapleton, 2008; Wolter, 2007):

⎪⎪

P23P24,第二階段再從已抽取的4個PSU中各隨機抽取3個樣本。則每個樣本依

延續上述例子,分層S1中的PSU樣本數分別為60、30、30、30。因此第一階 的樣本數。因此分層S1中四個PSU被抽中的機率分別為0.4、0.2、0.2及0.2,而第 二階段以簡單隨機取樣方式進行PSU內的樣本抽取。因第一階段的取樣已修改為

表2 PPS 設計之 JRR 重複取樣權重計算實例 後的參數估計標準誤可由公式(7)計算得到(Lohr, 1999; Stapleton, 2008; Wolter, 2007): 是一個有彈性且有效的方法(Chernick, 2007; Lahiri, 2003; Stapleton, 2008; Davison

& Hinkley, 1998; Efron & Tibshirani, 1993)。許多研究(Kaufman, 1998, 2006; Lahiri, 2003; Stapleton, 2008; Davison, Hinkley, & Young, 2003; Li, Lync, Shimizu, &

Kaufman, 2004; Rust & Rao, 1996)證實複雜取樣設計的大型資料庫應用中,

Bootstrap程序可直接應用在多階段取樣中的任一階段。例如:具有J個PSU分層 中,可重複抽取J1個PSU代表整個分層資料;或是在具有I 個樣本的PSU內,

抽取I −2個樣本代表PSU的資料。以Bootstrap進行取樣時,要抽取多少個PSU或 是樣本來代表整個分層的資料,才能得到最佳的參數估計,一直都是研究者所關 心的議題。根據Efron(1982)、Stapleton(2008)及Rust與Rao(1996)建議,以分層中 抽取J 1個PSU代表J 個PSU的分層資料或是抽取I−1個樣本取代I 個樣本的

表3呈現Str. RS設計下,6次Bootstrap取樣及權重計算結果。WBoot1一欄代表第 1次Bootstrap取樣的權重計算,分層S1S2分別隨機抽取P12P24代表分層的樣 本,因此重新計算的取樣權重為原始權重WR的2倍,其餘樣本權重則為0。同理,

表4為PPS設計下的Bootstrap重複取樣權重計算結果。從表3中可發現權重的總和

(240)並不等於母體總數,而表4以PPS設計的取樣權重總和(300)則會等於母

體總數。 數決定,而Bootstrap的取樣次數則由研究者自行決定。假設重複取樣R次,並經 由R次模式分析後,其參數估計的標準誤可由公式(9)計算得到(Stapleton, 2008;

Wolter, 2007):

1

參、Adjusted Balanced Bootstrap (ABB)

ABB取樣程序是從Balanced Bootstrap程序中進行修正。Balanced Bootstrap是 利用Bootstrap重複取樣時,修正其取樣程序讓每一PUS在重複B次取樣後,被抽 到的次數都能相同,使重複取樣方法對於每一個PSU都能達到公平的狀態,以增 加參數估計的準確性(Wu, 1991; Nigam & Rao, 1996)。Balanced Bootstrap取樣 方法僅針對取樣程序進行修正,因而具有與Bootstrap程序相同可直接應用在多階 層取樣中的任一階段取樣的優點(Wu, 1991; Booth et al., 1993; Saigo, Shao, &

Sitter, 2001),但相對在執行取樣程序時,需抽取多少個PSU或是樣本才能得到 最佳的參數估計仍舊沒有確定的標準。

Bootstrap重複取樣中,儘管已經使用簡單隨機取樣進行PSU或PSU內的樣本 抽取,但此方法僅代表取樣機率的相等而非實際取樣次數的相等(Booth et al., 1993; Davison & Hinkley, 1998; Efron & Tibahirani, 1993)。Balanced Bootstrap的 目的即修正相等機率取樣為次數相等的取樣。假設研究者欲從一組N 筆調查資料 的次數皆為B次,使得Balanced Bootstrap重複取樣對每一筆資料達到公平的狀態。

然而本研究中並未對分層中的所有PSU或是PSU內的所有樣本進行重複取

樣,而僅抽取其中一部份作為分析資料,因此必須將Balanced Bootstrap進行修正,

表5 Str. RS 設計之 ABB 重複取樣權重計算實例

肆、Random Group (RG)

RG重複取樣程序,主要是利用等分的概念,也就是從母群體中所抽取的樣 本,以不重複的方式將抽取的樣本等分為數個新的分群,並以此分群代表母體資 料。而RG取樣的參數估計方法為分群完成後,再依序進行各分群的估計,並以 各分群的估計結果計算估計參數變異數(Lohr, 1999; Wolter, 2007)。

複雜取樣設計的資料應用中,RG取樣程序是一個相當具有彈性的取樣方

表8 PPS 設計之 Random Group 取樣權重計算實例 耗費相當多取樣及估算時間(Lahiri, 2003; Wolter, 2007)。

RG取樣程序的分群個數可由研究者依取樣的PSU數或是樣本數所決定。假設 研究中的一次取樣分群程序的分群數為G,並重複M次的RG分群程序,因此必須 進行M×G次的模式估計,模式估計後的參數估計標準誤,可由公式(11)及公 式(12)計算(Lohr, 1999; Wolter, 2007)。

1

相關文件