分層隨機作答模式於敏感性問題之一般化研究
A Generalized Study of Sensitive Problems by using
Stratified Randomized Response Model
王智立
Chih-Li Wang
蔡宛容
Wang-Jung Tsai
銘傳大學應用統計資訊學系Department of Applied Statistics and Information Science, Ming Chuan University
(Received June 6, 2007; Final Version March 27, 2008)
摘要:在許多問卷訪問過程中,若探討的主題牽涉到敏感性特質時,受訪者往往會基於保護個 人隱私或種種心理因素,而產生拒絕回答或不誠實回答的情形,所以,較具敏感性問題的統計 資 料 通 常 是 缺 乏 或 不 精 確 的 。 爲 解 決 此 一 情 形 , Warner (1965) 首 先 提 出 隨 機 作 答 模 式
(Randomized Response Model),期望藉由隨機作答模式的方式來獲得可靠的資料以推論敏感性
群體比例,除此之外,還可保護受訪者的隱私進而降低受訪者不誠實回答的機率。Greenberg et al. (1969) 提出無關聯問題模式 (Unrelated-Question Model),改善 Warner (1965) 模式中兩個問題皆 具敏感性的疑慮,而 Christofides (2003) 延伸 Warner (1965) 模式提出新的隨機作答模式,讓受 訪者不需要直接回答「是」與「否」,藉以降低不誠實回答的機率。本論文的重點在於如何應用 隨機實驗來協助隨機作答程序的進行,以期在實務運用上,可以降低訪問的敏感程度,減低受 訪者的排拒心及保障受訪者的隱私,以獲得更好的比例估計值或訪問品質。具體的成果有:(1). 將分層隨機抽樣設計應用到 Christofides (2003) 之隨機作答模式上,並與 Warner (1965)、 Greenberg et al. (1969) 的無關聯問題模式作一合併,進而提出兩種新的隨機作答模式,文中將可 找出敏感性比例的估計量與其變異數。(2)藉由資料模擬之方式比較在不同參數設計下,本文模 式與 Warner (1965)、Christofides (2003) 模式之估計量的效率比較。(3)文中亦說明在相同的參數 設計下,Warner (1965) 與 Christofides (2003) 模式皆為本文所提模式的特例 (special cases)。
本研究感謝國科會研究經費之補助(計畫編號:NSC 94-2416-H-130-004)。 本文之通訊作者為王智立,e-mail: [email protected]。
關鍵詞:敏感性問題、隨機作答模式、比例估計
Abstract: In the process of many questionnaires, if the topic of study is involves in sensitive
characteristics, the participant usually resists or reply untruthfully. It is because of hiding the actual characteristic and protecting the individual privacy or all sorts of psychological factor. Hence, static data or estimates concerning sensitive question are usually very insubstantial and inaccurate. In order to solve this problem, Warner (1965) first proposed “Randomized Response Model”, and he helps to obtain the reliable data to deduce proportion of the sensitive group by executing this model. Besides, it may raise the protection of participants and reduce the probability which the participant untruthful replied. Greenberg et al. (1969) proposes Unrelated-Question model, to improve the two questions which both have the sensitive anxiety in Warner (1965) model. Christofides (2003) proposed a new randomized response which extended Warner (1965) model. The participant doesn’t have to answer 「yes」 and 「no」 directly, and reduces the sensitive level of the participant. This article mainly focuses on how to employ random trials to assist the progress of randomized response procedure so that the rejection rate of interview can be reduced and the privacy of interviewees is well protected. Better ratio estimate and interview qualities are expected to obtain. Toward this purpose, the following works have been done: (1) We apply the stratified random sampling design to generalized Christofides (2003) randomized response model. Two new generalized models for the sensitive problems, which is an integration of Warner (1965), Greenberg et al. (1969) and Christofides (2003) model, is proposed. In this paper, we also can find the estimator and variance of sensitive proportion. (2) We want to compare the performance of estimation with Warner (1965) and Christofides (2003) model, by data simulating. (3) The proposed models include Warner (1965) and Christofides (2003) methods as special cases for a specific choice of the parameters.
Key words: Sensitive Problems, Randomized Response, Estimation of a Proportion
1. 緒論
在問卷訪問過程中,若探討的主題牽涉到敏感性特質時,受訪者往往會基於保護個人隱私 或種種心理因素,而產生拒絕回答或不誠實回答的情形,所以,這類問題的統計資料通常是缺 乏及不精確的。爲了解決此情形,Warner (1965) 首先提出隨機作答模式 (Randomized Response Model),期望藉由隨機作答模式以推論敏感性群體比例。此後許多學者也提出了其他的隨機作
答程序改良 Warner (1965) 模式,其最主要的目的皆在於能更準確的估計敏感性問題的效率;其 中 Greenberg et al. (1969) 提出無關聯問題模式 (Unrelated-Question Model),改善 Warner (1965) 模式中兩個問題皆具敏感性的疑慮,而 Christofides (2003) 延伸 Warner (1965) 模式提出新的隨
機作答模式,讓受訪者不需要直接回答「是」與「否」,藉以降低不誠實回答的機率。接著,2004
年 Kim and Warde 將 Warner (1965) 的隨機作答程序作改良並提出「分層隨機作答模式 (Stratified
Randomized Response Model)」,他們所提出的分層隨機作答程序是將母體分成若干層,在每一層
中採取簡單隨機抽樣法且抽出放回的方式抽出一組樣本進行隨機作答程序。
本文的重點在於如何應用隨機實驗來協助隨機作答程序的進行,以期在實務運用上,可以 降低訪問的敏感程度,減低受訪者的排拒心及保障受訪者的隱私,以獲得更好的比例估計值或 訪問品質。具體的成果有:(1)將分層隨機抽樣設計應用到 Christofides (2003) 之隨機作答模式 上,並與 Warner (1965)、Greenberg et al. (1969) 的無關聯問題模式作一合併,進而提出兩種新 的廣義隨機作答模式,文中將可找出敏感性比例的估計量與其變異數。(2)藉由資料模擬之方式 比較在不同參數設計下,本文模式與 Warner (1965)、Christofides (2003) 模式之估計量的效率比 較。(3)文中亦說明在相同的參數設計下,Warner (1965) 與 Christofides (2003) 模式皆為本文所 提模式的特例 (special cases)。
2. 文獻探討
近年來許多涉及敏感性特質的研究無法得到準確率較高的資料,許多學者為了讓受訪者誠 實作答,一直不斷的研究如何獲得準確率較高的資料。因此,依母體特性將母體分為兩個群體, 一為具有敏感性特質的群體A,另一為不具敏感性的群體 A ,利用簡單隨機抽樣且抽出不放回的方式 (simple random sampling with replacement; SRSWR) 得到一組樣本
n
,藉此估計出群體A
在母體中的比例
θ
。接著本文將介紹與本文模式相關之隨機作答模式的發展過程。 Warner (1965) 提出的隨機作答模式為「QW1:我是屬於敏感性群體A
中的一員」;「QW2 :我 不是屬於敏感性群體A
中的一員」。接下來將會提供每一位被抽中的受訪者一個隨機裝置 (random device),在此隨機裝置中Qw1與Qw2被抽中的機率分別為P與1−P,而受訪者針對所抽 中的問題只需回答「是」與「否」即可,值得注意的是受訪者不需透露給訪員知道他/她抽中的 問題究竟為何?因此受訪者的隱私將可以得到保護,Warner (1965) 希望藉由這樣的隨機作答模 式可以降低受訪者的防備心而獲得較高的誠實回答率。 藉由 Warner (1965) 所提出的模式可以估計敏感性群體的比例θ
,假設受訪者皆是誠實作答 的情形下,受訪者回答「是」的機率為 λW =θP+(1−θ)(1−P)=(1−P)+(2P−1)θ (1)而n '為回答「是」的人數, n 為樣本總數,故λ 的不偏估計量為W λˆW =n'n,所以θ 的不偏估 計量為
(
2 1)
1 2 1 ˆ − ′ + − − = P n n P P W θ , 1 2 P≠ (2) 而且可以得到θˆ 的變異數為 W(
)
(
)
(
)
2 1 2 1 1 ) ˆ ( − − + − = P n P P n Var θW θ θ , 1 2 P≠ (3) 在此研究中機率P是先行決定的,然而P的大小會影響變異數的大小,也會影響到受訪者 與訪員之間合作的程度。當選擇P=1或P=0時變異數會最小值,也就是說P選擇越靠近 0 或 1 時,θˆ 會得到較高的效率,然而這樣的設計相當於直接詢問法,故受訪者誠實回答率將不高。W 若P愈接近 0.5 時變異數愈大,且受訪者的隱私會得到較高的保護,但是當P=0.5時根本無法 提供任何訊息。Greenberg et al. (1969) 提出若受訪者不誠實回答則 Warner (1965) 所提出的θˆ 將不再是不W
偏估計量 (unbiased estimator),因此提出了一個新的程序,稱為「無關聯隨機作答程序」, Greenberg et al. (1969) 利用敏感性群體A,並且將隨機器中的第二個問題以不相關且不具有敏 感性的群體
Y
來替代 Warner (1965) 程序中的非敏感性群體 A ,因為基本上 Warner (1965) 模式 的QW1和QW2為兩個相關聯的敏感性問題,有可能會引起受訪者的不信任感。Greenberg et al. (1969) 的執行步驟和 Warner (1965) 相似,其問題如下:「QG1:我是屬於敏感性群體的一員」; 「QG2:我是屬於群體Y(和敏感性群體A無關)的一員」。舉例來說,研究者想知道墮胎的真 正比例為何,則受訪者有可能會抽中的問題一為“我曾經墮過胎”,另一問題為“我是五月份出生 的人”。受訪者針對所抽中的問題只需回答「是」與「否」即可,且受訪者不需透露訪員他/她抽 中的問題究竟為何?Greenberg et al. (1969) 模式在非敏感性群體Y的比例π
y已知的情況下,令 1 P為選擇問題一Q 作答的機率。則敏感性群體的母體比例θ 的估計量及其變異數分別為: G1(
)
1 1 1 ˆ P P n n y G π θ − − ′ = (4)( )
(
2)
1 1 ˆ nP VarθG =λ −λ (5) 其中λ為受訪者中回答「是」的比例,且λ
=P1θ
+ −(1 P1)π
y。 Christofides (2003) 假設欲估計具有敏感性特質的母體比例θ ,並藉由 SRSWR 從母體抽出一組樣本 n ,提供每一位被抽出的受訪者一個隨機裝置,而這個隨機裝置會產生相對機率為 L p p1,L, 的整數1,L,L,每一位受訪者在使用完此隨機裝置之後回答出一個數字:若他/她具有 此敏感性特質,則回答所抽出的數字到L+1的距離;反之,則回答抽出的數字到 0 的距離。若 第
i
個受訪者對於敏感性問題的答案為「是」,則令xi為L+1,反之,則令xi為 0,因此, θ = + = 1) (x L P i 且P(xi =0)=1−θ。y
i為第i
個受訪者使用隨機器產生的數字,且受訪者所回 答的數字為di,則di = xi−yi ,因此,第i
位受訪者回答數字為k
的機率為 P(di =k)=(
1−θ)
Pk +θPL+1−k, k=1,L,L (6) 令d 為d1,L,dn的樣本平均數,因此可以得到敏感性群體比例θ 的估計式為 θˆC(
d E y( ))
(
L 1 2 ( )E y)
1,L 1 2 ( )E y 0 − = − + − + − ≠ (7) 則θˆC的變異數為 2 )) ( 2 1 )( ( 1 ) 1 ( 1 ) ˆ ( = − + Var y L+ − E y − n n VarθC θ θ (8) 式(8)中等號右邊的第一項是由隨機抽樣 (random sampling) 所產生的變異,而第二項為隨機化程 序 (randomized procedure) 所產生的變異。Kim and Warde (2004) 利用 Warner (1965) 所提出的隨機作答模式為基本概念,提出分層隨 機作答模式 (Stratified Randomized Response Model),所謂的「層」是指將母體分成多個不重複 的群體,分層隨機作答模式是指在每一層當中皆使用相同的隨機器,並且皆採用 SRSWR 的方
法。Kim and Warde (2004) 模型的設計如下:「QS1:我是屬於敏感性群體的一員」;「QS2 :我不
是屬於敏感性群體的一員」。在第
i
層中問題QS1與問題 2 S Q 的機率分別為Pi與1−Pi,而受訪者 針對抽中的問題只需回答「是」或「否」即可,並且受訪者不須讓訪員知道自己抽中的問題為 何。 令N為母體總人數,Ni為第i層(
i= L1, ,m)
的母體人數。 n 為總樣本數且ni為第i
層中樣 本數,因此∑
= = m i i n n 1。假設受訪者皆誠實回答的情形下,Kim and Warde (2004) 模式之第
i
層受訪者中回答「是」的機率為
(
1)(
1)
, 1, 2, , , 0.5Si Pi i Pi i i m Pi
λ = θ + − −θ = L ≠ (9)
此處
θ
i為第i
層中敏感性群體的比例,在 Kim and Warde (2004) 模式中,參數λ
i之估計量λˆSi屬於二項分配
(
ni,λi)
,λ
i為第i
層受訪者中回答「是」的比例,且各層中取樣的方式為獨立,因
(
)
i m P P i i Si i , 1,2, , 1 2 1 ˆ ˆ = L − − − = λ θ (10) 令wi為第i層中的權重,故 N N wi = i ,Ni為第i
層中母體人數i=1,2,L,m,且 1 1 =∑
= m i i w ,因此 可得到敏感性比例θ 之估計量為(
)
⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ − − − = =∑
∑
= = 2 1 1 ˆ ˆ ˆ 1 1 i i Si m i i m i i i KM P P w wθ λ θ (11) 且θˆKM為θ 的不偏估計量。而θˆKM的變異數為( )
( )
(
)
(
)
(
)
⎥⎥⎦ ⎤ ⎢ ⎢ ⎣ ⎡ − − + − = = ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ =∑
∑
∑
= = = 1 2 2 1 2 1 2 1 1 1 ˆ ˆ ˆ i i i i i m i i i m i i i m i i i KM P P P n w Var w w Var Varθ θ θ θ θ (12) Christofides (2005) 假設母體可分割為K層,且wi為第i層的權重,ni為第i
層中抽出的樣 本數,並利用其 Christofides (2003) 之隨機作答模式,估計其第i
層的敏感性群體比例θ 及其變i 異數分別為式(7)之θˆC及式(8)之Var(θ
ˆC),因此可得敏感性比例θ 之估計量及其變異數分別為(
)
(
)
1 1 1 ˆ m ˆ m ( ) 1 2 ( ) , 1 2 ( ) 0 CH i C i i i w w d E y L E y L E y θ θ − = = ⎡ ⎤ =∑
=∑
⎣ − + − ⎦ + − ≠ (13)( )
( )
[
]
[
]
2 2 2 2 1 1 1 ( ) ˆ ˆ (1 ) 1 2 ( ) m m m i i CH i C i i i i i w Var y w Var w Var n L E y n θ θ θ θ = = = = = − + + −∑
∑
∑
(14) 王智立、蔡宛容 (民 96) 延伸 Christofides (2003) 所提出的隨機作答模式,並與 Warner (1965) 模式、Greenberg et al. (1969) 的無關聯問題模式作合併,進而提出一般化 Greenberg 無關聯隨機 作答模式,此模式之敏感性比例θ 的估計量與其變異數分別為[
( )]
ˆ , 1 2 ( ) 0 1 2 ( ) WT d E y L E y L E y θ π − = + − ≠ + − (15)(
)
{
}
2 1 1 ˆ ( WT) 1 ( ) [ 1 2 ( )] Var Var y L E y n n θ θ πθ π π − = − + + − (16)3. 研究方法
在 3.1 節中,將介紹本文第一個新的「分層廣義隨機作答模式」的執行方式與推導過程,進 而可推知敏感性群體比例的估計量及其變異數;而在 3.2 節中,將介紹第二個新的「分層一般隨機作答模式」的執行方式與推導過程,並推導出敏感性群體比例的估計量及其變異數。
3.1 分層廣義隨機作答模式
本節中吾人先提出第一個新的隨機作答模式,謂之為「分層廣義隨機作答模式」,其精神係 考慮 Christofides (2003) 所提出的模式,吾人希望藉由無關聯的問題可以降低受訪者的不安全感 而獲得較高的誠實作答率,因此基於 Christofides (2003) 所提出的隨機作答模式,Warner (1965) 模式及 Greenberg et al. (1969) 的無關聯問題模式,本文將上述三篇文章提出的隨機作答模式作 一延伸。首先,吾人將母體切割為 m 層,並假設第i
層的樣本人數為ni,提供第i
層(
i=1,2,L,m)
中 的 每 一 位 受 訪 者 一 個 隨 機 器 Ri , 此 隨 機 器 中 有1,2,L,Li 個 整 數 且 相 對 機 率 為 i iL i i p p p1, 2,L, ,接著在每一層中訪員將同時提出兩個問題, : 1 Q 我是屬於敏感性群體A的一員? : 2 Q 我是屬於群體Y(不具敏感性且和敏感性群體A
無關)的一員? 第一個問題Q1為具有敏感性特質A的問題,其對應之相對機率為θ
i,而第二個問題Q2為 與A
無關聯的問題,其對應的機率為π ,且假設無關聯特質之母體比例i π 為已知,受訪者在使i 用此隨機器之後會回答一個「數字」,若他/她對於這兩個問題的答案皆為「是」或皆為「否」, 則回答隨機器所抽出的數字到Li+1的距離;若他/她對於這兩個問題的答案其中有一個為「是」 一個為「否」,則回答隨機器所抽出的數字到 0 的距離。因此,受訪者並不會洩漏他/她究竟真正 的特質為何。 若第i
層中第j位(
j=1,2,L,ni)
受訪者對於兩個問題的答案皆為「是」或皆為「否」,則令 1 + = i ij L x ,反之,若其答案為一個「是」與一個「否」,則令xij = 0。因此,第i層中第 j位 受訪者xij值為Li +1的機率與x
ij值為 0 的機率分別為πiθi+(1−θi)(1−πi)與θi(1−πi)+πi(1−θi), 即P x( ij= + =Li 1) π θi i+ −(1 θi)(1−πi)與P x( ij= =0) θi(1−πi)+πi(1−θi)。再令yij為第i層中第 j位受訪者 使用隨機器抽出的數字,且受訪者所回答的數字為dij,則dij = xij−yij ,因此,第i層中第 j位 受訪者會回答數字為k
的機率為[
]
[
]
1 ( ) (1 ) (1 ) (1 )(1 ) i ij i i i i k i i i i L k P d = =k θ −π +π −θ P + π θ + −θ −π P + − , (17) 其中i
=
1, 2,
L
,
m
, j=1, 2,L,ni,k=1,L,Li且P
k、P
Li+ −1 k分別為隨機裝置中數字為「k」及 「Li+ − 」之機率。 1 k 接著藉由以下的引理 3.1.1 和 3.1.2,可推導出第i
層敏感性群體比例θ 的估計量及其變異數。 i 引理 3.1.1:可以得到dij的期望值為 E(dij)=[
θi(1−2πi)+πi]
E(yi)+[
θi(2πi−1)+(1−πi)][
Li +1−E(yi)]
(18)證明過程如下:
[
]
[
]
[
(1 2 )]
( )[
(2 1) (1 )][
( 1) ( )]
) 1 ( ) 1 2 ( ) 2 1 ( ) ( ) ( 1 1 1 1 i i i i i i i i i k L i i i L k k i i i L k L k ij ij y E L y E P k P k k d kP d E i i i i − + − + − + + − = − + − + + − = = = − + = = =∑
∑
∑
π π θ π π θ π π θ π π θ 此處,∑
= = i L k i k E y kP 1 ) ( 。 引理 3.1.2:dij的變異數為 Var(dij)=Var(yi)+[
θi(1−2πi)+πi][
θi(2πi−1)+(1−πi)]
(Li+1−2E(yi))2 (19) 證明過程如下:[
]
[
]
[
]
[
i i i]
i i[
i i i]
i i i i i i i i i ij ij ij C B y E y Var y Var d E d E d Var × − + − + × + − + − + − + + − = − = ) 1 ( ) 1 2 ( ) ( ) 2 (1 ) ( ) 1 ( ) 1 2 ( ) ( ) 2 (1 ) ( ) ( ) ( 2 2 π π θ π π θ π π θ π π θ 此處, Bi =[
θi(2πi-1)+(1+πi)][
2E(yi)−Li−1]
Ci =(Li+1−E(yi))(Li+1−2E(yi))[
θi(1−2πi)+πi]
經合併化簡後可以得到d
ij的變異數為[
][
]
2 )) ( 2 1 ( ) 1 ( ) 1 2 ( ) 2 1 ( ) ( ) (dij Var yi i i i i i i Li E yi Var = + θ − π +π θ π − + −π + − 經由上述引理之證明,且再令di為 i in i i d d d1, 2,L, 的第i
層樣本平均數後,可由(18)式可以得到θi 的估計量為[
]
) 1 2 ))( ( 2 1 ( )) ( 2 1 ( ) ( 1 ˆ − − + − + − − + − = i i i i i i i i i iI y E L y E L y E L d π π θ (20) 其中,Li+ −1 2 ( )E yi ≠0, 0.5πi≠ 。 定理 3.1.1:θˆ 為第iIi
層敏感性群體比例θ
i的不偏估計量。 證明:首先因為
{
[
]
[
]
}
) ( )) ( 2 1 ( ) 1 ( ) 1 2 ( ) ( ) 2 1 ( ) ( 1 ) ( 1 ij i i i i i i i i i n j ij i i d E y E L y E d E n d E i = − + − + − + + − = =∑
= π π θ π π θ 故可以得知 i i i i i i i i i i iI y E L y E L E θ π π θ π θ θ = − − + − − − + = ) 1 2 ))( ( 2 1 ( ) 1 2 )( ( 2 1) )(2 1 ( ) ˆ ( 因此可以得到敏感性群體比例θ
的不偏估計量θ
ˆ
I 如下:∑
∑
[
]
= = ⎭⎬ ⎫ ⎩ ⎨ ⎧ − − + − + − − + − = = m i m i i i i i i i i i i i iI i I y E L y E L y E L d w w 1 1 ( 1 2 ( ))(2 1) )) ( 2 1 ( ) ( 1 ˆ ˆ π π θ θ (21) 令 N 為母體總數,N 為第ii
層的母體人數,則 i , 1, 2, , i N w i m N ⎛ ⎞ =⎜ ⎟ = ⎝ ⎠ L ,且∑
= = m i i w 1 1 。 定理 3.1.2:θˆ 為敏感性群體比例θ 的不偏估計量。 I 證明:( )
θ θ ⎟⎟=( )
θ = θ =θ ⎠ ⎞ ⎜⎜ ⎝ ⎛ =∑
∑
∑
= = = m i i i m i iI i m i iI i I E w wE w E 1 1 1 ˆ ˆ ˆ 因此,可得定理 3.1.1 中第i
層敏感性群體比例θ
i的不偏估計量θˆ 的變異數如定理 3.1.3 所示。 iI 定理 3.1.3:估計量θˆ 的變異數為 iI[
]
2 ) 1 2 ))( ( 2 1 ( ) ( 1 ) ˆ ( = i i+ − i i− − i iI Var y L E y n Varθ π[
][
]
2 ) 1 2 ( ) 1 ( ) 1 2 ( ) 2 1 ( 1 − + − + − − − + i i i i i i i i n θ π π θ π π π (22) 證明:利用(20)式所得到之不偏估計量θˆiI,計算其變異數為[
]
[
]
2 ) 1 2 ))( ( 2 1 ( ) ( 1 ) 1 2 ))( ( 2 1 ( )) ( 2 1 ( ) ( 1 ) ˆ ( − − − + = ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − + − + − − + − = i i i i i i i i i i i i i i iI y E L y Var n y E L y E L y E L d Var Var π π π θ
[
][
]
2 ) 1 2 ( ) 1 ( ) 1 2 ( ) 2 1 ( 1 + i − i + i i i− + − i i − − i n θ π π θ π π π 定理 3.1.4:估計量θ
ˆ
I 的變異數為{
[
]
2 2 1 ˆ ( ) ( ) ( 1 2 ( ))(2 1) m i I i i i i i i w Var Var y L E y nθ
π
− = =∑
+ − − +[
(1−2 )+][
(2 −1)+(1− )]
(2 −1)−2}
i i i i i i i π π θ π π π θ (23) 證明:利用(21)式所得到之不偏估計量θ
ˆ
I及定理 3.1.3 之結果,計算θ
ˆ
I 變異數為( )
[
]
{
2 1 1 2 2 1 ˆ ˆ ˆ ( ) ( ) ( 1 2 ( ))(2 1) m m I i I i iI i i m i i i i i i iVar Var w w Var
w Var y L E y n
θ
θ
θ
π
= = − = ⎛ ⎞ = ⎜ ⎟= ⎝ ⎠ = + − −∑
∑
∑
[
][
]
2}
) 1 2 ( ) 1 ( ) 1 2 ( ) 2 1 ( − + − + − − − + θi πi πi θi πi πi πi 値得注意的是,當πi =0或 1,分層廣義隨機作答模式之估計量θˆI與 Christofides (2005)的 估計量 ˆ CH θ 相同且其變異數亦相同,因此,Christofides (2005) 的模式可視為本文分層廣義隨機 作答模式之特例。當πi =0或 1 時且m=1,分層廣義隨機作答模式之估計量θˆI 與 Christofides (2003) 的估計量θˆC相同且其變異數亦相同,因此,Christofides (2003) 的模式可視為本文分層廣 義隨機作答模式之特例。當πi = 且1 m=1時,分層廣義隨機作答模式之估計量θˆI 與王智立、蔡 宛容 (民 96) 的估計量 ˆθWT相同且其變異數亦相同,因此,王智立、蔡宛容 (民 96) 的模式可視 為本文分層廣義隨機作答模式之特例。另外,當Li =2、πi =1且m=1時,分層廣義隨機作答 模式之估計量θˆI與 Warner (1965) 的估計量θˆW相同且其變異數亦相同,因此,Warner (1965) 的 模式亦可視為本文分層廣義隨機作答模式之特例。3.2 分層一般隨機作答模式
本節吾人將提出另一個新的隨機作答模式,謂之為「分層一般隨機作答模式」,其執行的方 法與本文 3.1 節之分層廣義隨機作答模式大致相同,不同的地方在於若受訪者對於這兩個問題的 答案皆為「是」,則回答隨機器所抽出的數字到Li+1的距離;若他/她對於這兩個問題的答案中 有一個為「否」或皆為「否」,則回答隨機器所抽出的數字到 0 的距離。接著若第i
層中第j位(
j=1,2,L,ni)
受訪者對於兩個問題的答案皆為「是」,則令xij =Li +1,反之,若其答案中有一 個為「否」或皆為「否」,則令xij =0。因此,第i
層中第j位受訪者x 值為ij Li+1與 0 的機率分別為π 與iθi 1−πiθi,即P x( ij = + =Li 1)
π θ
i i與P x( ij= = −0) 1 π θi i。再令yij為第 i 層中第j位受訪 者使用隨機器抽出的數字,且令受訪者所回答的數字為d ,則ij dij = xij −yij ,因此,第i
層中 第j位受訪者會回答數字為 k 的機率為 ij(
i i)
k(
i i)
L k i P P k d P( = )= 1−πθ + πθ +1− ,k=1,L,Li (24) 其中Pk、 1 i L kP
+ − 分別為隨機器中數字為「k
」及「Li+ − 」之機率。 1 k 接著藉由以下的引理 3.2.1 和 3.2.2,可推導出第i
層敏感性群體比例θ 的估計量及其變異數。 i 引理 3.2.1:可以得到dij的期望值為(
)
[
1 2 ( )]
) ( ) (dij E yi i i Li E yi E = + πθ + − (25) 證明過程如下:∑
= = = Li k ij ij kP d k d E 1 ) ( ) (∑
(
)
∑
(
)
= +− = × + × − = i i i L i k L i i k L i i i kP kP 1 1 1 1 π θ π θ =E(yi)+(
πiθi)
[
Li+1−2E(yi)]
引理 3.2.2:d
ij的變異數為 Var(dij)=Var(yi)+πiθi(
1−πiθi)
[
Li+1−2E(yi)]
2 (26) 證明過程如下:[
]
2 2 ) ( ) ( ) (dij E dij E dij Var = −(
)
(
)
{
2}
{
(
)
[
]
}
2 2 ) ( 2 1 ) ( ) ( 1 2 1 ) ( =E yi +πiθi Li+ − Li+ E yi − E yi + πiθi Li+ − E yi =Var(yi)+πiθi(
1−πiθi)
[
Li+1−2E(yi)]
2 經由上述引理之證明,再令di為 1, 2, , i i i in d d L d 的第i
層樣本平均數後,可由(25)式可以得到θ 的 估計量為[
]
) ( 2 1 ) ( ˆ i i i i i iII y E L y E d − + − = π θ , Li +1−2E(yi)≠0,πi ≠0。 (27) 定理 3.2.1:θˆiII為第i層敏感性群體比例θ 的不偏估計量。 i 證明:首先因為
∑
= = ni j ij i i E d n d E 1 ) ( 1 ) ( =E(yi)+(
πiθi)
[
Li+1−2E(yi)]
=E(dij) 故可以得知[
]
[
]
) ( 2 1 ) ( ) ( ) ( 2 1 ) ( ) ˆ ( i i i i i i i i i i iII y E L y E d E y E L y E d E E − + − = ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − + − = π π θ = θi 因此可以得到敏感性群體比例θ
的不偏估計量如下:∑
∑
[
]
= = ⎭⎬ ⎫ ⎩ ⎨ ⎧ − + − = = m i m i i i i i i i i i II y E L y E d w w 1 1 1 2 ( ) ) ( ˆ ˆ π θ θ (28) 令 N 為母體總數,N 為第ii
層的母體人數,則 i , 1, 2, , i N w i m N ⎛ ⎞ =⎜ ⎟ = ⎝ ⎠ L ,且∑
= = m i i w 1 1。 定理 3.2.2:θˆ 為敏感性群體比例θ 的不偏估計量。 II 證明:( )
θ θ ⎟⎟=( )
θ = θ =θ ⎠ ⎞ ⎜⎜ ⎝ ⎛ =∑
∑
∑
= = = m i i i m i iII i m i iII i II E w wE w E 1 1 1 ˆ ˆ ˆ 接著,可得第i
層敏感性群體比例θ
i之不偏估計量θ
ˆ
iII的變異數如定理 3.2.3 所示。 定理 3.2.3:估計量θˆ 的變異數為 iII( )
(
)
{
[
]
}
⎭ ⎬ ⎫ ⎩ ⎨ ⎧ − + + − = −2 ) ( 2 1 ) ( 1 1 ˆ i i i i i i i i i iII Var y L E y n Var π π θ π θ θ (29) 證明:利用(27)式所得到之不偏估計量θˆ ,計算其變異數為 iII( )
[
]
⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ − + − = ) ( 2 1 ) ( ˆ i i i i i iII y E L y E d Var Var π θ( )
{
[
]
}
2 ) ( 2 1 1 + − − = ij i i i i y E L d Var n π(
)
{
[
]
}
⎭ ⎬ ⎫ ⎩ ⎨ ⎧ − + + − = −2 ) ( 2 1 ) ( 1 1 i i i i i i i i i y E L y Var n π π θ π θ 其中,Li+1−2E(yi)≠0且πi ≠0 定理 3.2.4:估計量θˆ 的變異數為 II∑
(
)
{
[
]
}
= − ⎭ ⎬ ⎫ ⎩ ⎨ ⎧ − + + − = m i i i i i i i i i i i II Var y L E y n w Var 1 2 2 ) ( 2 1 ) ( 1 ) ˆ ( π π θ π θ θ (30)證明:利用(28)式所得到之不偏估計量
θ
ˆ
iII及定理 3.2.3 之結果,計算θ
ˆ
II變異數為( )
iII m i i m i iII i II Var w w Var Var(θ
ˆ )θ
ˆθ
ˆ 1 2 1∑
∑
= = = ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ =(
)
{
[
]
}
⎭ ⎬ ⎫ ⎩ ⎨ ⎧ − + + − = − =∑
2 1 2 ) ( 2 1 ) ( 1 i i i i i i i i m i i i y E L y Var n w π π θ π θ 値得注意的是,當πi =1時,分層一般隨機作答模式之估計量θˆ 與 Christofides (2005) 的估計量IIˆ
CHθ
相同且其變異數亦相同,因此,Christofides (2005) 的模式亦可視為本文分層一般隨機作答 模式之特例。當πi =1且m=1時,分層一般隨機作答模式之估計量θˆ 與 Christofides (2003) 的II 估計量θˆ 相同且其變異數亦相同,因此,Christofides (2003) 的模式亦可視為本文分層一般隨機C 作答模式之特例。當m=1時,分層一般隨機作答模式之估計量θ
ˆII與王智立、蔡宛容(民 96) 的估計量θ
ˆWT相同且其變異數亦相同,因此,王智立、蔡宛容 (民 96) 的模式可視為本文分層一 般隨機作答模式之特例。另外,當Li =2、πi =1且m=1時,分層一般隨機作答模式之估計量θ
ˆ
II 與 Warner (1965) 的估計量θˆ 相同且其變異數亦相同,因此,Warner (1965) 的模式亦可視為本W 文分層一般隨機作答模式之特例。4. 數值模擬與效率比較
在 4.1 節中,將介紹本文分層廣義隨機作答模式與 Christofides (2003) 模式之效率比較。4.2 節為本文分層一般隨機作答模式與 Christofides (2003) 模式之效率比較。而 4.3 節將進行本文所 提出的兩個新的分層隨機作答模式之效率比較。4.1 分層廣義隨機作答模式與 Christofides (2003) 模式之效率比較
為比較上述兩種模式之相對效率,參數需建構在π
i =0或 1 時才可進行比較,因此,在不 失 一 般 性 情 況 下 , 吾 人 考 慮 在 兩 分 層 (m=2) 、πi (i=1,2) 值 皆 為 1 且 P 値 為 遞 增k(
Pk+1 =2Pk,k=1,L,L)
的條件下,吾人選擇θ 與1 θ 值介在 0.1 到 0.9 之間,而 L 值為 2 至 10 之2 間的情形。因此定義分層廣義隨機作答模式與 Christofides (2003) 模式之效率比較為( )
( )
I C Var Var RE θ θ ˆ ˆ 1= 表 1 為當 L 在 2 至 10 之間的兩分層廣義隨機作答模式與 Christofides (2003) 模式之效率比 較 (因其效率比較對稱於θ1=θ2 =0.5,故僅列出部分結果)。表 1 當
π
i=
1
時兩分層廣義隨機作答模式與 Christofides (2003) 模式之效率比較 1 θ θ 2 w1 w2 L 2 3 4 5 6 7 8 9 10 θ RE1 RE1 RE1 RE1 RE1 RE1 RE1 RE1 RE1 0.1 0.9 0.9 0.1 0.18 1.2531 1.3060 1.3733 1.4487 1.5256 1.5985 1.6635 1.7193 1.7657 0.7 0.3 0.34 1.8350 2.0094 2.2315 2.4803 2.7340 2.9742 3.1889 3.3729 3.5260 0.5 0.5 0.50 2.1531 2.3940 2.7006 3.0443 3.3946 3.7263 4.0228 4.2768 4.4883 0.3 0.7 0.66 1.8350 2.0094 2.2315 2.4803 2.7340 2.9742 3.1889 3.3729 3.5260 0.1 0.9 0.82 1.2531 1.3060 1.3733 1.4487 1.5256 1.5985 1.6635 1.7193 1.7657 0.2 0.8 0.9 0.1 0.26 1.2378 1.2643 1.2945 1.3245 1.3515 1.3742 1.3927 1.4072 1.4185 0.7 0.3 0.38 1.7845 1.8719 1.9716 2.0704 2.1594 2.2346 2.2953 2.3432 2.3804 0.5 0.5 0.50 2.0833 2.2040 2.3417 2.4782 2.6011 2.7049 2.7888 2.8549 2.9063 0.3 0.7 0.62 1.7845 1.8719 1.9716 2.0704 2.1594 2.2346 2.2953 2.3432 2.3804 0.1 0.9 0.74 1.2378 1.2643 1.2945 1.3245 1.3515 1.3742 1.3927 1.4072 1.4185 0.3 0.7 0.9 0.1 0.34 1.2275 1.2383 1.2500 1.2607 1.2698 1.2770 1.2826 1.2869 1.2902 0.7 0.3 0.42 1.7504 1.7863 1.8246 1.8600 1.8899 1.9138 1.9324 1.9465 1.9572 0.5 0.5 0.50 2.0362 2.0858 2.1387 2.1876 2.2289 2.2620 2.2876 2.3070 2.3218 0.3 0.7 0.58 1.7504 1.7863 1.8246 1.8600 1.8899 1.9138 1.9324 1.9465 1.9572 0.1 0.9 0.66 1.2275 1.2383 1.2500 1.2607 1.2698 1.2770 1.2826 1.2869 1.2902 0.4 0.6 0.9 0.1 0.42 1.2215 1.2241 1.2267 1.2291 1.2311 1.2326 1.2338 1.2346 1.2353 0.7 0.3 0.46 1.7306 1.7392 1.7480 1.7559 1.7623 1.7673 1.7711 1.7740 1.7761 0.5 0.5 0.50 2.0089 2.0208 2.0330 2.0438 2.0527 2.0596 2.0649 2.0688 2.0718 0.3 0.7 0.54 1.7306 1.7392 1.7480 1.7559 1.7623 1.7673 1.7711 1.7740 1.7761 0.1 0.9 0.58 1.2215 1.2241 1.2267 1.2291 1.2311 1.2326 1.2338 1.2346 1.2353 0.5 0.5 0.9 0.1 0.50 1.2195 1.2195 1.2195 1.2195 1.2195 1.2195 1.2195 1.2195 1.2195 0.7 0.3 0.50 1.7241 1.7241 1.7241 1.7241 1.7241 1.7241 1.7241 1.7241 1.7241 0.5 0.5 0.50 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 0.3 0.7 0.50 1.7241 1.7241 1.7241 1.7241 1.7241 1.7241 1.7241 1.7241 1.7241 0.1 0.9 0.50 1.2195 1.2195 1.2195 1.2195 1.2195 1.2195 1.2195 1.2195 1.2195 表 1 為θ 値從 0.18 到 0.82,w 值從1 0.9 到 0.1 且w 值從2 0.1 到 0.9 的部份做效率比較。由表 中的RE 值可知,隨著1 L值的增加RE 值也跟著增加。此外,兩種模式比較之1RE
1值呈現對稱 的情形,其對稱係以w1 = w2 =0.5為中心。在效率比較的部分,RE 值皆大於1 1,表示本節所提 之分層廣義隨機作答模式確實比 Christofides (2003) 所提出的模式效率更佳。4.2 分層一般隨機作答模式與 Christofides (2003) 模式之效率比較
考慮在兩分層(m=2)、πi (i=1,2)值皆為 1 且P 値為遞增k(
Pk+1 =2Pk,k=1,L,L)
的條件 下,吾人選擇θ 與1 θ 值介在 0.1 到 0.9 之間,而2 L值為 2 至 10 之間的情形。因此定義分層一般 隨機作答模式與 Christofides (2003) 模式之效率比較為( )
( )
II C Var Var RE θ θ ˆ ˆ 2 = 表 2 為當L在 2 至 10 間的兩分層一般隨機作答模式與 Christofides (2003) 模式之效率比較 (其效率比較對稱於θ1 =θ2 =0.5,故僅列出部分結果)。 表 2 當π
i=
1
時,兩分層一般隨機作答模式與 Christofides (2003) 模式之效率比較 1 θ θ 2 w1 w2 L 2 3 4 5 6 7 8 9 10 θ RE2 RE2 RE2 RE2 RE2 RE2 RE2 RE2 RE2 0.1 0.9 0.9 0.1 0.18 1.2531 1.3060 1.3733 1.4487 1.5256 1.5985 1.6635 1.7193 1.7657 0.7 0.3 0.34 1.8350 2.0094 2.2315 2.4803 2.7340 2.9742 3.1889 3.3729 3.5260 0.5 0.5 0.50 2.1531 2.3940 2.7006 3.0443 3.3946 3.7263 4.0228 4.2768 4.4883 0.3 0.7 0.66 1.8350 2.0094 2.2315 2.4803 2.7340 2.9742 3.1889 3.3729 3.5260 0.1 0.9 0.82 1.2531 1.3060 1.3733 1.4487 1.5256 1.5985 1.6635 1.7193 1.7657 0.2 0.8 0.9 0.1 0.26 1.2378 1.2643 1.2945 1.3245 1.3515 1.3742 1.3927 1.4072 1.4185 0.7 0.3 0.38 1.7845 1.8719 1.9716 2.0704 2.1594 2.2346 2.2953 2.3432 2.3804 0.5 0.5 0.50 2.0833 2.2040 2.3417 2.4782 2.6011 2.7049 2.7888 2.8549 2.9063 0.3 0.7 0.62 1.7845 1.8719 1.9716 2.0704 2.1594 2.2346 2.2953 2.3432 2.3804 0.1 0.9 0.74 1.2378 1.2643 1.2945 1.3245 1.3515 1.3742 1.3927 1.4072 1.4185 0.3 0.7 0.9 0.1 0.34 1.2275 1.2383 1.2500 1.2607 1.2698 1.2770 1.2826 1.2869 1.2902 0.7 0.3 0.42 1.7504 1.7863 1.8246 1.8600 1.8899 1.9138 1.9324 1.9465 1.9572 0.5 0.5 0.50 2.0362 2.0858 2.1387 2.1876 2.2289 2.2620 2.2876 2.3070 2.3218 0.3 0.7 0.58 1.7504 1.7863 1.8246 1.8600 1.8899 1.9138 1.9324 1.9465 1.9572 0.1 0.9 0.66 1.2275 1.2383 1.2500 1.2607 1.2698 1.2770 1.2826 1.2869 1.2902 0.4 0.6 0.9 0.1 0.42 1.2215 1.2241 1.2267 1.2291 1.2311 1.2326 1.2338 1.2346 1.2353 0.7 0.3 0.46 1.7306 1.7392 1.7480 1.7559 1.7623 1.7673 1.7711 1.7740 1.7761 0.5 0.5 0.50 2.0089 2.0208 2.0330 2.0438 2.0527 2.0596 2.0649 2.0688 2.0718 0.3 0.7 0.54 1.7306 1.7392 1.7480 1.7559 1.7623 1.7673 1.7711 1.7740 1.7761 0.1 0.9 0.58 1.2215 1.2241 1.2267 1.2291 1.2311 1.2326 1.2338 1.2346 1.2353 0.5 0.5 0.9 0.1 0.50 1.2195 1.2195 1.2195 1.2195 1.2195 1.2195 1.2195 1.2195 1.2195 0.7 0.3 0.50 1.7241 1.7241 1.7241 1.7241 1.7241 1.7241 1.7241 1.7241 1.7241 0.5 0.5 0.50 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 0.3 0.7 0.50 1.7241 1.7241 1.7241 1.7241 1.7241 1.7241 1.7241 1.7241 1.7241 0.1 0.9 0.50 1.2195 1.2195 1.2195 1.2195 1.2195 1.2195 1.2195 1.2195 1.2195表 2 為θ 値從 0.18 到 0.82,w 值從1 0.9 到 0.1 且w 值從2 0.1 到 0.9 的部份做效率比較。由表 中的RE 值可知,隨著2 L值的增加RE 值也跟著增加。此外,兩種模式比較之2 RE 值呈現對稱2 的情形,其對稱係以w1 = w2 =0.5為中心。在效率比較的部分,RE 值皆大於2 1,表示本節所提 之兩分層一般隨機作答模式確實比 Christofides (2003) 所提出的模式效率更佳。
4.3 分層廣義隨機作答模式與分層一般隨機作答模式之效率比較
本節將比較本文所提出的兩種新模式之相對效率,亦即比較在分層抽樣的情形下,分層廣 義隨機作答模式與分層一般隨機作答模式之效率比較,因此定義兩模式在母體分為兩層情形下 (m=2) 其相對效率比較為( )
( )
II I Var Var RE θ θ ˆ ˆ 3 = 由於表格內容過多,且其效率比較在L=2到L=10之間差異不大的情況下,因此吾人僅摘 錄當L=2之效率比較如表 3 所示。 由表 3 可看出,當L=2、π 值大於 0.4 時,i RE 值皆會大於3 1,表示在這樣的條件下,分 層一般隨機作答模式的效果會比分層廣義隨機作答模式更好。除此之外,當π 值為 1 時,分層i 廣義隨機作答模式之估計量θˆ 與分層一般隨機作答模式之估計量I θˆ 相同且其變異數亦相同,因II 此其相對效率值皆為 1。5. 結論
根據上述的分析結果,加以整理與歸納,可得到下列的結論: (1) 由於受訪者只需回答出一個「數字」即可,而無需直接回答「是」或「否」,故可降低受訪 者的不安全感並減少了不誠實回答的誤差。 (2) 當πi =0或 1 時且m=1,分層廣義隨機作答模式之估計量θˆ 與 Christofides (2003) 的估計I 量θˆ 相同且其變異數亦相同,因此,Christofides (2003) 的模式可視為分層廣義隨機作答模C 式之特例。當Li =2、πi =1且m=1時,分層廣義隨機作答模式之估計量θˆ 與 Warner (1965)I 的估計量θˆ 相同且其變異數亦相同,因此,Warner (1965) 的模式亦可視為分層廣義隨機作W 答模式之特例。 (3) 當πi =1且m=1時,分層一般隨機作答模式之估計量θˆ 與 Christofides (2003) 的估計量II θˆC 相同且其變異數亦相同,因此,Christofides (2003) 的模式亦可視為分層一般隨機作答模式 之特例。當Li =2、πi =1且m=1時,分層一般隨機作答模式之估計量θˆ 與 Warner (1965)II 的估計量θˆ 相同且其變異數亦相同,因此,Warner (1965) 的模式亦可視為分層一般隨機作 W表 3 當
m
=
2
且L=2時,兩個新的分層模式之效率比較 1 θ θ 2 w1 w2π
i 0.1 0.2 0.3 0.4 0.6 0.7 0.8 0.9 1.0 θ RE3 RE3 RE3 RE3 RE3 RE3 RE3 RE3 RE3 0.1 0.9 0.9 0.1 0.18 0.0167 0.1205 0.6160 4.3976 9.8081 3.2955 1.8782 1.3050 1.0000 0.7 0.3 0.34 0.0166 0.1194 0.6088 4.3392 9.6791 3.2576 1.8618 1.2986 1.0000 0.5 0.5 0.50 0.0164 0.1169 0.5921 4.2046 9.3813 3.1698 1.8234 1.2834 1.0000 0.3 0.7 0.66 0.0162 0.1145 0.5763 4.0781 9.1014 3.0866 1.7865 1.2685 1.0000 0.1 0.9 0.82 0.0161 0.1135 0.5700 4.0279 8.9901 3.0534 1.7716 1.2624 1.0000 0.2 0.8 0.9 0.1 0.26 0.0170 0.1208 0.6111 4.3297 9.5938 3.2265 1.8461 1.2916 1.0000 0.7 0.3 0.38 0.0169 0.1200 0.6058 4.2871 9.5010 3.1994 1.8343 1.2870 1.0000 0.5 0.5 0.50 0.0167 0.1181 0.5933 4.1879 9.2843 3.1357 1.8065 1.2760 1.0000 0.3 0.7 0.62 0.0166 0.1163 0.5814 4.0932 9.0774 3.0745 1.7795 1.2652 1.0000 0.1 0.9 0.74 0.0165 0.1155 0.5766 4.0552 8.9942 3.0499 1.7685 1.2607 1.0000 0.3 0.7 0.9 0.1 0.34 0.0171 0.1207 0.6059 4.2689 9.4173 3.1709 1.8205 1.2811 1.0000 0.7 0.3 0.42 0.0171 0.1202 0.6024 4.2413 9.3575 3.1534 1.8129 1.2781 1.0000 0.5 0.5 0.50 0.0170 0.1189 0.5942 4.1761 9.2164 3.1120 1.7948 1.2709 1.0000 0.3 0.7 0.58 0.0169 0.1177 0.5862 4.1129 9.0795 3.0717 1.7771 1.2639 1.0000 0.1 0.9 0.66 0.0168 0.1172 0.5830 4.0872 9.0240 3.0553 1.7698 1.2609 1.0000 0.4 0.6 0.9 0.1 0.42 0.0172 0.1203 0.6005 4.2147 9.2746 3.1269 1.8005 1.2730 1.0000 0.7 0.3 0.46 0.0172 0.1201 0.5988 4.2012 9.2456 3.1184 1.7968 1.2715 1.0000 0.5 0.5 0.50 0.0171 0.1194 0.5947 4.1690 9.1762 3.0980 1.7880 1.2680 1.0000 0.3 0.7 0.54 0.0171 0.1188 0.5907 4.1373 9.1079 3.0780 1.7792 1.2645 1.0000 0.1 0.9 0.58 0.0170 0.1186 0.5890 4.1243 9.0799 3.0698 1.7756 1.2630 1.0000 0.5 0.5 0.9 0.1 0.50 0.0172 0.1196 0.5949 4.1667 9.1629 3.0934 1.7857 1.2670 1.0000 0.7 0.3 0.50 0.0172 0.1196 0.5949 4.1667 9.1629 3.0934 1.7857 1.2670 1.0000 0.5 0.5 0.50 0.0172 0.1196 0.5949 4.1667 9.1629 3.0934 1.7857 1.2670 1.0000 0.3 0.7 0.50 0.0172 0.1196 0.5949 4.1667 9.1629 3.0934 1.7857 1.2670 1.0000 0.1 0.9 0.50 0.0172 0.1196 0.5949 4.1667 9.1629 3.0934 1.7857 1.2670 1.0000 答模式之特例。 (4) 在效率比較的部分,RE 值皆大於1 1,表示兩分層之分層廣義隨機作答模式比 Christofides (2003) 所提出的模式效率更佳。而RE 值皆大於2 1,表示兩分層的分層一般隨機作答模式比 Christofides (2003) 所提出的模式效率更佳。在不同的參數設計下,由RE
3值可以發現分層 一般隨機作答模式與分層廣義隨機作答模式等兩模式互有優劣。而當π 值為 1 時,本文所i 提出的兩種新隨機作答模式之結果皆為相同。參考文獻
王智立、蔡宛容,「應用一般化 Greenberg 無關聯隨機作答模式於敏感性問題之研究」,中國統計
學報,第 45 卷第 2 期,民國 96 年,190-207 頁。
Christofides, T. C., “A Generalized Randomized Response Technique,” Metrika, Vol. 57, No. 2, 2003, pp. 195-200.
Christofides, T. C., “Randomized Response in Stratified Sampling,” Journal of Statistical Planning
and Inference, Vol. 128, Iss. 1, 2005, pp. 303-310.
Greenberg, B. G., Abul-Ela, A. A., Simmons, W. R., and Horvitz, D. G., “The Unrelated Question Randomized Response Model : Theoretical Framework,” Journal of the American Statistical
Association, Vol. 64, No. 326, 1969, pp. 520-539.
Kim, J. M. and Warde, W. D., “A Stratified Warner’s Randomized Response Model,” Journal of
Statistical Planning and Inference, Vol. 120, Iss. 1-2, 2004, pp. 155-165.
Warner, S. L., “Randomized Response: A Survey Technique for Eliminating Evasive Answer Bias,”