如何調查敏感性的問題
鄧進財 · 張春桃
主旨
直接詢問受訪者 「你是否逃稅過?」、「你是否做過不道德的事?」 等敏感性的問題, 受訪者大 多不會坦誠地回答。 本文將簡述一種隨機性的問答, 來消除受訪者的疑慮, 進而提高所收集之資 料的可信度, 使得估計結果能更真切反應現實的狀況。
如果我們所要調查的問題涉及個人的名譽道德、 私人秘密及其他有利害關係的事項, 受訪 者多半不會忠實回答所問的敏感性問題。 因此, 直接詢問受訪者敏感性的問題是較難獲得可靠 的資料。
例如: 直接問學生一年內是否作弊過? 或直接詢問工商業公司老板是否逃稅過或直接調查 已婚者有無出軌過? ... 等等, 都是很難獲得受訪者坦誠相告。 因此, 直接調查所得的資料與事 實往往相差很大, 而無參考價值。
既然直接詢問敏感性的問題難以獲得可信的資料, 我們就想出其他的調查方式, 以獲取受 訪者信賴, 進而使調查結果具有可靠性。 在此我們將簡潔地談談如何利用 「隨機問答」 的技巧, 來消除受訪者疑慮, 使他們能坦誠地回答問題, 從而獲取與事實較接近之資料。 那麼, 什麼是隨 機問答呢? 我們提供受訪者兩個或多個問題, 一個是敏感性的問題, 另一個則是不傷大雅的是 非題。 接著, 請受訪者隨機性的回答其中的一個問題, 例如: 受訪者自行丟銅板, 若得正面就回 答敏感性的問題, 得反面就回答不傷大雅的是非題。 受訪者祇須回答 「是」 或 「否」, 而不須告訴 訪員所回答的是何種問題, 如此訪員即無法確知受訪者所回答的是何種問題, 因此受訪者便可 以毫無顧忌的回答問題。 這種調查方式, 雖然我們並不知個別受訪者所回答的是何種問題, 但是 從整體上, 我們確可輕易地估計出所要調查問題的結果。 當然, 估計的結果與事實常有誤差。 例 如: 利用丟一個公平的銅板奇數次來估計出現正面的比例, 估計的結果是無法獲取正確的比例 0.5。 但是, 我們丟的次數愈多, 所得的估計值與事實也愈一致。
假設我們要調查高中生手淫的比例, 我們可設計兩個問題:
66
如何調查敏感性的問題 67 問題 1, 為敏感性的問題 —「你是否曾經手淫過?」,
問題 2, 為無關痛癢的問題 —「你的學號是否為奇數? 」。
對每一位受訪的學生, 我們可請他或她依自己身分證字號的尾數回答問題: 若身分證字號 的尾數大於或等於 7, 則回答問題 2, 若身分證字號的尾數小於 7, 則回答問題 1。
假設調查了一百位學生有四十四位回答 「是」, 則我們獲得了表一的結果。 任一身分證字 號的尾數大於或等於 7 的機會是十分之三。 因此, 我們估計一百位受訪的學生當中約有三十位 回答問題 2, 其餘均回答問題 1。 接著, 從三十位回答問題 2 的學生中, 我們估計約有一半將會 回答 「是」, 這是因為學號有一半是奇數。 因此, 回答問題 2 的三十位學生中估計有十五位會說
「是」, 另外十五位會回答 「否」。 再由總人數中扣除回答問題 2 的人數, 即求得回答問題 1 「是」
與 「否」 的人數分別為 29 h即 44 − 15i 與 41 h即 56 − 15i。 最後, 利用回答問題1的70位受 訪學生中, 得知有 29 位會回答 「是」, 因此我們估計高中學生手淫的比率約為百分之四十一 h即 29 ÷ 70 = 0.414i, 如表二所示。
表一、 敏感性問題的調查結果 是 否 小計 你曾否手淫過?
你學號是奇數?
總人數 44 56 100
表二、 敏感性問題的估計結果 是 否 小計 你曾否手淫過? 29 41 70 你學號是奇數? 15 15 30 總人數 44 56 100 此估計方法可以下列符號及式子表示之:
n : 調查總人數,
r : 受訪者回答敏感性問題的機率, 1 − r : 受訪者回答非敏感性問題的機率, X : 受訪者回答 「是」 的隨機人數, n − X : 受訪者回答 「否」 的隨機人數, q : 對非敏感性問題回答 「是」 的機率, 1 − q : 對非敏感性問題回答 「否」 的機率, p : 對敏感性問題回答 「是」 的比例,
則我們可得各項結果如表三所示, 而且得知 p 的估計量如下列公式
p = (1/r)[X/n − (1 − r)q].ˆ (公式1) 此外, 此估計量的變異數表示如下:
V (ˆˆ p) = (1/n)(1/r)2(X/n)(1 − X/n). (公式2)
68 數學傳播 28卷2期 民93年6月
表三、 敏感性問題的估計結果
是 否 小計
敏感性問題 X − n(1 − r)q n − X − n(1 − r)(1 − q) nr 非敏感性問題 n(1 − r)q n(1 − r)(1 − q) n(1 − r)
總人數 X n − X n
同樣地, 依表二的資料及公式 1 及公式 2, 我們得知 r = 0.7, X = 44, n = 100 及 q = 0.5, 故高中學生手淫比率的估計值
p = (1/0.7)[44/100 − 0.3 ∗ 0.5] = 0.414.ˆ 而其變異數的估計值
V (ˆˆ p) = (1/100)(1/0.7)2(44/100)(1 − 44/100) = 0.005.
利用此結果可得知高中學生手淫比率 p 的 95%信賴區間值為 0.414 ± 1.96 ∗√
0.005 = (0.275, 0.553).
上面我們所用的方法, 若碰到一位多疑, 而學號又不是奇數的同學, 儘管事實上我們不知 道他或她的學號, 而他或她依然可能會害怕, 假如他或她回答 「是」, 而我們若查出他或她的學 號, 那不就證明他或她曾手淫嗎? 我們為了避免因此而產生的資料偏差, 可以應用下面的例子。
例如我們想研究青少女墮胎的比率, 我們可請他或她依自己身分證字號的尾數回答問題:
若身分證字號的尾數大於或等於 4: 回答 「你是否墮胎過?」, 若身分證字號的尾數等於 2或 3: 回答 「是」,
若身分證字號的尾數等於 0或 1: 回答 「否」。
這種方式的隨機問題, 可以完全消除受訪者的疑慮。 因為受訪者回答 「是」 可能是身分證 字號的尾數等於 2或3, 而必須回答 「是」。 接著, 根據調查後 「是」 與 「否」 的總人數及類似表三 的估計方式, 我們就可估計青少女墮胎的比率。 譬如, 調查了一百位高中女生, 有三十二位回答
「是」, 則我們獲得了表四的結果。 類似表三的估計方式, 我們可得表五。 依表五的資料及公式 1 及公式 2, 我們得知 r = 0.6 (因為 100 位高中女生中約有 60 位受訪者身分證字號的尾數大於 或等於 4), X = 32, n = 100 及 q = 0.5 (因為身分證字號的尾數等於 2或 3的女生人數約有 20 位, 而且與身分證字號的尾數等於 0 或 1 的女生人數相同), 故青少女墮胎率的估計值
p = (1/0.6)[32/100 − 0.4 ∗ 0.5] = 0.2.ˆ
如何調查敏感性的問題 69
而其變異數的估計值
V (ˆˆ p) = (1/100)(1/0.6)2(32/100)(1 − 32/100) = 0.006.
利用此結果可得知青少女墮胎率 p 的 95%信賴區間值為 0.2 ± 1.96 ∗√
0.006 = (0.048, 0.352).
表四、 青少女墮胎率的調查結果 是 否 小計 你曾否墮胎過?
請回答 「是」
請回答 「否」
總人數 32 68 100
表五、 青少女墮胎率的估計結果 是 否 小計 你曾否墮胎過? 12 48 60
請回答 「是」 20 0 20 請回答 「否」 0 20 20 總人數 32 68 100
—本文作者鄧進財現任教美國紐澤西州立 William Paterson 大學, 張春桃現任教淡江大學統 計系—