試題偏難或偏易情況下之Mokken尺度量表問項篩選分析 - 政大學術集成

全文

(1)國立政治大學統計學系碩士論文. 指導教授：江振東博士. 立. 政治大. ‧ 國. 學 ‧. 試題偏難或偏易情況下之. n. al. er. io. sit. y. Nat. Mokken 尺度量表問項篩選 Ch. engchi. i Un. v. 研究生：高千涵撰. 中華民國一零二年六月.

(2) 謝詞能夠完成本論文，首先要感謝我得指導老師江振東教授的指導，過去一整年，從文獻閱讀、研究方向的確定、模擬資料研究到最後論文的撰寫，每個禮拜老師都不斷的給予指導，並細心的更正我的論文寫作部分，因此我非常感謝我的指導老師。另外，感謝口試委員林定香教授、廖培珊教授寶貴的建議與指正。感謝行政院國科會資助的「台灣社會變遷基本調查五期一次-綜合問卷組」計劃，由中央研究院人文社會科學研究中心調查研究專題中心學術調查研究資料. 政治大謝謝黃雅雯室友一年來互相的照顧與加油打氣，以及在論文的觀念、程式的立. 庫釋出的資料，使的本研究可以順利的進行。. ‧ 國. 學. 指導，此外，我要感謝許思淵學長不時的提供寶貴的經驗以及程式的指導，並提供我跑程是很好的管道。再來，我還要感謝張沛強同學對於程式上的指導以及協. ‧. 助文獻搜尋。最後，最重要的是家人這一年來的在背後的支持鼓勵，非常謝謝他. n. al. er. io. sit. y. Nat. 們不求回報的付出，有他們的陪伴我才能無後顧之憂的完成我的論文。. Ch. engchi. 1. i Un. v.

(3) 目錄頁數摘要 ............................................................... 5 Abstract ............................................................. 6 第一章緒論 ........................................................ 7 第一節研究背景................................................. 7 第二節動機..................................................... 7 第二章文獻探討 ................................................... 10 第一節 Guttmam 量表 ........................................... 10 第二節 Mokken 量表 ............................................ 12 第三節 Mokken 問項篩選步驟 .................................... 22. 立. 政治大. ‧. ‧ 國. 學. 第三章資料模擬分析 ............................................... 25 第一節資料生成模型............................................ 26 第二節模擬變數................................................ 27 第三節模擬結果................................................ 30 第四章實證分析 ................................................... 40 第一節分析過程................................................ 42. Nat. y. sit. n. al. er. io. 第二節資料推論................................................ 45 第三節結論.................................................... 47 第五章結論與建議 ................................................. 48 第一節分析結論................................................ 48 第二節建議與改進.............................................. 49 參考文獻 .......................................................... 50 附錄 .............................................................. 51. Ch. engchi. 2. i Un. v.

(4) 表目錄頁數表 1.1 中研院社科中心變遷五期一次問卷-1 ............................. 8 表 1.2 中研院社科中心變遷五期一次問卷-2.............................. 9 表 1.3 中研院社科中心變遷六期一次問卷-1.............................. 9 表 2.1 問項 X 1 , X 2 之回答分布情形 ..................................... 16 表 2.2 問項 i, j 各種回答組合的機率值.................................. 18 表 2.3 Guttman 累積模型下，問項 i, j 各種回答組合的機率值.............. 19 表 3.1 不同因子組合的模擬情況 ...................................... 29 表 3.2 問項對稱時，違反篩選條件的問項個數([-1.5,1.5])............... 30 表 3.3 問項對稱時，違反篩選條件的問項個數([-3,3])................... 31. 立. 政治大. ‧. ‧ 國. 學. 表 3.4 問項偏右時，違反篩選條件的問項個數........................... 33 表 3.5 問項偏右時，違反篩選條件的問項個數 .......................... 33 表 3.6 問項偏右時，違反篩選條件的問項個數 .......................... 34 表 3.7 正向回答機率的差異範圍以及上升幅度(斜體字)................... 35 表 3.8 問項偏左時，違反篩選條件的問項個數........................... 37 表 3.9 問項偏左時，違反篩選條件的問項個數........................... 37. Nat. y. sit. n. al. er. io. 表 3.10 問項偏左時，違反篩選條件的問項個數.......................... 38 表 4.1 中研院社科中心變遷五期一次題組-1............................. 40 表 4.2 中研院社科中心變遷五期一次題組-2............................. 40 表 4.3 中研院社科中心變遷五期一次題組-3............................. 41 表 4.4 各問項的正向回答比例(題組-1)................................. 42 表 4.5 各問項的正向回答比例(題組-2)................................. 42 表 4.6 各問項的正向回答比例(題組-3)................................. 43 表 4.7 利用自動化問項篩選工具篩選結果(題組-1)....................... 43 表 4.8 利用自動化問項篩選工具篩選結果(題組-2)....................... 43 表 4.9 利用自動化問項篩選工具篩選結果(題組-3)....................... 44. Ch. engchi. i Un. v. 表 4.10 問項量表係數(題組-1)........................................ 44 表 4.11 問項量表係數(題組-2)........................................ 44 表 4.12 問項量表係數(題組-3)........................................ 45. 3.

(5) 圖目錄頁數 Guttman 量表反應函數 ........................................ 12 Mokken 量表反應函數之單調性 ................................. 14 Mokken 量表反應函數非相交性 ................................. 15 二參數邏輯斯模型(   1.25 ,   1.5,0.75,0,0.75,1.5 ) ............ 26. 立. 政治大. 學 ‧. ‧ 國 io. sit. y. Nat. n. al. er. 圖 2.1 圖 2.2 圖 2.3 圖 3.1. Ch. engchi. 4. i Un. v.

(6) 摘要在一組問項有次序性(強弱性)的問卷中，若其議題涉隱私或過於敏感，則容易出現給予正向回答的比例偏低的情況；反之若是高度認同的議題，則容易造成給予正向回答的比例都偏高的情形，這兩種情況都屬於問項回答太過一致的問卷，若直接利用這種問卷來分析或許無法取得有用的資訊。本研究主旨在於探討利用自動化問項篩選工具(AISP)，針對這種問項太過一致的問卷來篩選出符合 Mokken 尺度量表的問項時所可能衍生的問題。由於利. 政治大中可能包含不適當的問項。因此我們將透過「違反篩選條件的問項個數和比例」立用自動化問項篩選工具的一個缺失點為，篩選出的量表不一定是最好的量表，其. ‧ 國. 學. 的計算，來針對問項難易分佈偏左(正向回答比例低)、偏右(正向回答比例高) 的問卷和問項分佈對稱的情況來進行探討。. ‧. 模擬結果顯示，當問項難易分佈偏左或偏右時，皆會造成違反篩選條件的問. sit. y. Nat. 項個數和比例逐漸遞增。此外，若問項設計的鑑別度太低，自動化問項篩選工具. n. al. er. io. 幾乎無法有效的篩選出適當的問項。. Ch. engchi. 5. i Un. v.

(7) Abstract In a questionnaire survey, if the items are related to politics or personal privacy, respondents tend to give a negative response to the items. On the other hand, if the items are highly recognized, most of them answer positively to the items. These two are examples that the responses to the items are too consistent. It is apparent that useful information is hard to come by through the use of such kind of survey data. The automated item selection procedure (AISP) is a tool to select items that form. 政治大 necessarily the optimal choice. Therefore, the aim in the study was to investigate 立 a Mokken scale from questionnaire. However, the items selected by AISP is not. ‧ 國. 學. whether extreme response items would create more problems when using AISP. Number of items which violates the selection rules was based to judge the possible. ‧. impact.. Nat. sit. y. The simulation results showed that number of violations increased when the. n. al. er. io. items were too consistent. Furthermore, items with low discrimination almost led to ineffective items selection.. Ch. engchi. 6. i Un. v.

(8) 第一章緒論. 第一節研究背景在日常生活中，我們可以利用體重計來測量體重、用尺來測量長度或是用溫度計測量溫度，但就社會科學或是心理學領域的研究者而言，他們有興趣的往往是想測量人們某一特質的強度(大小)，例如：智力、對政治傾向的態度，但這些特質往往無法透過實體工具來進行測量，也沒有單位能夠加以描述，且不能從受. 政治大為了評比這些潛在特質的大小，研究者常利用一組有順序性問項的問卷來建立一立. 試者身上直接量測或觀察到，因此這些特質一般被通稱為潛在特質(latent traits)。. ‧ 國. 學. 個量表，藉由此量表所得到的資料來給定受試者一個測量值，並透過這個測量值來對受試者潛在特質做評比或排序。. ‧. 針對一組有順序性問項的問卷資料的分析方式，文獻中已有不少的探討。. sit. y. Nat. Mokken (1971)提出的 Mokken 量表分析(Mokken scale analysis)，即為方法之一，. n. al. er. io. 歸屬於無母數試題反應理論(Nonparameteric Item Response Theory)的範疇。由於. i Un. v. 是一種無母數的分析方法，適用範圍較廣，但分析資料前仍須考量資料是否有符. Ch. engchi. 合 Mokken 量表分析下的模型假設。. 第二節動機本研究的原始動機來自於中央研究院人文社會科學研究中心調查研究專題中心學術調查研究資料庫的「台灣社會變遷基本調查五期一次、六期一次-綜合問卷組」共三個題組資料，其題組涉及政治參與和環保的議題，題組內容如表 1.1、表 1.2 以及表 1.3。三個題組的問項皆為有明顯層次強弱關係(順序性)，因此我們利用 Mokken 量表分析法來進行資料分析。然而在分析過程中發現，由於兩個題組和政治議題 7.

(9) 有關，屬於比較敏感的問卷，導致給予各個問項正向回答("多次"或"曾有過") 的機率偏低，也就說這兩份問卷中，受試者的回答大部分都是"從未有過"；而第三個題組有關於環保議題的問卷，正向機率皆偏高，即僅少數受試者給予"從不" 的回答。所以我們擔心這三個題組的反應資料結構是否過於偏頗，以至於無法適切地反應出受試者的潛在特質，造成分析上的困擾。因此本研究將針對回答正向比例偏低或者偏高的問卷進行探討，想要了解由這種類型的問卷中，篩選出和某一潛在特質相關的問項來建構出一個量表時，所可能衍生出來的問題。後續章節，我們將介紹 Mokken 量表分析的理論背景(第二章)；針對問項偏易與偏難的情形說明如何進行模擬實驗並對結果做探討(第三章)；利用前述兩份. 治政問卷資料來實證分析與說明(第四章)以及結論與建議(第五章)。大立 ‧ 國. 學. 表 1.1 中研院社科中心變遷五期一次題組-1. ‧. (1)在過去的一年，您有沒有採取下列的方法表達意見或提出要求？. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. (1) (2) (3). 多曾從未有有次過過. a1. 向政府官員、民意代表或政黨反映意見提出要求。. □1 □2 □3. b1. 向大眾媒體投訴。. □1 □2 □3. c1. 透過網際網路反映意見。. □1 □2 □3. d1. 參加遊行、示威、靜坐或其他自力救濟方式。. □1 □2 □3. 8.

(10) 表 1.2 中研院社科中心變遷五期一次題組-2. (2)在最近幾年的選舉中，您有沒有做過以下這些事情？ (1) (2) (3). 多曾從未有有次過過 a2. 捐錢給候選人或政黨（包括購買餐卷、紀念品等）。. □1 □2 □3. b2. 參加為候選人而舉辦的集會或餐會活動。. □1 □2 □3. c2. 配戴或懸掛候選人的標誌與旗幟。. □1 □2 □3. d2. 擔任候選人或政黨的助選人員或義工。. □1 □2 □3. 政治大表 1.3 中研院社科中心變遷六期一次題組立. 學. ‧ 國. (3)環保行為。. (1) (2) (3) (4) 經. 有. 從. 是. 常. 時. 不. ‧. 總. sit. y. Nat. n. al. er. io. a3. 請問您常不常為了資源回收特地對玻璃、鋁罐、塑膠 □1 □2 □3 □4 或報紙作分類？. i Un. v. b3. 請問您常不常特地去買沒有用農藥或化學肥料的蔬菜 □1 □2 □3 □4 水果？. Ch. engchi. c3. 請問您常不常為了環保而減少開汽機車？. □1 □2 □3 □4. d3. 請問您常不常為了環保而減少家裡使用的能源或燃（油）料？. □1 □2 □3 □4. e3. 請問您常不常為了環保刻意節約用水或重複用水？. □1 □2 □3 □4. f3. 請問您常不常為了環保而刻意不買某些產品？. □1 □2 □3 □4. 9.

(11) 第二章文獻探討由於本研究將以符合 Mokken 量表(Mokken scale)的二元反應問項問卷為主軸，針對正向(或負向)回答比例偏高或偏低的情況，利用自動化問項篩選工具來就問項進行篩選時，可能衍生出的問題進行探討，因此本章中將先就無母數反應理論(Nonparameteric Item Response Theory)中，Guttmam 量表(Guttmam scale) 以及 Mokken 量表的相關議題進行回顧。. 第一節 Guttmam 量表. 政治大 Guttmam 量表是由一組有次序性(大小、強弱、或難易)的問項(或題目)所立. ‧ 國. 學. 組成，藉由受試者對於問題的回答加以分析後，來評估受試者潛在特質(記做  ) 的一種量表，由 Guttmam(Guttman, 1950)於 1950 年所提出。量表的前提假設為. ‧. 若受試者的潛在能力(  )高於問項所對應的特質大小(記做  )時，則受試者的回. sit. y. Nat. 答一定是正向答案。這也意謂著一旦較難的問項為正向答案時，較簡單的問項也. n. al. er. io. 必然是正向答案。若違反上述情況，則被視為錯誤的回答。例如：一組題目有 5. i Un. v. 個問項，將題目由易到難排列，若一位受試者對排序後的問題回答為(0,1,0,0,0)，. Ch. engchi. 其中 1 與 0 分別代表正向(或正確)與負向(或錯誤)回答，由於第二題比第一題難，但此受試者答對第二題卻答錯第一題，則這種錯誤回答即被稱為一種 Guttmam error。在不存在 Guttmam error 的理想情況下，研究者可以使用這份量表來作為測量受試者潛在特質的一種可行工具。一般會使用回答為正向答案的累積總題數，當做每一個人能力的一個測量值(Mokken, 1971)。假設 X i ，i  1,2, k 為第 i 題答題情況， X i  1 代表受試者給第 i 題正向的回答，反之則 X i  0 。令 k. X   Xi i 1. 10.

(12) 為正向答案的累積總題數(或答題總分)，而總題數(或總分)可做為潛在特質的一種測量值，測量值越高代表潛在特質越強，故 Guttmam 量表也被稱為一種完美量表(perfect scale)或累積量表(cumulative scale)。大致上而言，Guttman 量表的適用性，架構於下述的三個前提假設(Guttman, 1950)，一般稱之為 Guttman 累積模型(Guttman cumulative model)，假設說明如下：. 1.. 單一維度(unidimensonality) 在一組問項裡，所有問項都是在測量同一個潛在特質。. 2.. 政治大局部性獨立(local independence) 立. ‧ 國. 學. 受試者針對任一問項的回答，只取決於受試者本身的潛在特質(  )，無關於其他問項的回答。也就是說，在給定潛在特質(  )的情況下，不同. ‧. 問項之間是沒有任何關聯的。. y. Nat. io. sit. 若受試者的潛在特質高於問項 i 所對應的特質大小時(亦即    i )，則. er. 3.. 必定給予問項 i 一個正向回答；反之，若潛在特質低於問項 i 所對應的. al. n. iv n C 特質大小時(亦即    h )，則必定給予負向答案。這個關係可以由問項 engchi U i. 反應函數(Item response function，簡寫成 IRF) ， P( X  1 |  ) 來詮釋。. 如圖 2.1 所示，縱軸為給予正向回答的機率，橫軸為潛在特質。假設此問項特質大小   0 ，若受試者的潛在特質   0 ，則給予此問項正向答案的機率必為 1，也就是 P( X  1 |   0)  1 ；若   0 ，則給予此問項正向回答的機率必為 0，即 P( X  1 |   0)  1 。. 11.

(13) 圖 2.1 Guttman 量表反應函數. 立. 政治大. 第二節 Mokken 量表. ‧ 國. 學. 因為影響受試者回答的因素很多，因此在社會科學的研究領域中，縱使經由. ‧. 一份設計良好的 Guttman 量表所收集到的資料，也無法確保能夠符合 Guttman 累. sit. y. Nat. 積模型的要求，Guttmam error 幾乎是無法避免的窘境。因此實務上，只要一筆. n. al. er. io. 資料中 Guttmam error 出現的比例不是很高時，研究者通常還是可以使用這份量. i Un. v. 表，並透過 Guttman 累積模型來作為測量受試者潛在特質的一種可行工具。. Ch. engchi. 另一種可行方式則是由 Mokken 於 1971 年所提出(Mokken, 1971)，藉由一個容許適當錯誤的模型來分析一組 Guttman 量表資料。這個模型仍以 k. X    X i 來做為評估受試者潛在特質大小的一個測量指標(Grayson, 1988； i 1. Hemker, Sijtsma & Molenaar, 1996)，然而在    i 的情況下，受試者給予問項 i 的回答就不一定是正向答案( X i  1 )，而是利用一個機率模型來決定受試者給. 予正向回答的機率。. 12.

(14) Mokken 量表模型的基本假設 Mokken 量表模型，共有下列四個假設，其中假設 1、2 與 Guttman 累積模型相同，分別說明如下：. 1.. 單一維度(unidimensonality) 如同 Guttman 累積模型，此假設表示問卷裡所有的問項，皆用來測量同一個潛在特質(  )；也就是這組問項資料，只需要透過一個潛在特質便足以解釋資料的結構。在心理學以及教育研究理論研究中，單一維度的. 政治大. 假設是目前最常被使用的，主要原因之一為研究顯示(Mokken, 1971，. 立. pp. 140-141)，單一維度下，受試者的潛在特質可以利用答題總分. ‧ 國. 學. k. X    X i 來進行估計，這是一種使用上簡單且解釋上直觀的工具。 i 1. ‧. 2.. 局部性獨立(local independence). y. Nat. sit. 局部性獨立為模型的第二個假設，是指受試者對於問項 i 的回答只會受. n. al. er. io. 本身潛在特質(  )影響，不會受其他問項而影響結果。假設現在有 k 個. i Un. v. 問項，則某一受試者對於這 k 個問項回答為( x1 , x2 ,, xk )的機率值為：. Ch. engchi. k. P( X 1  x1 , X 2  x2 ,, X k  xk |  )   P( X i  xi |  ) i 1. 從另一個角度看，局部性獨立代表給定  下，兩兩問項之間的共變異數會等於 0，記做 Cov( X i , X j |  )  0，i  j 。. 3.. 問項反應函數單調性(monotonicity) 這個假設代表對於任一問項，當受試者的潛在能力(  )越大，則給予正向答案的機率也會越高也。就是說若  a   b ，則. 13.

(15) P( X i  1 |  a )  P( X i  1 |  b )，i. 若從問項反應函數來看，每一個問項的反應函數應為  的單調非遞減函數，舉例來說，圖 2.2 顯示每一條問項反應函數都是遞增的情形，因此服從問項反應函數單調性的假設。. y. ‧. 圖 2.2 Mokken 量表反應函數之單調性. Nat. io. sit. 問項反應函數非相交性(nonintersecting). 這個假設代表對於所有受試者而言，他們對於問項的難易順序的認知是. n. al. er. 4.. 學. ‧ 國. 立. 政治大. Ch. i Un. v. 完全相同的。也就是若某一受試者對於問項由難到易的排序分別為問項. engchi. 1、問項 2、…、問項 k，則其他受試者對於問項排序的看法也是如此。亦即 P( X 1  1 |  )  P( X 2  1 |  )    P( X k  1 |  ),  。. 若從問項反應函數來看，代表每個問項反應函數彼此不會有交點，如圖 2.3 顯示這四條問項反應函數都沒有相交，因此有服從問項反應函數非相交性的假設。. 14.

(16) 圖 2.3 Mokken 量表反應函數非相交性. Mokken 量表模型. 立. 政治大. 架構在上述四個假設下，1971 年 Mokken(Mokken, 1971)提出的兩個無母. ‧ 國. 學. 數的模型來處理二元反應問項的 Guttman 量表資料：. ‧. 1.. 單調同質性模型(The Monotone Homogeneity Model, MHM). y. Nat. io. sit. 單調同質性模型(MH 模型)的基本假設包含單一維度、局部性獨立以及. n. al. er. 問項反應函數單調性。令 c 為一常數，若有一組 k 個問項的量表資料符合. Ch. MH 模型，則會滿足下列關係式：. engchi. i Un. v. P(  c | X   s)  P(  c | X   t ) , 0  s  t  k 即答題總分越高，則潛在特質大於 c 的機率越大，由於此特性，研究者可以 k. 將 X    X i 作為對受試者潛在特質排序的工具(Grayson, 1988； i 1. Hemker, Sijtsma & Molenaar, 1996)。 2.. 雙重單調性模型(The Double Monotonicity Model,DMM) 雙重單調性模型(DM 模型)，顧名思義，即包含有兩種單調的性質。模型的基本假設除了 MH 模型的三個假設外，再加上問項反應函數非相交. 15.

(17) 性這個單調性的假設，因此 DM 模型被視為是 MH 模型的特例。若資 k. 料符合 DM 模型，除了可以用透過 X    X i 將受試者潛在特質排序外， i 1. 亦可利用問項正向答案的比例高低對問項難易程度進行排序(Sijtsma & Junker, 1996)。 Guttman error 的計算由於 Guttman 累積模型強調問項間有很強的次序性關係，一旦受試者給予較難的問題正向答案，則必定也會給予簡單的問項正向的答案，而在 Mokken 量. 政治大則是以機率角度當做出發點，因此理論上所有的回答模式都有可能出現，這其中立表模型中，雖然問項間的次序性關係依然存在，不過受試者的可能反應(回答). ‧ 國. 學. 自然也包含有 Guttmman error 的反應情況。以下將利用一個例子來介紹 Guttman error 的計算方式。. ‧. 假設有 5 個二元反應的問項，由難到易依序為： X 1 ,, X 5 ，此外總共有 100. Nat. io. sit. y. 個受試者。以表 2.1 為一個 2  2 的列聯表來說明 X 1 , X 2 回答的情況：. er. . n. a表l2.1 問項 X , X 之回答分布情形i v n Ch engchi U X 1. 2. 2. X1. Yes. No. Total. Yes. 24. 6. 30. No. 36. 34. 70. Total. 60. 40. 100. 由上表可以看出給予 X 1 正向答案的受試者共 30 人，給予 X 2 正向答案的受試者共有 60 人，表示 X 1 較 X 2 難。在 Guttman 累積模型的假設中提到，給. 16.

(18) 予正向答案的受試者必然會給 X 2 正向答案，因此可以由表中看出發生在. X 1 , X 2 的 Guttman error 共有 6 個，記做 Err(obs)=6。其餘任意兩問項間的 Gutteman error 算法亦是如此。利用量表係數評估 Mokken 量表模型的適用性由於本研究重點只在於測量受試者的潛在特質，於是只侷限於單調同質性模型來進行探討。在使用單調同質性模型來測量受試者的潛在特質之前，要先了解資料是否滿足單一維度、局部獨立性以及問項反應函數單調性，因此欲知道一組. 政治大. 量表是否適合使用單調同質性模型來進行分析，便需要一個評估模型好壞的方法. 立. 和準則。1948 年，Loevinger(Loevinger, 1948)曾提出同質性係數(coefficient of. ‧ 國. 學. homogeneity)的想法，但當時未被廣泛地採用，直到 Mokken 提出了兩個無母數的模型後(Mokken, 1971)，同質性係數(量表係數)再度被引進，並利用它來評. ‧. 估 Mokken 量表模型的適用性，其中兩問項、單一問項以及整體問項的量表係數. y. Nat. n. er. io. al. sit. 公式分別說明如下(Molenaar, 1991)：. 1. 兩問項量表係數 H ij. Ch. engchi. i Un. v. 用來評估兩問項間的同質性，其公式如下：. H ij . Cov( X i , X j ) Cov max ( X i , X j ). . Pij  Pi Pj Pi  Pi Pj.  1. Pi  Pij Pi (1  Pj ). 其中 Pi 代表給予問項 i 正向答案的機率、 Pj 代表給予問項 j 正向答案的機率、 Pi Pj 代表皆給予問項 i 和問項 j 正向答案的機率。這個指標的意義由表 2.2 的 2  2 列聯表可以更清楚的了解：. 17.

(19) 表 2.2 問項 i, j 各種回答組合的機率值. Xj. Xi. Yes. No. Total. Yes. Pij. Pi  Pij. Pi. No. Pj  Pij. 1  Pi  Pj  Pij. 1  Pi. Total. Pj. 1  Pj. 1. 分子 Cov( X i , X j ) (共變異數)衡量的是兩問項反應的相關程度，公式定義如下：. 立. 政治大. ‧ 國. 學. Cov( X i , X j )  E[( X i  E ( X i ))( X i  E ( X j ))]  E ( X i X j )  E ( X i ) E ( X j ). ‧. 共變異數大於 0 代表兩變數的趨勢一致，即正相關；反之，小於 0 表示. io. sit. y. Nat. 兩變數的趨勢相反。因此，利用此公式可求得問項 X i 和 X j 共變異數為. n. al. er. Cov( X i , X j )  E ( X i X j )  E ( X i ) E ( X j )  Pij  Pi Pj 。. Ch. engchi. i Un. v. 另外，分母 Covmax ( X i , X j ) 則代表兩問項可能的最大共變異數(即兩問項可能的同質關係達最大的情況)，此值是假設 Guttman error 為 0 的情況下所計算出的，假設問項 i 比問項 j 要困難，則 Pi  Pij  0 ，表 2.3 的列聯表即為此情況：. 18.

(20) 表 2.3 Guttman 累積模型下，問項 i,. j 各種回答組合的機率值. Xj. Xi. Yes. No. Total. Yes. Pi. 0. Pi. No. Pj  Pi. 1  Pj. 1  Pi. Total. Pj. 1  Pj. 1. 因此，利用上表所得到最大共變異數為. 政治大. Covmax ( X i , X j )  E ( X i X j )  E ( X i ) E ( X j )  Pi  Pi Pj. 立. ‧ 國. 學. 綜上所知，由於我們期望一組量表，其問項皆是測量同一個潛在特質，也就是問項之間必須具有正向的關係(共變異數大於 0)，因此兩問項的同質性. ‧. 指標 H ij 越大代表兩問項正向關係越強。. sit. y. Nat. n. al. er. 單一問項量表係數 H i. io. 2.. i Un. v. 用來評估單一問項與其餘問項間的同質性，公式如下：. Hi . . Ch. engchi. Cov ( X i , R( i ) ). Cov max ( X i , R(i ) ).  (P. ij. j i.  Pi Pj ).  (P  P P )   (P j i.  1. i. i. j.  Pi Pj ). j. j i.  (P  P ) i. j i. ij.  P (1  P )   P (1  P ) j i. i. j. j i. j. i. 其中 R(i ) 代表去掉問項 i 後，其餘問項的總分(亦即給予正向回答的總題數)，. 19.

(21) k. 可以定義為： R(i )   X j 。這個指標為評估單一問項和其餘問項之間的同 j 1 j i. 質性，其值越大代表問項 i 和其餘問項的正向關係越強。. 3. 整體量表係數 H 用來評估所有問項間的同質性，公式如下：.  Cov( X , R ) H  Cov ( X , R ) i. (i ). i. max. i. . . 立  1. j i. (i ).  PP )  ( P治. 政 (P  P P )  i. ij. j i. i. i. j. i.  PP )  ( P大.  ( P. ij. j i. j. j i. i. i. j. i.  Pi Pj ). j. 學.  P (1  P )   P (1  P ) i. i. j i. j. j i. i. j. i. ‧. ‧ 國. i. i. sit. y. Nat. 這個指標是用來評估一整組量表的同質性，此值越大表示所有問項彼此的正. io. al. n. 量表係數特性. er. 向關係越強烈(同質性越高)。. Ch. i Un. engchi. v. 前述的量表係數(同質性係數)蘊含著兩個的重要特性，概述如下(Molenaar and Sijtsma,2000)：. 一、對於所有問項 i 、 j 而言，量表係數 H ij、H i、H 滿足以下關係式：. min H ij  H i  max H ij j. j. min H i  H  max H i i. i. min H ij  H  max H ij i, j. i, j. 20.

(22) 二、在 MH 模型下，量表係數會滿足以下關係式： 0  H ij  1. 0  Hi  1. 0  H 1 當 H  1 ，表示沒有任何 Guttman error，此時即為一個完美 Guttman 量表 (Guttman, 1950)；而當 H  0 ，則表示問項間沒有任何關聯，因此在 MH 模型下，量表係數扮演著一個很重要的角色。但在實務上，想要組成一組問項且利用 k. X    X i 來對潛在特質的大小做估計，量表係數僅大於 0 是不夠的。Mokken. 政治大 (Mokken，1971，p.185) 在 1971 年建議量表係數 H 的下界 c 應至少為 0.3。此立 i 1. i. ‧ 國. 學. 外他認為當整體量表係數( H )介於 0.3 ~ 0.4 時，則為一個鑑別能力較弱的量表；介於 0.4 ~ 0.5 屬於中等的量表；介於 0.5 ~ 0.6 即可視為一個較強的量表。. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. 21. i Un. v.

(23) 第三節 Mokken 問項篩選步驟 1971 年，Mokken (Mokken,1971, pp. 71-72)提出了一套自動化問項篩選工具 (automated item selection procedure,簡稱 AISP)，研究者可以利用自動化篩選工具從一大群問項裡，挑出同質性較高的問項來組成量表，並藉此量表來測量受試者的潛在特質。這一自動化問項篩選工具也被廣泛地運用在各個領域，例如：心理學(Bouwmeester & Sijtsma,2006)、社會科學(Gillespie,TenVergert & Kingma, 1987,1988)、精神病理評估(Meijer & Baneke,2005)等，以下將介紹 AISP 的概念以及步驟。. 立. 自動化問項篩選工具概念. 政治大. ‧ 國. 學. 自動化問項篩選工具是採由下往上(bottom-up)的方式來進行問項選取，也. ‧. 就是先選少數幾個問項組成一個初始量表後，再檢視其他問項與此量表的同質性，. sit. y. Nat. 並依序將同質性夠高的問項一個一個加入量表，這個篩選方式架構在問項篩選的. io. n. al. er. 基本要求(Mokken, 1971,p.184)，說明如下。. 1..  ij  0, i, j i  j. Ch. engchi. i Un. v. 相關係數  ij 也是用來衡量問項 i 和問項 j 的相關性，其計算公式如下：.  ij . cov( X i , X j ) Var ( X i )Var ( X j ). 由上面公式可以看出若共變異數大於 0，則相關係數必定大於 0，所以兩問項的同質性越高，相關係數也會越大。由於所有問項皆測量同一個潛在特質，故任意兩問項應存在正向關係，即相關係數大於 0(  ij  0 )。當進行問項篩選時，我們希望最後篩選出的一組項問可以符合 Mokken 提出的 MH 模型， 22.

(24) 由於在 MH 模型下，問項間的共變異數必定大於 0，因此  ij  0, i, j i  j 是篩選問項時的一個重要的篩選依據。. 2.. H i  c  0, i 在實務上，會希望最後找出來的一組問項可以正確區分受試者潛在特質的強弱，因此，問項除了要達到統計顯著( H i  0 )以外，還必須達到實務上的顯著( H i  0.3 )，故設 c 為各問項量表系數的下界，值設定得越高，自動化問項篩選工具所選出的問項其鑑別受試著潛在特質的能力也越好。. 政治大. 自動化問項篩選工具步驟. 立. 根據 Mokken 在 1971 年(Mokken,1971,pp. 190-193)提出的建議，自動化問. ‧ 國. 學. 項篩選工具的進行步驟如下。. ‧. 第一尺度量表(scale 1). y. Nat. n. er. io. al. sit. 第一尺度量表的建構步驟如下：. i Un. v. 步驟 1.1：假設總共有 K 個問項，第一步先選出 H i1i2 最大且其值統計顯著. Ch. engchi. 大於 0 的兩個問項 i1 及 i 2 。. 步驟 1.2：從剩下的 K  2 個問項中，選出一個可以讓整體量表係數 H 達到最大的問項 j，且與步驟 1.1 所選出的兩個問項 i1 及 i 2 之量表係數 H i1 j 、 H i2 j ，統計顯著大於 0 且實務顯著大於下界 c 。. 步驟 1.3：從剩下的 K  3 個問項中，選出一個可以讓整體量表係數 H 達到最大，且與前三個選出的問項之量表係數統計顯著大於 0 且實務顯著大於 c 。步驟 1.4：繼續重覆步驟 1.2 和步驟 1.3 這兩個篩選步驟，直到剩下的問項. 23.

(25) 無法再被選入第一尺度量表中為止。第二尺度量表(scale 2) 在經過上述步驟挑選出問項構成第一量尺度表後，自動化問項篩選工具會在剩下的問項裡繼續做篩選，看是否能再組成第二尺度量表。篩選條件同篩選第一尺度量表的進行方式。更多尺度量表如同第一以及第二尺度量表的篩選方式，重覆篩選步驟，直到沒有任何問項. 治政可以再組成一個新的尺度量表為止。大立 ‧ 國. 當越來越多問項選入某個尺度量表時，縱使某一個問項在被選進量表的當下，. ‧. 1.. 學. 自動化問項篩選注意事項. sit. y. Nat. 該問項的量表係數有符合篩選條件 H i  c，但由於之後還會有問項陸續被選. io. er. 進，所以較早被選進問項的量表係數還是有可能會下降，甚至到小於下界 c 。這點是自動化問項篩選工具在進行問項篩選過程時所無法即時偵測的問題。. al. n. iv n C 因此進行問項篩選後，研究者需要再去一一檢視每個量表中的每個問項，看 hengchi U 看其量表係數( H i )是否大於所設定的下界 c 以確保量表有足夠的同質性。. 2. 利用自動化問項篩選工具來篩問項，由於篩選方法為先選取量表係數 H ij 最高的兩個問項當做起始點，再逐一加入最適合的問項，一旦問項被選入第一個尺度量表後，就不會被選入第二個尺度量表，因此沒有考慮所有可能的問項組合，故我們不能斷定利用自動化問項篩選工具後所組成的量表一定是最好的量表。. 24.

(26) 第三章資料模擬分析本研究將針對測量單一潛在特質的二元反應問項的問卷，來探討不同的問項分配(平均分布、偏難以及偏易)情況，對於單一潛在特質的問項篩選的可能影響。在這之前我們先來定義何謂問項的難易度，在不失一般化的情況下，以下我們將所要測量的潛在特質假定為智力，因此若問項的正向機率越低，代表此問項對於受試者是比較難的，故我們定義此類問項為偏難的問項；反之若問項的正向機率越高，則將問項定義為偏易的問項。. 政治大. 由於自動化問項篩選工具在進行篩選問項時，其篩選方式是藉由選取 H ij 最. 立. 大的兩個問項當做起始點，再依序加入符合篩選條件之最合適問項，所以並非考. ‧ 國. 學. 慮到所有的問項組合後，再從中篩選出一組最佳的尺度量表。此外，在第二章第三節 Mokken 問項篩選工具的步驟中也曾提到，自動化問項篩選工具所篩選出的. ‧. 量表中，問項的 H i 值可能會有小於下界 c 的情況，因此在本研究中，我們將藉由. Nat. io. sit. y. 模擬來觀察違反篩選條件( H i  c, i )的問項個數，是否會因為不同問項難易分. n. al. er. 布情形而有所變化，並探討可能原因。在此我們也以 Mokken 所提出對量表係數. i Un. v. H i 的建議為依據，將下界 c 設定為 0.3 來進行後續的分析探討。本章將分別介紹. Ch. engchi. 模擬資料的模型、模擬變數、影響因子以及呈現模擬的結果。. 25.

(27) 第一節資料生成模型為了模擬出符合單調同質性模型(MHM)的資料，我們採用 Birnbaum(1968) 所提出的二參數邏輯斯模型(two-logistic parametric model,簡稱 2PLM) 來定義問項的反應函數，並藉此模型來生成反應資料。模型說明如下：. 二參數邏輯斯模型：令  表示受試者的潛在能力，  i 代表第 i 個問項所對應的特質大小，  i 代表第 i 個問項的鑑別度參數，則問項 i 正向回答的機率函數為.  (   )) 政 exp(治大. P( X  1) . 立. i. i. 1  exp( i (   i )). ‧ 國. 學. 圖 3.1 為利用二參數邏輯斯模型作為 5 個問項的反應函數的一個例子，其中 5 個問項的   1.25 ，問項所對應的特質大小分別為   1.5,0.75,0,0.75,1.5 。. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v.   1.5,0.75,0,0.75,1.5. 圖 3.1 二參數邏輯斯模型( .  1.25 ,   1.5,0.75,0,0.75,1.5 ). 26.

(28) 第二節模擬變數在模擬研究中，想要考慮的因子有問項個數、問項難易程度、問項鑑別度的變化情況(alpha 值)、受試者潛在特質的分配及樣本大小。我們將針對(1)問項個數、(2)問項分佈、(3)問項難易度分佈範圍、(4) alpha 值分別進行討論。至於潛在特質，我們假設其分配為一標準常態分配。. 1. 問項個數問項個數選定上，我們使用 5 題、9 題、17 題來進行討論，其原因為由於中. 政治大. 央研究院人文社會科學研究中心調查研究專題中心學術調查研究資料庫的. 立. 「台灣社會變遷基本調查五期一次、六期一次-綜合問卷組」共三份問卷資. ‧ 國. 學. 料，皆是以 4 題為一個題組，故我們採取一個相近的題數 5 題做為最少問項的題組。問項難易度(  )的決定方式為在某一區間等距分佈，一旦這 5 個問. ‧. 項的  值決定後，在加上這 5 個  值的兩兩之間的中點(共 4 個)就成為 9 個. Nat. io. sit. y. 問項的  值；至於 17 題問項難易度的決定方式則為前述的 9 個問項再加上. n. al. er. 兩兩之間共 8 個中點值。而我們想要了解不同問項個數所可能造成的影響。 2. 問項分佈. Ch. engchi. i Un. v. 問項分佈分為對稱(平均分佈)、偏左(偏易)、偏右(偏難)三種，當問項分佈偏左(右)時，極可能會造成問項鑑別力的下降，因此我們預期問項偏左(右) 時，透過自動化篩選工具所得出的問項組合中，違反篩選條件的問項個數將會增加。 3.. 問項難易分佈範圍問項分佈為對稱、偏右、偏左時，問項分佈範圍選取依序為[-1.5,1.5] 、 [-3,3]，[0.5,3.5]、[0,3]、[-0.5,2.5]、[-1,2]、[-2.5, 3.5]和[-1.75, 1.25]、[-2.25, 0.75]、[-2.75, 0.25]、[-3.25, -0.25]、[-3.5, 2.5]， 27.

(29) 而問項的難易度(  )的取值如前所述為等距分佈於每一範圍內。當問項太簡單或是太難(範圍大於 3.5 或小於-3.5)時，會造成所有受試者皆給予正向或負向答案，而造成此問項形同無效問項，故將問項難易分佈範圍的界線設定為 3.5 和 -3.5。我們預期當問項難易分佈範圍越大時，違反篩選條件的問項個數也會增加。 4.. alpha 值本研究選定 0.75、1、1.25、1.5 四個 alpha 值來進行模擬。Mokken, Lewis, & Sijtsma(1986)提到當問項(  )以及潛在特值(  )的標準差皆為常數時，H 會受到 alpha 的影響。由於 alpha 越大表示問項鑑別力越好，因此我們預期. 治政當 alpha 較小(問項鑑別度較差)時，被選進量表的問項會比較少；當 alpha 大立較大時，大部分的問項 H 值都會大於下界，所以幾乎都會被選進量表中。 i. ‧ 國. 學. 因此我們預期當 alpha 太小或太大，違反篩選條件的問項個數都不會太多。. ‧. 表 3.1 為問項對稱(平均分佈)、偏左(問項偏易)以及偏右(問項偏難)情況下，. y. Nat. io. sit. 不同因子組合的模擬情境設定。我們將藉由模擬實驗的方式來了解會被自動化篩. n. al. er. 選工具篩選出的問項個數，並了解其中出現違反篩選條件問項個數，再分別針對. Ch. i Un. v. 問項個數、問項分佈、問項難易分佈範圍及 alpha 值與篩選結果的可能關聯進行探討。. engchi. 28.

(30) 表 3.1 不同因子組合的模擬情況. 問項分佈因子. 對稱. 偏右. 偏左. 潛在特質維度. 1. 1. 1. 潛在特質分配. Standard Normal. Standard Normal. Standard Normal. 問項個數. 5,9,17. 5,9,17. 5,9,17. 問項反應選項. 2. 2. 2. 問項難易度分佈範圍. [-1.5, 1.5], [-3, 3]. 1000. 1000. 1000. n. al. er. io. sit. Nat. 模擬次數. 1000. 0.75,1,1.25,1.5. ‧. 樣本大小. 0.75,1,1.25,1.5. y. alpha 值 0.75,1,1.25,1.5. 學. ‧ 國. 立. 政治大. [0.5, 3.5]、[0, 3]、 [-1.75, 1.25]、[-2.25, [-0.5, 2.5]、[-1, 0.75]、[-2.75, 0.25]、 2]、[-2.5, 3.5] [-3.25, -0.25]、[-3.5, 2.5]. Ch. engchi. 29. i Un. v. 1000 1000.

(31) 第三節模擬結果模擬過程中總共考慮了 52 種情況，每種情況皆模擬 1000 次，每一次分別記錄被篩選到第一尺度量表的問項個數，以及其中違反篩選條件 H i  0.3 的問項個數，據以計算出 1000 次模擬的平均值。以下分別以問項對稱、偏右和偏左的情況來說明模擬結果。對稱問項對稱表示一組問卷的問項從簡單到難皆有，表 3.2 和表 3.3 為問項分佈. 治政對稱、問項難易分佈範圍分別為 [-1.5, 1.5]以及大 [-3, 3]的模擬結果。立 ‧ 國. 學. 表 3.2 問項對稱時，違反篩選條件的問項個數([-1.5,1.5]). 0.75. 5. 0. 0.62. 0.001. 1.14 1.77. 5. C 0.017 h. 9. 0.028. 17. 17 1. 1.25. 1.5. 1. i e n g c h2.33. er. a l0. n. 9. Percentage of error *. sit. #of scale1 item. io. # of error. y. # of item. [-1.5, 1.5]. Nat. . 問項難易度分佈範圍(  ). ‧. 1. i Un. v. * * *. 2.63. *. 0.036. 3.19. *. 5. 0.009. 4.84. 0.0019. 9. 0.034. 8.36. 0.0041. 17. 0.058. 15.39. 0.0038. 5. 0. 5. 0. 9. 0. 9. 0. 17. 0. 17. 0. # of item 表示問項的個數、# of error 表示平均違反篩選條件之問項個數、#of scale1 item 代表平均被選入第一尺度量表的問項個數、違反篩選問項比例(Percentage of error)  # of error/#of scale1 item。 30.

(32) 表 3.3 問項對稱時，違反篩選條件的問項個數([-3,3]). 問項難易度分佈範圍(  ) [-3, 3]. . # of item. 0.75. 1.25. 1.5. #of scale1 item. 5. 0.002. 1.39. Percentage of error *. 9. 0.007. 1.92. *. 17. 0.004. 2.10. *. 5. 0.076. 3.14. *. 9. 0.129. 3.87. *. 17. 0.199. 5.11. *. 5. 0.030. 4.76. 0.0063. 9. 0.145. 8.60. 0.0169. 17. 0.240. 5. 0. 立. 政治15.93 4.88 大. 0.0151 0. 0.010. 8.83. 0.0011. 17. 0.011. 16.69. 0.0007. 學. 9. ‧ 國. 1. # of error. 統整表 3.3 的結果如下：. ‧. 當  上升，被自動化問項篩選工具選進第一尺度量表的問項也越多。. 2.. 當問項個數增加，發生違反篩選條件的問項則變多。. 3.. 大部分有違反篩選條件的問項，發生在   1 以及   1.25 。. sit. al. iv n C hengchi U 當問項難易分佈範圍變大時，發生違反篩選條件的問項也增加。 n. 5.. er. io. 4.. y. Nat. 1.. 若針對 AISP 篩選有效的情況來看，無論在哪一個問項難易分佈範圍下，.   1.25 時的違反篩選問項比例和個數明顯高於   1.5 時的情況。. 問項對稱結論：.  上升，代表問項鑑別度提升，因此被自動化問項篩選工具選進第一尺度量表的個數也會增加。當   0.75 時，平均大概只有 1、2 個問項被選入第一尺度量表；而當   1 時，也只有 3~5 個，大部分的問項都被 AISP 所排除。因此我們認為當  過小時(亦即問項鑑別度太小)，AISP 顯然不是一個理想的篩選工具。 31.

(33) 此外若針對在 AISP 篩選有效的情況下來計算違反篩選條件的問項比例時，.   1.25 的比例明顯大於   1.5 的比例，其可能的原因為在   1.5 時，問項的鑑別度相對比較高，因此較不會將違反篩選條件的問項選入第一尺度量表。偏右問項偏右表示問項難度(  )較高，比起問項分佈對稱來說，受試者給予正向答案的比例相答案的比例相對比較低，且 .  1.25 和   1.5 的比例越來越靠近。表 3.4、表 3.5 和. 表 3.6 為問項分佈偏右、問項難易分佈範圍分別為[-1, 2]、[-0.5, 2.5]、[0, 3]、. 政治大. [0.5, 3.5]、[-2.5, 3.5]的模擬結果。觀察結果統整如下：. 立. 與問項分佈對稱的情況相同， 上升時，被自動化問項篩選工具選進第. 學. ‧ 國. 1.. 一尺度量表的問項也越多。. 隨著問項個數增加，發生違反篩選條件的問項有明顯的遞增。. 3.. 當問項範圍難易分佈逐漸偏右，發生違反篩選條件的問項個數即隨之遞. ‧. 2.. sit. y. Nat. io. er. 增；問項難易分佈範圍變大時，違反篩選條件的問項個數也變多，例如：問項難易分佈範圍為[-2.5, 3.5](問項範圍為 6)時的違反篩選條件問. al. n. iv n C 2](問項範圍為 h e n g3)要來的少。 chi U. 項明顯比 [-1, 4.. 若針對 AISP 篩選有效的情況來看(   1.25 以及   1.5 )，當問項難易分佈範圍為[-1, 2]、[-0.5, 2.5]、[0, 3]時，   1.25 比較容易出現違反篩選條件的問項；但當問項偏右至[0.5, 3.5]時、反倒是   1.5 時，較容易出現違反篩選條件的問項。. 5.. 若針對 AISP 篩選有效的情況來看(   1.25 以及   1.5 )，違反篩選條件的問項比例會隨著問項難易分佈偏右而逐漸上升；當問項範圍變大，違反篩選條件問項的比例也隨著問項難易分佈偏右而增高。. 32.

(34) 表 3.4 問項偏右時，違反篩選條件的問項個數. 問項難易度分佈範圍(  ). 2. [-1, 2]. . # of error. #of scale1 item. # of error. #of scale1 item. 0.75 5. 0. 0.62. 0. 0.49. 9. 0. 1.11. 0. 1.02. 17. 0. 1.72. 0.001. 1.64. 5. 0.018. 2.33. 0.020. 2.19. 9. 0.021. 2.63. 0.030. 2.46. 17. 0.036. 3.09. 0.044. 2.76. 1.25 5. 0.027. 4.77(0.0057). 0.067. 4.41(0.0151). 9. 0.075. 8.11(0.0092). 0.163. 7.13(0.0229). 17. 0.149. 14.59(0.0102). 5. 0.001. 9. 0. 8.99(0). 0.011. 8.97(0.0012). 17. 0. 16.99(0). 0.019. 16.91(0.0011). 1.5. 治 0.366 政大0.006 4.99(0.0002). 立. 12.37(0.0296) 4.99(0.0012). 學. ‧ 國. 1. # of item. [-0.5, 2.5]. 0. n. 5. 0.025. 9 17. 0.82. e 1.43 ngchi. 0i Un. v. 0.28 0.58 1.17. 1.99. 0.010. 1.73. 0.027. 2.27. 0.027. 2.07. 0.042. 2.49. 0.036. 2.26. 1.25 5. 0.132. 3.84(0.0344). 0.111. 3.11(0.0357). 9. 0.193. 5.62(0.0343). 0.162. 3.98(0.0407). 17. 0.409. 9.07(0.0451). 0.322. 5.54(0.058). 5. 0.042. 4.88(0.0086). 0.146. 4.40(0.0332). 9. 0.142. 8.61(0.0165). 0.314. 7.44(0.0422). 17. 0.244. 16(0.0153). 0.571. 13.16(0.0433). 1.5. 0. Ch. #of scale1 item. 0. 1. 17. sit. 0.45. er. # of error. io. 9. #of scale1 item. 0. a 0 l. [0.5, 3.5]. y. [0, 3]. # of item # of error. 0.75 5. 2. 問項難易度分佈範圍(  ). Nat. . ‧. 表 3.5 問項偏右時，違反篩選條件的問項個數. 括號內數字代表違反篩選問項比例(Percentage of error)  # of error/#of scale1 item。 33.

(35) 表 3.6 問項偏右時，違反篩選條件的問項個數. 問項難易度分佈範圍(  ) [-2.5, 3.5]. . # of item. 0.75. 1.25. 1.5. #of scale1 item. 5. 0.006. 1.42. Percentage of error *. 9. 0.007. 1.88. *. 17. 0.007. 2.08. *. 5. 0.082. 3.13. *. 9. 0.131. 3.80. *. 17. 0.199. 5.04. *. 5. 0.053. 4.69. 0.0113. 9. 0.168. 8.39. 0.02. 17. 0.293. 5. 0.003. 立 0.020. 17. 0.030. 15.59 政治 4.82 大. 0.0188 0.0006. 8.75. 0.0023. 16.42. 0.0018. 學. 9. ‧ 國. 1. # of error. ‧. 問項偏右結論：. Nat. sit. y. 當問項難度偏難時，如同所預期的，在 AISP 篩選有效的情況下來看，發生. n. al. er. io. 違反篩選條件的問項個數和比例都比問項對稱時要來的高，而原因有可能和問項. i Un. v. 的正向回答機率範圍大小有關聯。由於模擬時，所有受試者潛在特質大小的分佈. Ch. engchi. 設定為標準常態分配，因此我們可以利用正負兩倍標準差之內的受試者(   2 ) 來計算正向回答的機率的差異範圍，計算方式如下：. P( X i  1 |   2)  P( X i  1 |   2) . exp( i (2   i )) exp( i (2   i ))  1  exp( i (2   i )) 1  exp( i (2   i )). 正向回答機率的差異範圍代表在  2    2 的受試者，給予問項 i 正向回答機率的差異值，若正向回答機率的差異範圍越小，表示受試者給予正向回答的機率大小差異較小，也就是問項 i 的鑑別度比較差；反之，此值越大表示受試者給予正向回答的機率大小差異較大，亦即問項 i 的鑑別度比較好。. 34.

(36) 表 3.7 即為利用表 3.1 問項難易度分佈範圍的中心點，計算出來的正向回答機率的差異範圍。此表顯示無論哪一個問項難易範圍，當  越大(問項鑑別度越好)，正向回答的機率範圍也會越大；而當問項難易範圍逐漸往右偏移，正向回答機率的差異範圍漸減，代表問項的鑑別度逐漸下降。所以我們認為由於問項逐漸右偏，導致正向機率的差異範圍變小，即問項鑑別度下降。顯而易見地，在一組鑑別度比較差的問項中去篩選問項，違反篩選條件的問項個數必然會增加。. 表 3.7 正向回答機率的差異範圍以及上升幅度(斜體字). 問項難易度分佈範圍(  ) [-3.25, -0.25]. 治 0.25] 政 [-2.75, 大. 0.606. 0.642. 0.085. 0.717. 0.111. 0.796. 0.079. 0.851. 0.055. 0.490. 1. 0.539. 1.25. 0.568. 0.029. 0.702. 0.06. 1.5. 0.589. 0.021. 0.747. 0.045. [-1.75, 1.25]. 0.842. 1.5. 0.899. y. 1.25. 0.125. 0.7615. 0.126. 0.085. 0.8482. 0.087. 0.9051. 0.057i v. al 0.057. [-0.5, 2.5]. Ch. [-1, 2]. 0.6219. er. 0.757. 0.6351. n. 1. [-1.5, 1.5]. io. 0.632. Nat. 0.75. 0.557. ‧. ‧ 國. 立 0.049. 學. 0.75. [-2.25, 0.75]. i e n g [0, c h 3]. Un. 0.5251. 0.7417. 0.119. 0.8249. 0.083. 0.8816. 0.057. sit. . [0.5, 3.5]. 0.75. 0.5838. 0.4525. 1. 0.6836. 0.099. 0.5931. 0.068. 0.4820. 0.029. 1.25. 0.7543. 0.071. 0.6389. 0.046. 0.4933. 0.011. 1.5. 0.8065. 0.052. 0.6739. 0.035. 0.4975. 0.004. 另外，當問項難易範圍越往右偏時，   1.5 的違反問項個數以及比例都越顯增加。原因可能是當問項範圍逐漸右偏，無論在任何  水準下，正向回答機率的差異範圍皆越來越小；儘管隨著  的增加，正向回答機率範圍也會增加，但因為問項漸漸右偏，增加的幅度其實越來越小 (見表 3.7 斜體字)，例如：當問項 35.

(37) 難易範圍為[0, 3]，  從 1.25 到 1.5 的正向機率的差異範圍的增加幅度即為. 0.035。尤其當問項難易範圍右偏到[0.5, 3.5]時，從   1.25 到   1.5 的正向機率的差異範圍增加幅度只有 0.004，表示   1.5 時問項的正向機率的差異範圍已逐漸和   1.25 差不多。也就是當問項難易分佈範圍越往右偏時，即使   1.5 ，但是問項的鑑別度已不如問項難易分佈對稱時的那樣好。因此，違反篩選條件的問項比例隨著問項難易分佈往右偏移而有明顯增加的趨勢。偏左問項分佈偏左代表問項難度(  )較低，比起問項對稱來說，受試者給予正向. 治政回答的比例相對較高，表 3.8、3.9 和 3.10 為問項分佈偏左、問項難易分佈範圍大立分別為[-1.75, 1.25]、[-2.25, 0.75]、[-2.75, 0.25]、[-3.25, -0.25]和[-3.5, ‧ 國. 學. 2.5]的模擬結果，模擬結果大致與問項分佈偏右時相當，統整如下。. ‧. 當  上升時，被自動化問項篩選工具選進第一尺度量表的問項也越多。. 2.. 隨著問項個數增加，發生違反篩選條件的問項個數有明顯的遞增。. 3.. 當問項難易分佈範圍逐漸偏左，發生違反篩選條件的問項個數也隨之遞. n. al. er. io. sit. y. Nat. 1.. Ch. i Un. v. 增；問項難易分佈範圍變大時，違反篩選條件的問項個數也變多，例如：. engchi. 問項難易分佈範圍為[-3.5, 2.5](問項範圍為 6)時的違反篩選條件問項明顯比[-1.75, 1.25] (問項範圍為 3)要來的少。 4.. 若針對 AISP 篩選有效的情況來看(   1.25 以及   1.5 )，當問項難易分佈範圍為[-1.75, 1.25]、[-2.25, 0.75]、[-2.75, 0.25]時，  1.25 比較容易出現違反篩選條件的問項；但當問項偏左至[-3.25, -0.25] 時，反倒是   1.5 時，較容易出現違反篩選條件的問項。. 5.. 若針對 AISP 篩選有效的情況來看(   1.25 以及   1.5 )，違反篩選條件的問項比例隨著問項難易分佈偏左而逐漸上升；當問項範圍變大，違反篩選條件的問項比例也隨著問項難易分佈偏左而上升。 36.

(38) 表 3.8 問項偏左時，違反篩選條件的問項個數. 問項難易度分佈範圍(  ). 3. [-2.25, 0.75]. . [-1.75, 1.25]. # of item 0.75 5. # of error. #of scale1 item. # of error. #of scale1 item. 0. 0.56. 0. 0.64. 9. 0. 1.02. 0. 1.13. 17. 2. 1.71. 0. 1.76. 5. 0.025. 2.29. 0.020. 2.36. 9. 0.034. 2.53. 0.027. 2.65. 17. 0.040. 2.94. 0.025. 3.11. 1.25 5. 0.037. 4.69(0.0079). 0.009. 4.83(0.0019). 9. 0.093. 7.73(0.0120). 0.053. 8.34(0.0064). 17. 0.245. 13.68(0.0179). 5. 0. 9. 0.001. 8.99(0.0001). 0. 9(0). 17. 0.003. 16.99(0.0002). 0. 17(0). 1.5. 政4.99(0)治大0.104 0. 立. 15.10(0.0069) 4.99(0). 學. ‧ 國. 1. 0. 0.48. n. a 0 l. 5. 0.026. 9 17. e 1.55 ngchi. sit. 0i v n U. 0.36 0.69 1.35. 2.12. 0.022. 1.88. 0.033. 2.34. 0.029. 2.18. 0.038. 2.65. 0.045. 2.39. 1.25 5. 0.111. 4.19(0.0265). 0.135. 3.47(0.0389). 9. 0.190. 6.44(0.0295). 0.205. 4.8(0.0427). 17. 0.420. 10.86(0.0387). 0.395. 7.19(0.0549). 5. 0.016. 4.97(0.0032). 0.092. 4.71(0.0195). 9. 0.044. 8.87(0.0049). 0.234. 8.11(0.0289). 17. 0.101. 16.69(0.0061). 0.430. 14.79(0.0291). 1.5. 0. 0.78. 0. #of scale1 item. 0. 1. 17. Ch. # of error. er. io. 9. #of scale1 item. [-3.25, -0.25]. y. [-2.75, 0.25]. # of item # of error. 0.75 5. 3. 問項難易度分佈範圍(  ). Nat. . ‧. 表 3.9 問項偏左時，違反篩選條件的問項個數. 括號內數字代表違反篩選問項比例(Percentage of error)  # of error/#of scale1 item。 37.

(39) 表 3.10 問項偏左時，違反篩選條件的問項個數. 問項難易度分佈範圍(  ) [-3.5, 2.5]. . # of item. 0.75. 1.25. 1.5. #of scale1 item. 5. 0.009. 1.36. Percentage of error *. 9. 0.009. 1.94. *. 17. 0.009. 2.09. *. 5. 0.087. 3.12. *. 9. 0.125. 3.85. *. 17. 0.195. 5.08. *. 5. 0.031. 4.71. 0.0066. 9. 0.156. 8.44. 0.0185. 17. 0.288. 5. 0.003. 立 0.019. 17. 0.024. 15.59 政治 4.81 大. 0.0185 0.0006. 8.74. 0.0021. 16.4. 0.0015. 學. 9. ‧ 國. 1. # of error. ‧. 問項偏左結論：. Nat. sit. y. 當問項難易分佈左偏時，結果也如同預期，在 AISP 篩選有效的情況下來看，. n. al. er. io. 發生違反篩選條件的問項個數以及比例都隨著問項難易分佈範圍越往左偏而增. i Un. v. 加，其原因我們認為也是和問項的正向回答機率的差異範圍大小有關。表 3.7. Ch. engchi. 顯示當問項難易分佈範圍逐漸往左偏，其正向回答機率的差異範圍也縮小。因此我們認為，由於問項難易分佈範圍左偏，受試者給予問項 i 的正向機率的差異範圍逐漸遞減，也就是說問項的鑑別度下降。在一群鑑別度比較差的問項中去篩選問項，直觀上違反開選條件的問項數也自然會增加。另外，當問項難易分佈範圍越往左偏時，   1.5 的違反問項比例越來越靠近   1.25 的比例。我們認為造成此情形的原因也如同問項分佈偏右的情形一般，即當問項漸漸偏左時，不同  間的正向回答機率的差異範的上升幅度越縮越小，問項難易分佈範圍為[-3.25, -0.25]時，   1.25 以及   1.5 兩者的正向回答機率的差異範圍差降到只有 0.004，表示   1.5 的問項鑑別度與   1.25 的問項鑑 38.

(40) 別度相當，故違反篩選條件的比例也趨於相同。. 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 39. i Un. v.

(41) 第四章實證分析. 本章我們將利用中央研究院人文社會科學研究中心的社會變遷五期一次以及六期一次的三個題組資料，做為探討當問項的正向回答機率很低時，利用自動化問項篩選工具來篩選問項時所可能遭遇的問題。三個題組議題分別為：(1)向政府反映意見的方式、(2)對選舉的參予度、(3)環保行為。表 4.1 、表 4.2 和表 4.3 為題組的問項內容，為 4 個以及 6 個問項，受試者皆為 2146 位：表 4.1 中研院社科中心變遷五期一次題組-1. 治政 (1) 在過去的一年，您有沒有採取下列的方法表達意見或提出要求？大立 (1) (2) (3). y. □1 □2 □3. sit. ‧ 國. ‧. 學. Nat. 多曾從未有有次過過. □1 □2 □3. a1. 向政府官員、民意代表或政黨反映意見提出要求。. io. er. b1. 向大眾媒體投訴。. c1. 透過網際網路反映意見。. n. al. i Un. d1. 參加遊行、示威、靜坐或其他自力救濟方式。. Ch. engchi. v. □1 □2 □3 □1 □2 □3. 表 4.2 中研院社科中心變遷五期一次題組-2. (2) 在最近幾年的選舉中，您有沒有做過以下這些事情？ (1) (2) (3). 多曾從未有有次過過 a2. 捐錢給候選人或政黨（包括購買餐卷、紀念品等）。. □1 □2 □3. b2. 參加為候選人而舉辦的集會或餐會活動。. □1 □2 □3. c2. 配戴或懸掛候選人的標誌與旗幟。. □1 □2 □3. d2. 擔任候選人或政黨的助選人員或義工。. □1 □2 □3. 40.

(42) 表 4.3 中研院社科中心變遷五期一次題組-3. (3) 環保行為。 (1) (2) (3) (4) 總. 經. 有. 從. 是. 常. 時. 不. a3. 請問您常不常為了資源回收特地對玻璃、鋁罐、塑膠 □1 □2 □3 □4 或報紙作分類？ b3. 請問您常不常特地去買沒有用農藥或化學肥料的蔬菜. □1 □2 □3 □4. 水果？ c3. 請問您常不常為了環保而減少開汽機車？. □1 □2 □3 □4. 政治大. d3. 請問您常不常為了環保而減少家裡使用的能源或燃（油）料？. 立. □1 □2 □3 □4 □1 □2 □3 □4. f3. 請問您常不常為了環保而刻意不買某些產品？. □1 □2 □3 □4. ‧. ‧ 國. 學. e3. 請問您常不常為了環保刻意節約用水或重複用水？. n. er. io. sit. y. Nat. al. Ch. engchi. 41. i Un. v.

(43) 第一節分析過程由於我們是針對二元反應的問項來進行探討，故先把前兩個題組中，回答" 多次"以及"曾有過"的資料合併，並將回答這兩個選項皆視為給予正向答案；同樣地將第三個題組中，回答"總是"、"經常"以及"有時"的資料合並視為正向答案後，再計算各問項正向答題比例如表 4.4、表 4.5 和表 4.6。從第一個題組發現在 2146 位受試者當中，只有 7.59%的人給予問項 a1 正向回答，2.00%給予問項 b1 正向回答，8.85%給予問項 c1 正向回答，8.85%給予問項 d1 正向回答；第二個題組顯示 2146 位受試者當中，只有 6.57%的人給予問項. 治政 a2 正向回答，13.79%給予問項 b2 正向回答，10.11%給予問項大 c2 正向回答，6.84% 立給予問項 d2 正向回答；第三個題組可以看到問項 a3、b3、c3、d3、e3、f3 的正 ‧ 國. 學. 向回答比例分別為。在前兩個題組中，由於受試者給予問項正向回答的機率皆偏. ‧. 低，表示問項難度比較高(偏右)；而在第三個題組中，受試者給予問項正向回答. io. sit. y. Nat. 的機率屬於偏高情況，因此問項難易度偏低(偏左)。. n. al. er. (1) 在過去的一年，您有沒有採取下列的方法表達意見或提出要求？. Ch. i Un. v. 表 4.4 各問項的正向回答比例(題組-1). P(%). engchi. a1. b1. c1. d1. 7.59. 2.00. 8.85. 5.59. (2) 在最近幾年的選舉中，您有沒有做過以下這些事情？表 4.5 各問項的正向回答比例(題組-2). P(%). a2. b2. c2. d2. 6.57. 13.79. 10.11. 6.84. 42.

(44) (3) 環保行為表 4.6 各問項的正向回答比例(題組-3). P(%). a3. b3. c3. d3. e3. f3. 98.24. 61.92. 67.71. 85.45. 84.44. 78.39. 利用自動化問項篩選工具篩選問項結果如表 4.7、表 4.8 和表 4.9(1 代表有被分到第一尺度量表，0 則否)，第一個題組 4 個問項中，問項 a1、b1、d1 被歸屬為第一尺度量表，只有問項 c1 被剔除；而第二個題組中，4 個問項皆被分. 政治大. 到第一尺度量表；在第三個題組中，也是所有 6 個問項皆被選入第一尺度量表。. 立. ‧ 國. 學. (1) 在過去的一年，您有沒有採取下列的方法表達意見或提出要求？表 4.7 利用自動化問項篩選工具篩選結果(題組-1). n. al. c1. 透過網際網路反映意見。. Ch. y. 1. er. io. b1. 向大眾媒體投訴。. 1. sit. ‧. Nat. a1. 向政府官員、民意代表或政黨反映意見提出要求。. engchi. i Un. Scale. v. d1. 參加遊行、示威、靜坐或其他自力救濟方式。. 0 1. (2) 在最近幾年的選舉中，您有沒有做過以下這些事情？表 4.8 利用自動化問項篩選工具篩選結果(題組-2). Scale a2. 捐錢給候選人或政黨（包括購買餐卷、紀念品等）。 1 b2. 參加為候選人而舉辦的集會或餐會活動。. 1. c2. 配戴或懸掛候選人的標誌與旗幟。. 1. d2. 擔任候選人或政黨的助選人員或義工。. 1. 43.

(45) (3) 環保行為表 4.9 利用自動化問項篩選工具篩選結果(題組-3). Scale a3. 請問您常不常為了資源回收特地對玻璃、鋁罐、塑膠或報紙作分. 1. 類？ b3. 請問您常不常特地去買沒有用農藥或化學肥料的蔬菜水果？. 1. c3. 請問您常不常為了環保而減少開汽機車？. 1. d3. 請問您常不常為了環保而減少家裡使用的能源或燃（油）料？. 1. 政治大 f3. 請問您常不常為了環保而刻意不買某些產品？立. e3. 請問您常不常為了環保刻意節約用水或重複用水？. 1 1. ‧ 國. 學 ‧. 利用自動化問項篩選工具篩選出第一尺度量表的問項後，針對此量表再計算各問項的 H i 值，如表 4.10、表 4.11 和表 4.12。從這三個表可以發現所有被選. y. Nat. n. al. er. io. 違反篩選條件。. sit. 進第一尺度量表的問項的 H i 值皆大於 0.3，因此這三個題組中，沒有任何問項有. Ch. engchi. i Un. v. (1) 在過去的一年，您有沒有採取下列的方法表達意見或提出要求？表 4.10 問項量表係數(題組-1). 第一尺度量表. Hi. a1. b1. d1. 0.3692707 0.4024607 0.3068433. (2) 在最近幾年的選舉中，您有沒有做過以下這些事情？表 4.11 問項量表係數(題組-2). 第一尺度量表. Hi. a2. b2. c2. d2. 0.4204969 0.614099 0.540304 0.5156346 44.

(46) (3) 環保行為表 4.12 問項量表係數(題組-3). 第一尺度量表. a3. b3. c3. d3. e3. f3. Hi. 0.559. 0.363. 0.437. 0.489. 0.433. 0.430. 第二節資料推論在第三章模擬資料時，我們皆使用邏輯斯模型來給定每個問項正向回答機率. 政治大. 值，來產生有次序性的資料，但由於 Mokken 量表分析是一種無母數的分析方法，. 立. 我們無法得知實際上問卷資料的問項反應函數的模型，即使知道其模型也無從得. ‧ 國. 學. 知模型中的參數值，因此不能將問卷明確地歸屬於哪一種模擬情況。以下我們利用自動化問項篩選工具將問項分到第一量表的比例大小，推估資料近似的模擬情. ‧. 況，在做後續的推論以及討論。. n. al. Ch. engchi. er. io. sit. y. Nat 第一個題組：(1)向政府反映意見的方式. i Un. v. 由於問項正向回答的比例皆低，而利用自動化問項篩選工具進行問項篩選結果為 4 個問項有 3 個問項被選入第一尺度量表，而三問項中違反篩選條件的問項個數為 0。這個例子似乎類似於第三章中問項分佈偏右、問項難易分佈範圍[0,3]、.   1.25 且 5 個問項的模擬情況。在此情況的模擬結果顯示，平均而言 5 個問項會有 3.83 個被歸類為第一尺度量表，即大約有 76.6%的問項會被自動化問項篩選工具納入第一尺度量表。至於計算違反篩選條件的問項個數上，模擬結果顯示為 1000 次模擬中共有 124 個違反篩選條件的問項，代表平均而言有 0.124 個(不到一個)問項違反篩選條件。因此本題組的 4 個問項有 3 個被歸類為第一尺度量表，而這三個問項均無任何違反篩選條件的情形似乎是可以預期的。 45.

(47) 第二個題組：(2)對選舉的參予度此題組中，問項的正向回答比例也偏低，而自動化問項篩選工具進行問項篩選的結果為 4 個問項都被選進第一尺度量表，且無違反篩選條件的問項。此情形似乎類似於第三章中問項分佈偏右、問項難易分佈範圍[-0.5,2.5](或[0,3])、.   1.5 且問項個數為 5 的模擬情況。因為在此情況的模擬結果顯示，平均而言 5 個問項中有 4.99(或 4.88)個被選入第一尺度量表，也就是說幾乎所有問項都被自動化問項篩選工具納入第一尺度量表，此外 1000 次模擬實驗中總計共有 2(或 54)個問項違反篩選條件，代表平均每次有 0.002 或 0.054 個(不到 1 個)問項違. 治政反篩選條件。因此，本題組的 4 個問項全被歸類為同一量表，而問項皆無任何違大立反篩選條件的情形，應該也是可以預期的。 ‧ 國. 學. 第三個題組：(3)環保行為. ‧. sit. y. Nat. 第三個題組的分析過程中我們發現，給予問項正向回答的比例皆偏高，利用. io. er. 自動化問項篩選工具進行篩選的結果為 6 個問項皆被選進第一尺度量表中，且沒有任何違反篩選條件的問項。此結果似乎類似於第三章中問項偏左、問項難易分. al. n. iv n C 佈範圍[-1.75, 1.25]、   1.5 且問項個數為 U h e n g c h5i的模擬情況。因為這個情況的模擬結果為，所有問項皆被自動化問項篩選工具選入第一尺度量表，且在這第一尺度量表中，沒有出現任何違反篩選條件的問項。因此，此題組所有問項皆歸類為第一尺度量表且無任何違反篩選條件的問項，也是可以預期的。. 46.

(48) 第三節結論由第三章模擬結果，我們得知在設計一份問卷時，若問項(題目)的鑑別度太低，即  太小，或是題目偏左或是偏右，自動化問項篩選工具在篩選問項時，所產生的違反篩選條件( H i  0.3 )問項個數都會增加。前述的三個題組中，前兩個屬於偏右情況，第三個屬偏左情況，在第三章模擬得知若問項越偏右或偏左，利用自動化問項篩選工具篩選出的問項個數也會逐漸遞減。由於第一個題組問項的正向比例比第二個題組要來的小，表示偏右的程度比較大，且第一個題組被選入第一尺度量表的個數比第二個題組少；第三個. 治政題組比例偏左但問項的正向比例也無第一個題組那樣極端，表示偏左程度不大，大立所以第一個題組被選入第一尺度量表的比例也比第三個題組要來的小，這樣的結 ‧ 國. 學. 果顯然與模擬結果互相輝映。. ‧. 由於第一個題組似乎近似於問項難易分佈範圍[0,3]，且   1.25 的模擬情. y. Nat. 境，第二個題組較類似問項難易分佈範圍[-0.5,2.5](或[0,3])、而   1.5 的模. io. sit. 擬情境，第三個題組則是比較接近於問項難易分佈範圍[-1.75, 1.25]、   1.5. er. 的模擬情境。由於第二、第三個題組之問項的  和 H i 都比較大，表示這兩份問. al. n. iv n C 卷的問項鑑別度以及同質性較之於第一個題組來的好， h e n g c h i U 此外由於三個題組問項皆只有 4 題或 6 題，問項個數較少，因此違反篩選條件的問項也較少。因此除非問項很多，否則被判定為違反篩選條件的問項數也不會太多。. 47.

(49) 第五章結論與建議本章將針對第三、四章的模擬實驗與實證分析的研究分析結果作統整，並給予後續研究者適當的建議，提供研究者在分析有次序性(強弱性)的資料時，面對受試者給予正向回答機率都偏小(偏大)的情況下，利用自動化問項篩選工具篩選問項的一些參考。. 第一節分析結論. 政治大項時，自動化問項篩選工具是最常被使用的工具之一。然而使用自動化問項篩選立. 想要由一份有次序性(強弱性)的問卷中，篩選出符合 Mokken 尺度量表的問. ‧ 國. 學. 工具所篩選出來的問項中，仍不免可能納入違反條件( H i  0.3 )的問項。再者，若受試者給予問項正向回答的機率都偏低(高)時，對於問項篩選的可信度與否，. ‧. 是否雪上加霜，導致建構出來的量表無法適切的測量出受試者的潛在特質。因此. sit. y. Nat. 本研究重點為藉由自動化問項篩選工具篩選問項時，針對問項正向回答的機率偏. n. al. er. io. 低(或高)時所可能衍生出來的問題進行探討，以便給予研究者一些參考意見。. i Un. v. 模擬結果顯示，當碰到問項機率都偏低(偏高)的問卷時，若想要利用自動化. Ch. engchi. 問項篩選工具來篩選出適當的問項，關鍵仍在於問項的鑑別度。問項設計的鑑別度過低，則自動化問項篩選工具幾乎無法發揮其效用。問項設計的鑑別度越高，則自動化問項篩選工具篩選到不適當的問項的可能性也會大幅下降。問卷的問項數目越大時，鑑別度越顯重要。本研究所使用的實證問卷資料為「中央研究院人文社會科學研究中心社會變遷五期一次、六期一次-綜合問卷組」三組有關政治參予以及環保行為議題的題組資料。研究結果顯示，儘管三個題組資料中，受試者給予正向回答的比例都偏低或偏高，但由於這三個題組問項不多，且利用自動化問項篩選工具來篩選問項時，皆沒有出現違反篩選條件的問項，也就是自動化問項篩選工具沒有犯任何錯。 48.

(50) 此結果類似於問項難易分佈範圍[0,3]、  1.25 而問項個數為 5，問項難易分佈範圍[-0.5,2.5](或[0,3])、  1.5 搭配 5 個問項，以及問項難易分佈範圍[-1.75, 1.25]、   1.5 且問項個數為 5 的模擬結果。因此，這三個題組所分別篩選出來的問項，應該可以視為 Mokken 量表。. 第二節建議與改進本研究主要是針對 Mokken 尺度分析中，MH 模型的資料下進行探討。研究結果顯示，當問項分佈偏左(正向回答機率偏高)或偏右(正向回答機率偏低)時，利用自動化問項篩選工具來進行問項篩選，出現有違反篩選問項條件的個數會隨. 治政之增加。但由我們只侷限於 2 個問項反應選項(1 或大0)，再者由於時間所限，儘立管我們的模擬設計盡可能一般化，但也只能針對三種問項個數和四個 alpha 值來 ‧ 國. 學. 進行探討，因此在做結論上明顯還是有所不足。針對這些不足之處，我們提出下. ‧. 面三點建議，做為後續研究的參考。. sit. y. Nat. 1. 現今問卷的問項反應選項大多會超過 2 個，因此未來可以試著對 2 個選項以. io. er. 上的試題的情況來進行研究。. 2. 而 alpha 值的選取上，可以在這 4 個值中間再多選幾個值，甚至可以考慮更. n. al. Ch 多大於 1.5 的值來做討論。. engchi. i Un. v. 3. 可以利用更多指標來探討不同問項難易分佈所篩選出的量表之合適性，例如：總量表係數的變化等。. 49.

(51) 參考文獻章英華、傅仰止(2006)。台灣社會變遷基本調查五期一次、六期一次-綜合問卷組(C00153_1)【原始數據】。取自中央研究院人文社會科學研究中心調查研究專題中心學術調查崖舊資料庫 http://srda.sinica.edu.tw。dio:10.6141/TW-SRDA-C00153_1-1。 Birnbaum, A.(1968). Some latent trait models and their use in inferring an examinee's ability. In F. M. Lord & M. R. Novick , Statistical theories of mental test scores (pp. 397-472). Reading, MA: Addison-Wesley. Bouwmeester, S. & Sijtsma, K. (2006). Constructing a transitive reasoning test for 6 - to 13 year old children. European Journal of Psychological Assessment, 22, 225-232. Gillespie, M. W., Tanvergert, E. & Kingma, J (1987, 1988). Abortion Attitudes: Effects of item Order. 政治大. and dimensionality. Perceptual and Motor Skills (Volume 74, Issue , pp. 627-642.) Grayson, D. A. (1988). Two-group classification in latent trait theory: Scores with monotone likelihood. 立. ratio. Psychometrika, 53, 383-392.. ‧ 國. 學. Guttman, L. (1950). The utility of scalogram analysis. In S. A. Stouffer, L. Guttman, E. A. Suchman, P. F. Lazarsfeld, S. A. Star, & J. A. Clausen(Eds.), Measurement and prediction . Studies in Social Psychology in World War Ⅱ (Vol. 4, pp. 122-171). New York, NY: Wiley.. ‧. Hemker, B. T., Sijtsma, K., Molenaar, I. W. & Junker, B. W. (1996), Polytomous IRT models and monotone likelihood ratio of the total score. Psychometrika, 61, 679-693.. y. Nat. io. er. analysis" and factor analysis. Psychological Bulletin, 45, 507-530.. sit. Loevinger, J. (1948), The technique of homogeneous tests compared with some aspects of "scale. Meijer, R. R. & Baneke J. J. (2005). Analyzing psychopathology items: A case for nonparametric item. al. n. iv n C h eofnscale Mokken, R. J. (1971). A theory and procedure With application in political research. hi U g canalysis. response theory modeling. Psychological Methods, 9, 354-368.. Berlin, Germany: De Gruyter (Mouton). Mokken, R. J., Lewis, C. & Sijtsma, K. (1986). Rejoinder to "The Mokken scale: A critical discussion. " Applied Psychological Measurement,10, 279-285. Molenaar, I. W. (1991). A weighted Loevinger H-coefficient extending Mokken scaling to multicategory items. Kwantitatieve Methoden, 12(37), 97-117. Molenaar, I. W. & Sijtsma, K. (2000). User's manual MSP5 for Windows. Groningen: iecProGAMMA. Sijtsma, K. & Junker, B. W. (1996) A survey of theory and methods of invariant item ordering. British Journal of Mathematical and Statistical Psychology, 49, 79-105.. 50.

(52) 附錄 ## items items <- data.frame(c(5,9,17)) a <- function(items)(seq(from= -1.5, to=1.5, length=items)) out.items <- apply(items,1,a) out.items n.items <- c(5,9,17) n.items. ## alphas alphas_5 <- rep(1.5,5) alphas_8 <- rep(1.5,9). 立. alphas_10 <- rep(1.5,17). 政治大. ‧ 國. out.alphas. 學. out.alphas<- list(alphas_5,alphas_8,alphas_10). n.alphas <- c(5,9,17). sit. n. al. er. io. m=1000. y. Nat. ## 加入模擬次數 m. ‧. n.alphas. Answers_SIM=NULL Answers_SIM=list() Answers_SIM2=NULL. Ch. engchi. Answers_SIM2=list() Answers_SIM3=NULL Answers_SIM3=list() #Answers_SIM4=NULL #Answers_SIM4=list() #Answers_SIM5=NULL #Answers_SIM5=list() #Answers_SIM6=NULL #Answers_SIM6=list(). for (k in 1:m){. 51. i Un. v.