第一章 緒論
本研究旨在利用模擬方式探討各計分方式,在做問卷、測驗或是調查時,李 克特式量表廣泛的應用在各個領域,跟二元計分的二選一相比之下,李克特式量 表在訊息收集上雖然較多,但用此仍不足以完整表達受試者的感受,因此本研究 以模擬的方式進行無限多點計分並與上述兩種傳統計分的作答結果進行比較分 析。
本章分為研究背景與動機和研究目的兩節進行敘述。
第一節 研究背景與動機
進行測驗時,從早期開始都是以紙筆方式進行,而問卷方面還有郵寄、電話 訪問等方式,在電腦和網際網路發達的現代,直接在電腦上作答可記錄作答過程 和節省人力,在應用上較具靈活性。
近年來網路的技術進步之快,在網路上收集資訊的方式逐漸普及,不能只限 於傳統的紙筆上,線上作答方式藉由記錄作答的過程以及作答時間,對於判斷受 試者在猜題的部分也比較容易分辨,而異常的樣本或是無效樣本也可用此判斷 (王立翔,2013),在沒有時間和空間的限制下,大樣本的施測和特定研究的進行 也不再困難(Birnbaum, 2004)。
一般在學校裡為理解學生的學習狀況,最常用且有效的方法就是進行測驗,
了解學生「會多少」外,更想知道學生「不會什麼」 (劉湘川、簡茂發與林原宏,
1993),這樣可以讓學生自行改進錯誤概念(陳世銘,2004)。在學校測驗或是心 理問卷,作答方式不外乎有二選一的是非題、四選一或多選一的選擇題、選答題
2
等類型,若依據試題所作答的結果為非此即彼的二選一的作答方式(王朝正,
2002),試題測驗屬於二元計分模式,為二選一或是多選一的作答方式,雖然應 用方便但並不排除在作答過程中有猜題的可能性。
傳統的問卷在量表的選擇上大多使用李克特氏量表,在量化方面,普遍以
四、五或六點做為選項,可說明受試者態度之強弱或針對該量表欲測目的之程度 (梁文敏、葉懿諄,2010)。每個人對於這些沒意見、滿意、優劣等語意的認知會 因為各人喜好、教育水平、生長背景和環境的差異而有所不同,縱使選擇相同選 項的受試者們其感受程度也未必相同 (楊明慧,2002)。
做研究時都所收集的樣本數量至少要足以支持其理論能行,但要收集到一定 量的樣本數要使用大量人力與物力才能得到,在時間上也有所限制,依照研究的 性質或規模不同,受試者的年齡層、性別或職業也有所不同,不論是測驗或是心 理問卷,在整裡回收的試卷時都要先將掉無效的刪除,和實證研究不同,模擬研 究不需收集樣本,其結果都是使用模擬出的樣本得來的,所以不需考慮樣本數,
且實證研究常受到抽樣差異或施測過程的影響,使得無效樣本增加,導致結果不 如預期,也因此模擬被廣泛的應用在各個領域。
綜合上述幾點,本研究團隊設計出拉條試作答,是一種可用於心裡量表和測 驗上的作答方式,操作容易的作答方式,提供受試者在做作答時能有接近無限項 的選擇,在理論上為無限多點,但考量到電腦設備且一般受試者可能對定的數字 有所偏好,導致受試者只用到十點或二十點,因此,本研究以分為一百等分的無 限多點計分量表為例,希望藉此獲得比傳統量表更準確的訊息。
第二節 研究目的
依據上述動機,本研究以模擬的方式進行,模擬資料的部分選擇蒙地卡羅模 擬法( Monte Carlo simulation method),經過標準化後,模擬的資料成為二元計
3
分(binary Scoring)、多元計分(multiple Scoring)和無限多點計分(unlimited multiple Scoring)的作答結果,在不同樣本數、題數多寡、交互驗證法取值以及不同相關 程 度 資 料 等 各 種 情 境 下 比 較 各 種 作 答 結 果 在 λ 測 度 (λ-measure) 、 P 測 度 (P-measure)、L 測度(L-measure)、伸展型 L 測度(extensional L-measure)等四種測 度以及脊迴歸(ridge regression)和複迴歸(multiple linear regression)等兩種回歸下 分析出來的均方誤差 MSE (Mean Square Error, 縮寫為 MSE)值。
以下將本研究目的條列如下:
一、比較三種計分方式在不同樣本數量下的 MSE 值。
二、比較三種計分方式在不同題數數量下的 MSE 值。
三、在交互驗證法所用的 K 值不同對 MSE 值的差異。
四、比較三種計分方式在資料的相關程度不同時所得到的比較結果是否有差異。
4
5