第五章 結論與建議
第一節 研究結論
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y 第五章 結論與建議
第一節 研究結論
當研究者對於人類某項難以直接測量的潛在特質有興趣時,通常可以透過 受試者對於測驗或問卷的回答,利用試題反應理論的相關模型,達到衡量受試 者潛在特質的目的。試題反應理論又有有母數與無母數之分,然而有母數試題 反應理論的模型假設較嚴格,在分析實務資料上常常難以完全符合,因此研究 者可改採假設條件較寬鬆的無母數試題反應理論模型進行分析,其中摩根量表 的相關模型近年來常被使用。
摩根量表分析方法是先檢驗測驗或問卷中的試題與資料滿足摩根量表相 關模型假設後,利用受試者對於試題的回答總分來排序受試者潛在特質的大小。
對於多元計分的試題,研究者可能維持多元計分的資料格式進行分析,獲得每 位受試者的多元計分總分以做推論;研究者也可能選擇將每題多元計分試題轉 化為二元計分的形式,得到受試者的二元計分總分以進行推論。
然而,摩根量表僅在二元計分試題時具有 MLR 與 SOL 性質,可藉以提供 利用試題的回答總分來排序受試者潛在特質的合理性;而多元計分試題則只在 滿足有母數試題反應理論中的 PCM 或其特例 RSM 下才具有 MLR 與 SOL 性 質。即使如此,這些性質僅說明平均而言可透過受試者對於試題的回答總分以 排序其潛在特質的大小。因此我們想知道,縱然理論支持可以利用試題的回答 總分來排序受試者潛在特質(具有 MLR 與 SOL 性質時),實務上使用多元計分 總分或二元計分總分來排序受試者潛在特質的排序正確程度究竟如何;另一方 面,也想了解使用多元計分總分是否比使用二元計分總分在排序受試者的潛在 特質上更加地準確。
藉由模擬結果我們可以發現,使用多元計分總分排序受試者潛在特質的整 體正確率有 75%以上,且隨著試題數增加或反應類別數上升,多元計分總分的 排序整體正確率會上升。當試題階段式反應函數參數呈現常態分佈時,通常使
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
87
用多元計分總分排序受試者潛在特質可獲得較高的整體正確率,整體正確率的 變動也較小;在試題數十題,每題五反應類別時,試題階段式反應函數參數常 態分佈下,整體正確率都在 90%以上。
當選擇將每題多元計分試題轉化為二元計分的形式,使用二元計分總分來 排序受試者潛在特質時,由於每題反應類別數愈多,多元計分轉化為二元計分 的方式就愈多,而不同的轉化方式對於二元計分總分排序受試者潛在特質的整 體正確率會有所影響。整體而言,在試題數少時,不同的轉化方式在不同的參 數分佈下的整體正確率表現不一,不過在參數為常態分佈時整體正確率的標準 差都最小,整體正確率最為穩定。在試題數只有三題時,當轉化為二元計分的 方式是將大部分多元計分分數高的部分視為「1」,如三反應類別時的(0, 1 ,1)、
四反應類別的(0, 1, 1, 1)與五反應類別的(0, 1, 1, 1, 1)轉化方式,會出現在試題 階段式反應函數參數為右偏分佈時,容易得到較高的整體正確率,但出現的整 體正確率較不穩定;當轉化為二元計分的方式是將大部分多元計分分數低的部 分都視為「0」時,如三反應類別的(0, 0 ,1)、四反應類別的(0, 0, 0, 1)與五反應 類別的(0, 0, 0, 0, 1)轉化方式,則當試題階段式反應函數參數為左偏分佈時,易 於獲得較高的整體正確率,雖然整體正確率一樣較不穩定;而當多元計分轉化 為二元計分的方式較平均時,例如四反應類別的(0, 0, 1, 1)、五反應類別的(0, 0, 1, 1, 1)與(0, 0, 0, 1, 1)轉化方式,則在試題階段式反應函數參數常態分佈時,可 獲得較高又較穩定的整體正確率。當試題數增加時,如試題數為五題或十題,
則大致上不同的轉化方式在參數為常態分佈時的整體正確率較高且最穩定。
此外,我們也發現無論反應類別數為何,當多元計分轉化為二元計分的方 式較平均時,通常整體正確率表現最好,大體上而言整體正確率較高且變異 小。
而使用二元計分總分排序受試者潛在特質的整體正確率也都在 75%以上,
隨著試題數上升,普遍而言整體正確率也有上升的趨勢,且其標準差會下降,
只有當試題數較少,轉化方式較極端且恰好遇到相應的試題階段式反應函數參
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
數分佈設計時,例如五反應類別的轉化方式為(0, 0, 0, 0, 1)且參數設計為左偏分 佈下,在題數三題上升到五題時,整體正確率反而下降,雖然穩定度依然上升。
當每題反應類別數愈多,使用二元計分總分排序受試者潛在特質通常也會得到 較高的整體正確率。模擬結果中,二元計分總分排序受試者潛在特質的整體正 確率最高也可達到 90%以上。
然而,與使用多元計分總分排序受試者潛在特質的整體正確率相比,二元 計分總分排序受試者潛在特質的整體正確率通常標準差較大,不如使用多元計 分總分時穩定。
由於使用多元計分總分能夠排序的兩兩配對受試者通常遠高於使用二元 計分總分可排序的兩兩配對受試者,且使用這兩種計分方式分別能排序的兩兩 配對受試者並非完全一致,因此整體正確率事實上只提供在本研究設計的試題 數、反應類別數與階段難度參數值下,使用多元計分總分或二元計分總分排序 受試者潛在特質的一個正確程度範圍,並不表示使用多元計分總分或二元計分 總分在排序受試者潛在特質的優劣。
針對使用多元計分總分是否比使用二元計分總分在排序受試者的潛在特 質上更加準確的問題,我們定義「條件正確率」作為判斷的工具,主要透過多 元與二元兩種計分總分均可排序的受試者配對中,使用多元計分總分排序正確 的比例與使用二元計分總分排序正確的比例進行比較,並將個別計分總分額外 能排序的受試者配對中排序正確的比例做為參考。
我們發現在多元計分試題的回答來自具有 MLR 與 SOL 性質,同時也會滿 足摩根量表的部分計分模型時,模擬結果顯示,不論試題數、反應類別數、試 題階段式反應函數參數值或多元計分轉化為二元計分的方式為何,整體而言呈 現兩種計分總分共同可排序的部分,多元計分總分排序正確的比例都不低於二 元計分總分排序正確的比例,且兩種計分總分個別額外可排序部分的正確率亦 是多元計分總分較高。而隨著試題數或反應類別數上升,多元計分總分與二元 計分總分在這些正確率的差距會更為明顯。此外,當多元計分轉化為二元計分
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
89
的方式較平均時,如四反應類別的(0, 0, 1, 1)、五反應類別的(0, 0, 1, 1, 1)與(0, 0, 0, 1, 1)轉化方式,多元計分總分的這兩部分排序正確率會較接近二元計分總分 的正確率。
因此在條件正確率的定義下,確實呈現多元計分總分比二元計分總分在排 序受試者的潛在特質上更加準確,至少在兩種計分總分均可排序的受試者配對 部分是如此。然而,需特別注意,這兩種計分總分個別額外可排序的部分依然 是不同的受試者,因此雖然多元計分總分在此部分排序正確比例也較高,但無 法保證若研究者的目的是找出潛在特質較高的一群受試者時,透過多元計分總 分所選取的受試者在潛在特質上表現一定比使用二元計分總分所選取的受試 者好。
另一方面,我們也嘗試同時使用來自同一組資料的多元計分總分與二元計 分總分提供的訊息,希望能夠藉由結合總分這種定義方式來同時排序更多受試 者潛在特質。透過模擬結果我們發現,在相鄰的結合總分上,並不保證結合總 分高的受試者其平均潛在特質一定不低於結合總分低的受試者,因此這也限制 了同時使用多元計分總分與二元計分總分以排序更多受試者潛在特質的可行 性。