研究結論

第五章結論與建議

第一節研究結論

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y 第五章結論與建議

第一節研究結論

當研究者對於人類某項難以直接測量的潛在特質有興趣時，通常可以透過受試者對於測驗或問卷的回答，利用試題反應理論的相關模型，達到衡量受試者潛在特質的目的。試題反應理論又有有母數與無母數之分，然而有母數試題反應理論的模型假設較嚴格，在分析實務資料上常常難以完全符合，因此研究者可改採假設條件較寬鬆的無母數試題反應理論模型進行分析，其中摩根量表的相關模型近年來常被使用。

摩根量表分析方法是先檢驗測驗或問卷中的試題與資料滿足摩根量表相關模型假設後，利用受試者對於試題的回答總分來排序受試者潛在特質的大小。

對於多元計分的試題，研究者可能維持多元計分的資料格式進行分析，獲得每位受試者的多元計分總分以做推論；研究者也可能選擇將每題多元計分試題轉化為二元計分的形式，得到受試者的二元計分總分以進行推論。

然而，摩根量表僅在二元計分試題時具有 MLR 與 SOL 性質，可藉以提供利用試題的回答總分來排序受試者潛在特質的合理性；而多元計分試題則只在滿足有母數試題反應理論中的 PCM 或其特例 RSM 下才具有 MLR 與 SOL 性質。即使如此，這些性質僅說明平均而言可透過受試者對於試題的回答總分以排序其潛在特質的大小。因此我們想知道，縱然理論支持可以利用試題的回答總分來排序受試者潛在特質(具有 MLR 與 SOL 性質時)，實務上使用多元計分總分或二元計分總分來排序受試者潛在特質的排序正確程度究竟如何；另一方面，也想了解使用多元計分總分是否比使用二元計分總分在排序受試者的潛在特質上更加地準確。

藉由模擬結果我們可以發現，使用多元計分總分排序受試者潛在特質的整體正確率有 75%以上，且隨著試題數增加或反應類別數上升，多元計分總分的排序整體正確率會上升。當試題階段式反應函數參數呈現常態分佈時，通常使

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

用多元計分總分排序受試者潛在特質可獲得較高的整體正確率，整體正確率的變動也較小；在試題數十題，每題五反應類別時，試題階段式反應函數參數常態分佈下，整體正確率都在 90%以上。

當選擇將每題多元計分試題轉化為二元計分的形式，使用二元計分總分來排序受試者潛在特質時，由於每題反應類別數愈多，多元計分轉化為二元計分的方式就愈多，而不同的轉化方式對於二元計分總分排序受試者潛在特質的整體正確率會有所影響。整體而言，在試題數少時，不同的轉化方式在不同的參數分佈下的整體正確率表現不一，不過在參數為常態分佈時整體正確率的標準差都最小，整體正確率最為穩定。在試題數只有三題時，當轉化為二元計分的方式是將大部分多元計分分數高的部分視為「1」，如三反應類別時的(0, 1 ,1)、

四反應類別的(0, 1, 1, 1)與五反應類別的(0, 1, 1, 1, 1)轉化方式，會出現在試題階段式反應函數參數為右偏分佈時，容易得到較高的整體正確率，但出現的整體正確率較不穩定；當轉化為二元計分的方式是將大部分多元計分分數低的部分都視為「0」時，如三反應類別的(0, 0 ,1)、四反應類別的(0, 0, 0, 1)與五反應類別的(0, 0, 0, 0, 1)轉化方式，則當試題階段式反應函數參數為左偏分佈時，易於獲得較高的整體正確率，雖然整體正確率一樣較不穩定；而當多元計分轉化為二元計分的方式較平均時，例如四反應類別的(0, 0, 1, 1)、五反應類別的(0, 0, 1, 1, 1)與(0, 0, 0, 1, 1)轉化方式，則在試題階段式反應函數參數常態分佈時，可獲得較高又較穩定的整體正確率。當試題數增加時，如試題數為五題或十題，

則大致上不同的轉化方式在參數為常態分佈時的整體正確率較高且最穩定。

此外，我們也發現無論反應類別數為何，當多元計分轉化為二元計分的方式較平均時，通常整體正確率表現最好，大體上而言整體正確率較高且變異小。

而使用二元計分總分排序受試者潛在特質的整體正確率也都在 75%以上，

隨著試題數上升，普遍而言整體正確率也有上升的趨勢，且其標準差會下降，

只有當試題數較少，轉化方式較極端且恰好遇到相應的試題階段式反應函數參

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

數分佈設計時，例如五反應類別的轉化方式為(0, 0, 0, 0, 1)且參數設計為左偏分佈下，在題數三題上升到五題時，整體正確率反而下降，雖然穩定度依然上升。

當每題反應類別數愈多，使用二元計分總分排序受試者潛在特質通常也會得到較高的整體正確率。模擬結果中，二元計分總分排序受試者潛在特質的整體正確率最高也可達到 90%以上。

然而，與使用多元計分總分排序受試者潛在特質的整體正確率相比，二元計分總分排序受試者潛在特質的整體正確率通常標準差較大，不如使用多元計分總分時穩定。

由於使用多元計分總分能夠排序的兩兩配對受試者通常遠高於使用二元計分總分可排序的兩兩配對受試者，且使用這兩種計分方式分別能排序的兩兩配對受試者並非完全一致，因此整體正確率事實上只提供在本研究設計的試題數、反應類別數與階段難度參數值下，使用多元計分總分或二元計分總分排序受試者潛在特質的一個正確程度範圍，並不表示使用多元計分總分或二元計分總分在排序受試者潛在特質的優劣。

針對使用多元計分總分是否比使用二元計分總分在排序受試者的潛在特質上更加準確的問題，我們定義「條件正確率」作為判斷的工具，主要透過多元與二元兩種計分總分均可排序的受試者配對中，使用多元計分總分排序正確的比例與使用二元計分總分排序正確的比例進行比較，並將個別計分總分額外能排序的受試者配對中排序正確的比例做為參考。

我們發現在多元計分試題的回答來自具有 MLR 與 SOL 性質，同時也會滿足摩根量表的部分計分模型時，模擬結果顯示，不論試題數、反應類別數、試題階段式反應函數參數值或多元計分轉化為二元計分的方式為何，整體而言呈現兩種計分總分共同可排序的部分，多元計分總分排序正確的比例都不低於二元計分總分排序正確的比例，且兩種計分總分個別額外可排序部分的正確率亦是多元計分總分較高。而隨著試題數或反應類別數上升，多元計分總分與二元計分總分在這些正確率的差距會更為明顯。此外，當多元計分轉化為二元計分

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

的方式較平均時，如四反應類別的(0, 0, 1, 1)、五反應類別的(0, 0, 1, 1, 1)與(0, 0, 0, 1, 1)轉化方式，多元計分總分的這兩部分排序正確率會較接近二元計分總分的正確率。

因此在條件正確率的定義下，確實呈現多元計分總分比二元計分總分在排序受試者的潛在特質上更加準確，至少在兩種計分總分均可排序的受試者配對部分是如此。然而，需特別注意，這兩種計分總分個別額外可排序的部分依然是不同的受試者，因此雖然多元計分總分在此部分排序正確比例也較高，但無法保證若研究者的目的是找出潛在特質較高的一群受試者時，透過多元計分總分所選取的受試者在潛在特質上表現一定比使用二元計分總分所選取的受試者好。

另一方面，我們也嘗試同時使用來自同一組資料的多元計分總分與二元計分總分提供的訊息，希望能夠藉由結合總分這種定義方式來同時排序更多受試者潛在特質。透過模擬結果我們發現，在相鄰的結合總分上，並不保證結合總分高的受試者其平均潛在特質一定不低於結合總分低的受試者，因此這也限制了同時使用多元計分總分與二元計分總分以排序更多受試者潛在特質的可行性。

在文檔中摩根量表分析：多元計分試題下受試者潛在特質排序之相關探討 - 政大學術集成 (頁 98-101)

第五章 結論與建議

第一節 研究結論

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y 第五章 結論與建議

第一節 研究結論

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第五章結論與建議

第一節研究結論

立政治大學

l C h engchi U ni ve rs it y 第五章結論與建議

第一節研究結論

立政治大學

立政治大學

立政治大學