Rasch 模式在麻醉學領域應用 - 多階層Rasch模式於麻醉學筆試的應用

如前所述，Rasch 模式是試題反應理論中，利用單參數模式來作為測驗分析的一種的心理計量方法(Andrich, 1988; Bond & Fox, 2007)，在醫學領域上的應用範圍不斷擴展，但在麻醉學方面仍然少見，可分為測驗試題的分析(K. Y. Chang et al., 2010; Yang, Tsou, Chen, Chan, & Chang, 2011)與疼痛測量工具的發展與評估 (Amtmann et al., 2010; Revicki et al., 2009; Varni et al., 2010)兩大類，分別敘述如下：

II.4.1 Rasch 模式於麻醉學測驗應用

關於 Rasch 模式在麻醉學測驗應用的三項研究分別包括經食道超音波測驗 (Aronson et al., 2002)，醫學生麻醉學期末考(Yang et al., 2011)以及麻醉專科醫師考試(K. Y. Chang et al., 2010)。Chang 等人將麻醉專科筆試結果，利用 Rasch 模式將試題難度與考生能力用相同尺度測量，並且評估題目的合適度，同時也檢驗出題者設定的難度與 Rasch 模式分析的一致性，並且模擬去除極度困難及容易的題目後，對於測驗結果信度(reliability)的影響。在 100 道題目當中，所有考生全部都答對的共有 17 題，另外有一題因為配適度不佳而排除分析，題目與考生的信度指數(Reliability index)分別是 0.87 與 0.71，考生的平均能力比試題的平均難度高出 1.28 個 logit 單位，表示考生平均可以答對 78%的題目，試題難度從-2.43 到 4.25，代表在平均考生能力情況下，被答對的機率分別從 98%到 5%不等。

進一步的 Rasch 分析顯示有 60 道題目的難度低於能力最差的考生，有 7 道題目的難度高於能力最好的考生，其他 32 道題目的難度分布在所有考生的範圍中，由於難度與考生能力範圍相符的題目提供最多訊息，將極容易和極困難的題目去除並不會明顯影響考生能力的估計值。此外，單因子變異數分析(One-way ANOVA)顯示不同出題者的題目難度有明顯差異，出題者自訂的題目難度和 Rasch 分析結果的一致性不高，加權 Kappa 統計檢定值為 0.23。

Yang 等人對於醫學生在麻醉學期末測驗的結果以 Rasch 模式分析(Yang et al., 2011)，評估考生能力、題目難度以及測驗的信度，並且評估題目的配適度，將配適度不佳的考生與題目排除後，測驗的信度指數只有 0.63，利用

Spearman-Brown 預測公式計算，在相同試題品質的情況下，增加試題數目到 70 題，測驗信度指數才能達到 0.7，若是題目增為兩倍時的測驗信度指數為 0.77，

若要信度指數要達到 0.8，此測驗的題目至少需增為 120 題。

相對而言，Aronson 等人並未針對測驗題目進行試題分析，而僅是在研究方法中提到 Rasch 分析法，在其他專科考試方面，Garibaldi 等人研究利用 Rasch 分析將內科考生的能力轉換成標準化的分數，並和受訓期間的測驗分數作比較 (Garibaldi, Subhiyah, Moore, & Waxman, 2002)，但一樣沒有注重在試題分析上，

此外，O’Neil 等人使用 Rasch 模式來重新分析美國護士執照考試結果，來決定新的通過標準(O'Neill, Marks, & Reynolds, 2005)。

除了麻醉學測驗之外，Chang 等人(2011)也曾使用 Rasch 模式來分析影響產婦對於減痛分娩態度的因素，利用原本以多屬性效用分析理論(Multiattribute Utility)模式所建構的問卷資料(K.-Y. Chang, Chan, Chang, Yang, & Chen, 2008)，將產婦對於 20 項題目的測量結果重新分類，使得分成十等級的多面向反應，濃縮簡化為四等級的單一面向反應，在排除配適模式程度不佳的產婦及題目後，估計出每一位產婦對於減態分娩態度的分數，以及各項題目影響程度的參數，不同等級反應之間的閾值。在 167 位問卷填答完成的產婦中，有 3 位產婦及 11 項題目

因配適度不佳而被排除，兩種版本的問卷信度指數分別為 0.68 和 0.74，彼此之間的相關係數是 0.89，ROC (Receiver Operating Characteristics)曲線下的面積分別是 0.80 和 0.81，因此透過 Rasch 模式分析可了解簡化版本問卷的內容，沒有明顯改變其信度和效度。

III 材料與方法

在文檔中多階層Rasch模式於麻醉學筆試的應用 (頁 25-28)