• 沒有找到結果。

Rasch 模式在麻醉學領域應用

如前所述,Rasch 模式是試題反應理論中,利用單參數模式來作為測驗分析 的一種的心理計量方法(Andrich, 1988; Bond & Fox, 2007),在醫學領域上的應用 範圍不斷擴展,但在麻醉學方面仍然少見,可分為測驗試題的分析(K. Y. Chang et al., 2010; Yang, Tsou, Chen, Chan, & Chang, 2011)與疼痛測量工具的發展與評估 (Amtmann et al., 2010; Revicki et al., 2009; Varni et al., 2010)兩大類,分別敘述如 下:

II.4.1 Rasch 模式於麻醉學測驗應用

關於 Rasch 模式在麻醉學測驗應用的三項研究分別包括經食道超音波測驗 (Aronson et al., 2002),醫學生麻醉學期末考(Yang et al., 2011)以及麻醉專科醫師 考試(K. Y. Chang et al., 2010)。Chang 等人將麻醉專科筆試結果,利用 Rasch 模式 將試題難度與考生能力用相同尺度測量,並且評估題目的合適度,同時也檢驗出 題者設定的難度與 Rasch 模式分析的一致性,並且模擬去除極度困難及容易的題 目後,對於測驗結果信度(reliability)的影響。在 100 道題目當中,所有考生全部 都答對的共有 17 題,另外有一題因為配適度不佳而排除分析,題目與考生的信 度指數(Reliability index)分別是 0.87 與 0.71,考生的平均能力比試題的平均難度 高出 1.28 個 logit 單位,表示考生平均可以答對 78%的題目,試題難度從-2.43 到 4.25,代表在平均考生能力情況下,被答對的機率分別從 98%到 5%不等。

16

進一步的 Rasch 分析顯示有 60 道題目的難度低於能力最差的考生,有 7 道 題目的難度高於能力最好的考生,其他 32 道題目的難度分布在所有考生的範圍 中,由於難度與考生能力範圍相符的題目提供最多訊息,將極容易和極困難的題 目去除並不會明顯影響考生能力的估計值。此外,單因子變異數分析(One-way ANOVA)顯示不同出題者的題目難度有明顯差異,出題者自訂的題目難度和 Rasch 分析結果的一致性不高,加權 Kappa 統計檢定值為 0.23。

Yang 等人對於醫學生在麻醉學期末測驗的結果以 Rasch 模式分析(Yang et al., 2011),評估考生能力、題目難度以及測驗的信度,並且評估題目的配適度,將 配適度不佳的考生與題目排除後,測驗的信度指數只有 0.63,利用

Spearman-Brown 預測公式計算,在相同試題品質的情況下,增加試題數目到 70 題,測驗信度指數才能達到 0.7,若是題目增為兩倍時的測驗信度指數為 0.77,

若要信度指數要達到 0.8,此測驗的題目至少需增為 120 題。

相對而言,Aronson 等人並未針對測驗題目進行試題分析,而僅是在研究方 法中提到 Rasch 分析法,在其他專科考試方面,Garibaldi 等人研究利用 Rasch 分 析將內科考生的能力轉換成標準化的分數,並和受訓期間的測驗分數作比較 (Garibaldi, Subhiyah, Moore, & Waxman, 2002),但一樣沒有注重在試題分析上,

此外,O’Neil 等人使用 Rasch 模式來重新分析美國護士執照考試結果,來決定新 的通過標準(O'Neill, Marks, & Reynolds, 2005)。

除了麻醉學測驗之外,Chang 等人(2011)也曾使用 Rasch 模式來分析影響產 婦對於減痛分娩態度的因素,利用原本以多屬性效用分析理論(Multiattribute Utility)模式所建構的問卷資料(K.-Y. Chang, Chan, Chang, Yang, & Chen, 2008),將 產婦對於 20 項題目的測量結果重新分類,使得分成十等級的多面向反應,濃縮 簡化為四等級的單一面向反應,在排除配適模式程度不佳的產婦及題目後,估計 出每一位產婦對於減態分娩態度的分數,以及各項題目影響程度的參數,不同等 級反應之間的閾值。在 167 位問卷填答完成的產婦中,有 3 位產婦及 11 項題目

17

因配適度不佳而被排除,兩種版本的問卷信度指數分別為 0.68 和 0.74,彼此之 間的相關係數是 0.89,ROC (Receiver Operating Characteristics)曲線下的面積分別 是 0.80 和 0.81,因此透過 Rasch 模式分析可了解簡化版本問卷的內容,沒有明 顯改變其信度和效度。

18

III 材料與方法

相關文件