• 沒有找到結果。

題目訊息(item information)的原理與應用

第二章 文獻查證

第十節 題目訊息(item information)的原理與應用

題目訊息函數(item information functions)在現代問卷的發展上扮演 很重要的角色 85,訊息函數可以讓研究者瞭解每一個題目在連續的能力 特質尺度的每一點所能提供的訊息18

相同題目對不同能力者而言其題目訊息量並不相同,因此即使是接 受相同的問卷,對不同能力者而言,他們的訊息量應該是不相同的。在 實際的應用上,因為題目的難易度很難同時適用於各種不同能力的受試 者,對高能力者而言,題目可能過於簡單而測不出其能力;對低能力者 而言,題目可能過難而也測不出其能力;只有當題目難易度與人的能力 相當時,才能較準確的測出其能力。因此IRT 的題目訊息量概念恰可以 反映出題目對不同能力者有不同測量訊息的現象。

Reeve(2007)提到題目訊息量可以看出哪些題目在不同的族群中有 最好的區辨能力,較高的訊息量代表較能準確的測量出一個人的能力程 度。訊息函數曲線可以用來看題目在不同的能力上的表現,這即是 CAT 模式與發展短式問卷中題目挑選過程的原理2

Gomez(2007)的研究中提到 IRT 中的題目訊息函數(item information function, IIF)與測驗訊息函數(test information function, TIF)的概念可 以作為題目挑選與問卷發展的工具。訊息函數不但可以根據受試者的能 力挑選出最合適的題目,也可以幫助電腦化適性測驗的發展。該研究針 對20 題的死亡焦慮量表(Death Anxiety Inventory, DAI)進行 IRT 的分析,

發現第 1、3、7、9、17、18、19 及 20 題對中等能力及高能力的受試者 題目訊息量最高,其中又以第20 題能提供最大的訊息量86

第十一節 短式問卷發展與題目縮減

(1) 短式問卷與題目縮減的優勢

目前用來測量健康相關生活品質的問卷相當多,而且也都有相當好 的測量特質(如:有良好的信度與效度),但是過長的問卷造成了應用在 病人照護上的限制。縮短版的問卷在許多情境上佔有優勢,例如在臨床 應用上,可以縮短許多面訪的時間,或是應用在當病人無法參與長時間 的訪問過程時,或是需要重複施測的時候,甚至在併用多種不同目的的 問卷時,縮短版的問卷可以使每份問卷的完訪率提高87

(2) 短式問卷的發展—利用傳統測量理論

Jacobs(2004)提到症狀只能部分的反應疾病對病人的負擔,但是病 人自覺的健康狀態與醫師的診斷往往有所不同,因此醫師應該考慮病人 健康相關的生活品質,以幫助訂定每個病人的不同需要與治療,但是目 前已發展的問卷長度往往過長,而造成在臨床應用上有許多的限制,故 在該研究中,作者嘗試去發展短式問卷以瞭解呼吸道疾病(如:COPD、

氣喘等)患者受損的健康相關生活品質。作者將原本55題的Quality of Life for Respiratory Illness Questionnaire (QoL-RIQ)進行題目縮減,縮短完 的問卷保留原先的10個題目,稱作RIQ-MON10,將RIQ-MON10進行驗 證,發現該問卷具有良好的建構效度、效標效度與區辨效度88

Wu(2006)利用因素分析的方法,針對42題的Caring Behaviors Inventory(CBI)問卷進行縮減,若題目的因素負荷量與任何範疇皆小於 0.4則將該題目刪除,或者該題目與超過兩個以上的範疇因素負荷量大於 0.4,表示該題目不單純測量單一的概念,因此亦將該題目刪除,縮短的 問卷包含24個題目(CBI-24)。CBI-24與原本42題的CBI相比較,無論是 在心理計量的特性、信度、效度等皆相當一致,因此作者建議在未來的 研究上,可以採用縮短版的CBI-24來減輕受試者的負擔,並且偵測照護

行為上的改變89

(3) 短式問卷的發展—利用 IRT 中的 Rasch 模式

Nijsten(2006)針對牛皮癬衝擊問卷(Impact of Psoriasis Questionnaire, IPSO)進行縮減,作者以 Rasch 模式為理論基礎,若題目選項次序混亂

(threshold disorder)或者題目有 DIF 存在,則將該題目刪去。最後一共 刪去了5 題,留下 11 題。經過 Rasch 縮減過的問卷長度較短,而且在評 估牛皮癬患者生活的心理衝擊上亦符合單一向度,未來可針對不同文 化、不同人口學特性或不同疾病嚴重程度的族群,將短式的IPSO 問卷再 加以驗證,以確立短式的IPSO 為有效評估牛皮癬患者健康相關生活品質 的工具20

Lin(2005)使用 Rasch 分析來評估 self-perceived change in quality of life scale(CQOL)用在輕微中風病人的適用性。CQOL 問卷共有 13 題,

經 Rasch 分析後,發現說話、視覺、思考這三題並不符合單一向度的假 設(infit 與 outfit MNSQ 皆大於 1.3),故將這三題刪除,再針對剩餘的 10 題題目進行分析,發現縮短版的問卷相當適用於該組樣本,並且可以 用來測量輕微中風患者健康相關生活品質22

Hsueh(2004)以 Rasch 分析來評估結合巴式量表(Barthel Index, BI)

與芙蘭切量表(Frenchay Activities Index, FAI)用在中風後患者日常活動 功能的適用性。若是問卷中題目不符合單一向度指標時(infit ZSTD 與 outfit ZSTD 皆大於 2,視為不符合單一向度),便將該題目刪除。研究結 果發現,在刪除兩個 FAI 的題目後,結合兩份量表的題目均符合單一向 度的假設,而且巴氏量表的題目難度較低,可以測量較容易的日常活動,

而芙蘭切量表題目難度較高,可以測量較困難的日常活動,因此可涵蓋 較廣範圍能力的患者21

(4) IRT 結合電腦化適性測驗

在傳統的問卷調查上,每一個人都必須回答問卷中所有的題目,來 估計出其能力值,但在電腦化適性測驗(computerized adaptive testing, CAT)40中,每一個人只要回答與其健康程度相符合,能提供最大訊息量 的題目就可以。結合IRT與CAT的技術在評估健康狀態的應用上,可以利 用電腦的快速運算速度,根據受試者的答題反應即時估算出其程度值,

並立刻選出符合受試者程度值的題目讓受試者作答。

Revicki(1997)提到結合IRT模式、建立題庫(item bank)、和電腦 化適性測驗有許多的優勢,如:可以針對每個受試者訂做簡短且準確的 量表、可以減少天花板與地板效應(floor and ceiling effects)、根據測驗 的目的與對象不同來決定要挑選多少題目(如:目標族群很大,則採用 較精簡的題目)90

Ware(2003)探討利用電腦化適性測驗的可行性,並且評估CAT-based 得到的頭痛衝擊分數的信度與效度,題目來源為54題的Headache Impact Test(HIT)。研究結果發現利用IRT與CAT-based的方法來填答HIT的題 目可以大大的減輕受試者的負擔,此外將CAT-HIT評估的結果與之前的 實證研究相比較,電腦化適性測驗所得的結果可以得到相當令人滿意的 準確性,而且可以估計涵蓋各種嚴重程度的頭痛患者91

Fayers(2007)探討IRT與CAT應用在健康結果的評估上的適用性,

作者認為IRT與CAT是發展應用在PROs問卷的相當有力之工具,但是這 些工具並不能完全取代傳統心理計量與統計技術,但仍可以作為一個相 當有價值的輔助工具。另一方面,CAT軟體在使用上仍有許多的不方便,

未來希望可以開發較為容易使用的軟體,以發展新的CAT-based的PROs 問卷79

Kosinski(2006)將CAT用在PROs問卷去評估骨關節炎(osteoarthritis, OA)對患者造成的功能與安寧衝擊,研究中估計兩種分數,Total-OA為

病人回答所有37個題目得到的分數,CAT-OA則是只回答由電腦挑選訊息 量最高的5個題目所得的分數。在兩種分數的一致性上面,使用相關係數 r來評估,結果r值高達0.96,顯示兩種分數有高度相關。CAT的方法可以 提供OA造成患者功能與安寧衝擊的有效且準確估計,而且相對於紙筆問 卷還要再次將資料鍵入電腦,CAT則可以直接進行計分,減少許多時間,

在臨床的應用上達最大效益。若從病人的觀點來看,則不再需要回答所 有題目,只需回答部分訊息量高的題目,便可以達到與原本幾乎相當的 結果,可大大減少病人的負擔92