題目訊息（item information）的原理與應用

第二章文獻查證

第十節題目訊息（item information）的原理與應用

題目訊息函數（item information functions）在現代問卷的發展上扮演很重要的角色 ⁸⁵，訊息函數可以讓研究者瞭解每一個題目在連續的能力特質尺度的每一點所能提供的訊息¹⁸。

相同題目對不同能力者而言其題目訊息量並不相同，因此即使是接受相同的問卷，對不同能力者而言，他們的訊息量應該是不相同的。在實際的應用上，因為題目的難易度很難同時適用於各種不同能力的受試者，對高能力者而言，題目可能過於簡單而測不出其能力；對低能力者而言，題目可能過難而也測不出其能力；只有當題目難易度與人的能力相當時，才能較準確的測出其能力。因此IRT 的題目訊息量概念恰可以反映出題目對不同能力者有不同測量訊息的現象。

Reeve（2007）提到題目訊息量可以看出哪些題目在不同的族群中有最好的區辨能力，較高的訊息量代表較能準確的測量出一個人的能力程度。訊息函數曲線可以用來看題目在不同的能力上的表現，這即是 CAT 模式與發展短式問卷中題目挑選過程的原理²。

Gomez（2007）的研究中提到 IRT 中的題目訊息函數（item information function, IIF）與測驗訊息函數（test information function, TIF）的概念可以作為題目挑選與問卷發展的工具。訊息函數不但可以根據受試者的能力挑選出最合適的題目，也可以幫助電腦化適性測驗的發展。該研究針對20 題的死亡焦慮量表（Death Anxiety Inventory, DAI）進行 IRT 的分析，

發現第 1、3、7、9、17、18、19 及 20 題對中等能力及高能力的受試者題目訊息量最高，其中又以第20 題能提供最大的訊息量⁸⁶。

第十一節短式問卷發展與題目縮減

（1）短式問卷與題目縮減的優勢

目前用來測量健康相關生活品質的問卷相當多，而且也都有相當好的測量特質（如：有良好的信度與效度），但是過長的問卷造成了應用在病人照護上的限制。縮短版的問卷在許多情境上佔有優勢，例如在臨床應用上，可以縮短許多面訪的時間，或是應用在當病人無法參與長時間的訪問過程時，或是需要重複施測的時候，甚至在併用多種不同目的的問卷時，縮短版的問卷可以使每份問卷的完訪率提高⁸⁷。

（2）短式問卷的發展—利用傳統測量理論

Jacobs（2004）提到症狀只能部分的反應疾病對病人的負擔，但是病人自覺的健康狀態與醫師的診斷往往有所不同，因此醫師應該考慮病人健康相關的生活品質，以幫助訂定每個病人的不同需要與治療，但是目前已發展的問卷長度往往過長，而造成在臨床應用上有許多的限制，故在該研究中，作者嘗試去發展短式問卷以瞭解呼吸道疾病（如：COPD、

氣喘等）患者受損的健康相關生活品質。作者將原本55題的Quality of Life for Respiratory Illness Questionnaire （QoL-RIQ）進行題目縮減，縮短完的問卷保留原先的10個題目，稱作RIQ-MON10，將RIQ-MON10進行驗證，發現該問卷具有良好的建構效度、效標效度與區辨效度⁸⁸。

Wu（2006）利用因素分析的方法，針對42題的Caring Behaviors Inventory（CBI）問卷進行縮減，若題目的因素負荷量與任何範疇皆小於 0.4則將該題目刪除，或者該題目與超過兩個以上的範疇因素負荷量大於 0.4，表示該題目不單純測量單一的概念，因此亦將該題目刪除，縮短的問卷包含24個題目（CBI-24）。CBI-24與原本42題的CBI相比較，無論是在心理計量的特性、信度、效度等皆相當一致，因此作者建議在未來的研究上，可以採用縮短版的CBI-24來減輕受試者的負擔，並且偵測照護

行為上的改變⁸⁹。

（3）短式問卷的發展—利用 IRT 中的 Rasch 模式

Nijsten（2006）針對牛皮癬衝擊問卷（Impact of Psoriasis Questionnaire, IPSO）進行縮減，作者以 Rasch 模式為理論基礎，若題目選項次序混亂

（threshold disorder）或者題目有 DIF 存在，則將該題目刪去。最後一共刪去了5 題，留下 11 題。經過 Rasch 縮減過的問卷長度較短，而且在評估牛皮癬患者生活的心理衝擊上亦符合單一向度，未來可針對不同文化、不同人口學特性或不同疾病嚴重程度的族群，將短式的IPSO 問卷再加以驗證，以確立短式的IPSO 為有效評估牛皮癬患者健康相關生活品質的工具²⁰。

Lin（2005）使用 Rasch 分析來評估 self-perceived change in quality of life scale（CQOL）用在輕微中風病人的適用性。CQOL 問卷共有 13 題，

經 Rasch 分析後，發現說話、視覺、思考這三題並不符合單一向度的假設（infit 與 outfit MNSQ 皆大於 1.3），故將這三題刪除，再針對剩餘的 10 題題目進行分析，發現縮短版的問卷相當適用於該組樣本，並且可以用來測量輕微中風患者健康相關生活品質²²。

Hsueh（2004）以 Rasch 分析來評估結合巴式量表（Barthel Index, BI）

與芙蘭切量表（Frenchay Activities Index, FAI）用在中風後患者日常活動功能的適用性。若是問卷中題目不符合單一向度指標時（infit ZSTD 與 outfit ZSTD 皆大於 2，視為不符合單一向度），便將該題目刪除。研究結果發現，在刪除兩個 FAI 的題目後，結合兩份量表的題目均符合單一向度的假設，而且巴氏量表的題目難度較低，可以測量較容易的日常活動，

而芙蘭切量表題目難度較高，可以測量較困難的日常活動，因此可涵蓋較廣範圍能力的患者²¹。

（4） IRT 結合電腦化適性測驗

在傳統的問卷調查上，每一個人都必須回答問卷中所有的題目，來估計出其能力值，但在電腦化適性測驗（computerized adaptive testing, CAT）⁴⁰中，每一個人只要回答與其健康程度相符合，能提供最大訊息量的題目就可以。結合IRT與CAT的技術在評估健康狀態的應用上，可以利用電腦的快速運算速度，根據受試者的答題反應即時估算出其程度值，

並立刻選出符合受試者程度值的題目讓受試者作答。

Revicki（1997）提到結合IRT模式、建立題庫（item bank）、和電腦化適性測驗有許多的優勢，如：可以針對每個受試者訂做簡短且準確的量表、可以減少天花板與地板效應（floor and ceiling effects）、根據測驗的目的與對象不同來決定要挑選多少題目（如：目標族群很大，則採用較精簡的題目）⁹⁰。

Ware（2003）探討利用電腦化適性測驗的可行性，並且評估CAT-based 得到的頭痛衝擊分數的信度與效度，題目來源為54題的Headache Impact Test（HIT）。研究結果發現利用IRT與CAT-based的方法來填答HIT的題目可以大大的減輕受試者的負擔，此外將CAT-HIT評估的結果與之前的實證研究相比較，電腦化適性測驗所得的結果可以得到相當令人滿意的準確性，而且可以估計涵蓋各種嚴重程度的頭痛患者⁹¹。

Fayers（2007）探討IRT與CAT應用在健康結果的評估上的適用性，

作者認為IRT與CAT是發展應用在PROs問卷的相當有力之工具，但是這些工具並不能完全取代傳統心理計量與統計技術，但仍可以作為一個相當有價值的輔助工具。另一方面，CAT軟體在使用上仍有許多的不方便，

未來希望可以開發較為容易使用的軟體，以發展新的CAT-based的PROs 問卷⁷⁹。

Kosinski（2006）將CAT用在PROs問卷去評估骨關節炎（osteoarthritis, OA）對患者造成的功能與安寧衝擊，研究中估計兩種分數，Total-OA為

病人回答所有37個題目得到的分數，CAT-OA則是只回答由電腦挑選訊息量最高的5個題目所得的分數。在兩種分數的一致性上面，使用相關係數 r來評估，結果r值高達0.96，顯示兩種分數有高度相關。CAT的方法可以提供OA造成患者功能與安寧衝擊的有效且準確估計，而且相對於紙筆問卷還要再次將資料鍵入電腦，CAT則可以直接進行計分，減少許多時間，

在臨床的應用上達最大效益。若從病人的觀點來看，則不再需要回答所有題目，只需回答部分訊息量高的題目，便可以達到與原本幾乎相當的結果，可大大減少病人的負擔⁹²。

在文檔中以現代測量理論探討慢性阻塞性肺疾病患者生活品質之評估 (頁 34-39)

第二章 文獻查證

第十節 題目訊息（item information）的原理與應用

第十一節 短式問卷發展與題目縮減

第二章文獻查證

第十節題目訊息（item information）的原理與應用

第十一節短式問卷發展與題目縮減