資料統計與分析

第三章研究方法

第五節資料統計與分析

本研究主要利用 IRT 中之 Rasch 模式來評估 WHOQOL-BREF 與 SGRQ 應用在 COPD 患者的適用性，並探討其是否具有下列心理計量特質，包括：單一向度（unidimensionality）、題目難度（item difficulty）、

信度指標（reliability）、題目適中性（targeting）。並藉由試題差別功能

（differential item functioning, DIF）來瞭解在不同疾病嚴重程度與不同年齡題目難度的表現。最後再透過題目訊息（item information）來挑出不同

殘差的分佈常為一個z 或 t 分佈，當要檢查適合度統計量時常以平均值均方（mean square fit statistic）或標準化的適合度指標（standard fit staitsic）表示。另外，這兩種適合度指標可進ㄧ步分為（a）較強調非期望的反應與受測者及題目測量間的差異（outfit statistic）與（b）較強調非期望的反應在受測者或題目測量附近（infit statistic）。

Outfit statistic 是考慮受測者的能力與題目難度關係後，標準化殘差的平方取平均值，這個平均值是沒有加權的。而infit 則是將 outfit 經訊息加權後之形式（information-wieghted form），此加權過程將可減低較偏離主要研究對象能力所在範圍部份所造成的影響。

一般而言，標準化後的適合度指標較少使用，原因為標準化係將誤差除以標準誤，而當樣本數愈大時，標準誤就愈小，而使得適合度指標容易達統計顯著（t＞2）⁹⁹。另外因infit statistic 較 outfit statistic 敏感，且不易受極端值的影響，因此在本研究的Rasch 分析中，我們以 infit statistic 作為評估單一向度的指標，若infit 統計量＞1.3 則代表題目不符合單一向度的假設19,72,87,100,101。

題目難度（item difficulty）

Rasch 模式可經由理論機率模式將題目難度與人的能力放在相同尺度上來比較，單位為logit，logit 尺度為一連續的尺度。

以題目難度來說，若題目難度的logit 越大，代表題目難度越高，亦即該題目對受試者而言不容易有正向的反應；相同的，若題目難度的logit 越低，則表示該題目難度較低，受試者較容易填答正向的反應。

以人的能力來說，若能力的logit 越大，代表人的能力越高，亦即該受試者對生活品質的滿意程度越高；相同的，若能力的logit 越低，則表示人的能力較低，代表受試者對生活品質較不滿意。

原則上，為了準確的估計不同能力的人，題目難度分佈的範圍要越

廣越好，且題目難度需均勻分佈，並盡量減少題目分佈的間隔（gap）與重疊性（redundancy）^73,100。

信度指標（reliability）與區別性指標（person and item separation）

IRT 中 reliability 數值的範圍為 0~1，其結果解釋與傳統的 Cronbach’s alpha 相當類似，達 0.7 代表可接受，0.8 代表良好，0.9 以上則為極好。

另外在 Rasch 分析中，可利用區別性指標來描述該範疇的題目區辨不同能力受試者的程度。

人的區別性指標（person separation index, G），公式如下：

ability separation index 達 1.5 代表可接受的區辨能力，2.0 代表良好的區辨能力，

3.0 代表題目具有非常好的區辨能力。

72,103。Separation index 達 1.5 時相似於 Cronbach’s alpha 係數的 0.7（可接

受），2.0 時相似於 Cronbach’s alpha 係數的 0.8（良好），3.0 時相似於 Cronbach’s alpha 係數的 0.9（極好）⁷²。題目的區別性指標（item separation index）與人的區別性指標概念相同。

題目適中性（targeting）

Targeting 指標用來評估題目難度與研究對象能力的適中性。在題目的校準上，假設不同題目間平均難度固定為0。因此，若所有人在該範疇的平均得分若為0，表示這些題目的難度對研究對象是適中的。所有人在該範疇的平均得分離 0 越遠，表示這一組題目是 mis-targeted。當所有人

在該範疇的平均得分為0.5 時，表示 slight mis-targeted。當所有人在該範疇的平均得分為1.0 時，表示 substantial mis-targeted。所有人在該範疇的平均得分若為「正」，表示這一組題目對於這個樣本而言是簡單的；而所有人在該範疇的平均得分若為「負」，則表示這一組題目對於這個樣本而言是較困難的⁷²。

試題差別功能（differential item functioning, DIF）分析

在本研究中分疾病嚴重度（stage 012 與 stage 34）及年齡（＜75 歲與

題目訊息（item information）

在進行挑題前，針對題目難度順序（item hierarchy）與題目訊息函數

（item information function）分別說明如下：

難度的順序：hierarchy 表示用題目難度層級來排序的概念 ¹⁹，如從

在Rasch 模式中，假設區辨參數（a）為 1、猜測參數（c）為 0，因序（hierarchy）特性的日常活動範疇，利用題目訊息函數（item information function），挑出最具訊息量的5 個題目，另外亦分別就日常活動範疇中的兩個題組，分別挑出最具訊息量的 3 個題目，再繪圖比較挑選出來的題目所提供的訊息量與全部題目的訊息量，最後分不同疾病嚴重程度分別計算挑選出來的題目訊息量與全部題目訊息量之比值，來評估挑出來的題目是否可以在未來的應用上取代原本所有的題目。

統計分析工具

1. 以 SAS 進行資料處理與統計分析。

2. 以 WINSTEPS 套裝軟體進行混合評定量尺模式與部分給分模式分析。

在文檔中以現代測量理論探討慢性阻塞性肺疾病患者生活品質之評估 (頁 43-49)

第三章 研究方法

第五節 資料統計與分析

統計分析工具

第三章研究方法

第五節資料統計與分析