• 沒有找到結果。

第三章 研究方法

第五節 資料統計與分析

本研究主要利用 IRT 中之 Rasch 模式來評估 WHOQOL-BREF 與 SGRQ 應用在 COPD 患者的適用性,並探討其是否具有下列心理計量特 質,包括:單一向度(unidimensionality)、題目難度(item difficulty)、

信度指標(reliability)、題目適中性(targeting)。並藉由試題差別功能

(differential item functioning, DIF)來瞭解在不同疾病嚴重程度與不同年 齡題目難度的表現。最後再透過題目訊息(item information)來挑出不同

殘差的分佈常為一個z 或 t 分佈,當要檢查適合度統計量時常以平均 值均方(mean square fit statistic)或標準化的適合度指標(standard fit staitsic)表示。另外,這兩種適合度指標可進ㄧ步分為(a)較強調非期 望的反應與受測者及題目測量間的差異(outfit statistic)與(b)較強調 非期望的反應在受測者或題目測量附近(infit statistic)。

Outfit statistic 是考慮受測者的能力與題目難度關係後,標準化殘差 的平方取平均值,這個平均值是沒有加權的。而infit 則是將 outfit 經訊息 加權後之形式(information-wieghted form),此加權過程將可減低較偏離 主要研究對象能力所在範圍部份所造成的影響。

一般而言,標準化後的適合度指標較少使用,原因為標準化係將誤 差除以標準誤,而當樣本數愈大時,標準誤就愈小,而使得適合度指標 容易達統計顯著(t>2)99。另外因infit statistic 較 outfit statistic 敏感,且 不易受極端值的影響,因此在本研究的Rasch 分析中,我們以 infit statistic 作為評估單一向度的指標,若infit 統計量>1.3 則代表題目不符合單一向 度的假設19,72,87,100,101

題目難度(item difficulty)

Rasch 模式可經由理論機率模式將題目難度與人的能力放在相同尺 度上來比較,單位為logit,logit 尺度為一連續的尺度。

以題目難度來說,若題目難度的logit 越大,代表題目難度越高,亦 即該題目對受試者而言不容易有正向的反應;相同的,若題目難度的logit 越低,則表示該題目難度較低,受試者較容易填答正向的反應。

以人的能力來說,若能力的logit 越大,代表人的能力越高,亦即該 受試者對生活品質的滿意程度越高;相同的,若能力的logit 越低,則表 示人的能力較低,代表受試者對生活品質較不滿意。

原則上,為了準確的估計不同能力的人,題目難度分佈的範圍要越

廣越好,且題目難度需均勻分佈,並盡量減少題目分佈的間隔(gap)與 重疊性(redundancy)73,100

信度指標(reliability)與區別性指標(person and item separation)

IRT 中 reliability 數值的範圍為 0~1,其結果解釋與傳統的 Cronbach’s alpha 相當類似,達 0.7 代表可接受,0.8 代表良好,0.9 以上則為極好。

另外在 Rasch 分析中,可利用區別性指標來描述該範疇的題目區辨 不同能力受試者的程度。

人的區別性指標(person separation index, G),公式如下:

ability separation index 達 1.5 代表可接受的區辨能力,2.0 代表良好的區辨能力,

3.0 代表題目具有非常好的區辨能力。

72,103。Separation index 達 1.5 時相似於 Cronbach’s alpha 係數的 0.7(可接

受),2.0 時相似於 Cronbach’s alpha 係數的 0.8(良好),3.0 時相似於 Cronbach’s alpha 係數的 0.9(極好)72。題目的區別性指標(item separation index)與人的區別性指標概念相同。

題目適中性(targeting)

Targeting 指標用來評估題目難度與研究對象能力的適中性。在題目 的校準上,假設不同題目間平均難度固定為0。因此,若所有人在該範疇 的平均得分若為0,表示這些題目的難度對研究對象是適中的。所有人在 該範疇的平均得分離 0 越遠,表示這一組題目是 mis-targeted。當所有人

在該範疇的平均得分為0.5 時,表示 slight mis-targeted。當所有人在該範 疇的平均得分為1.0 時,表示 substantial mis-targeted。所有人在該範疇的 平均得分若為「正」, 表示這一組題目對於這個樣本而言是簡單的;而 所有人在該範疇的平均得分若為「負」,則表示這一組題目對於這個樣本 而言是較困難的72

試題差別功能(differential item functioning, DIF)分析

在本研究中分疾病嚴重度(stage 012 與 stage 34)及年齡(<75 歲與

題目訊息(item information)

在進行挑題前,針對題目難度順序(item hierarchy)與題目訊息函數

(item information function)分別說明如下:

難度的順序:hierarchy 表示用題目難度層級來排序的概念 19,如從

在Rasch 模式中,假設區辨參數(a)為 1、猜測參數(c)為 0,因 序(hierarchy)特性的日常活動範疇,利用題目訊息函數(item information function),挑出最具訊息量的5 個題目,另外亦分別就日常活動範疇中的 兩個題組,分別挑出最具訊息量的 3 個題目,再繪圖比較挑選出來的題 目所提供的訊息量與全部題目的訊息量,最後分不同疾病嚴重程度分別 計算挑選出來的題目訊息量與全部題目訊息量之比值,來評估挑出來的 題目是否可以在未來的應用上取代原本所有的題目。

統計分析工具

1. 以 SAS 進行資料處理與統計分析。

2. 以 WINSTEPS 套裝軟體進行混合評定量尺模式與部分給分模式 分析。