資料統計與分析

第三章研究方法

第五節資料統計與分析

（intraclass correlation coefficient, ICC)分析指標，進而評估組間每個範疇的再現性(reproducibility)⁹⁸，進行面訪與自填問卷結果之比較。

本研究採用SPSS10.0 英文版來分析組內相關係數 ICC 用再評估再現性

σe 2：組內變異量 σ_s²：組間變異量

σ_s² +σ_e²：組內變異量＋組間變異量＝總變異量

內在等級相關係數則根據Shrout &Fleiss¹⁰⁰, ICC 值小於 0.4 則代表低度再現性(poor reproducibility), ICC 值介於 0.4~0.7 則代表中等再現性(fair to good reproducibility), ICC 值介於 0.7~1 則代表再現性非常好(excellent reproducibility)¹⁰¹。

項目反應理論看不同管理模式下之心理特質

以 IRT 的 Rasch 系列模式中的 Partial credit model 來分析範疇及題目的心理計量特質。分析項目包括：(1)以適合度指標(infit statistic)來檢驗各範疇單一向度的假設。(2)IRT 的信度評估，受測者潛在特質的信度指標與傳統的測量信度的Cronbach’s alpha 相同，用以比較其內在一致性。(3)題目難度的測定值來檢驗題目難度的範圍及順序。(4)以試題差別功能 (differential item functioning, DIF)分析來檢驗性別及年齡間題目難度的順序是否相同。

(1)以適合度指標來檢驗各範疇單一向度的假設

一個範疇中的所有題目應該是要同一個方向或概念。例如，我們如果想要測量生理健康，這個範疇的題目就不應該包含測量心理的題目。假如一個範疇中包含許多不同概念的題目，所得分數的解釋將是困難的。在Rasch 分析中，題目若缺少單一向度會反應在適合度檢定（misfit statistic），即當同一範疇的題目間所測量的並非同一個概念時，misfit statistic 指標將會大於判別標準，本研究中評估單一向度採用infit 統計量，並以 1.4 作為判別標準，

大於此值則代表此題在此範疇不符合單一向度的假設。

(2)IRT 的信度評估

Person separation reliability 是真實的變異數與獲得的誤差的比值。當誤差愈小，這個比值就愈大。

數值的範圍為 0~1 並且結果解釋同 Cronbach’s alpha。係數為 0.7（可接受），係數為0.8（良好），係數為 0.9（極好）。

(3)以題目難度的測定值來檢驗題目難度的範圍及順序

利用 Rasch 模式將人能力及題目難度放在同一個尺度上。當 logit 愈大，

表示題目愈難；logit 愈小，表示愈簡單。題目難度範圍愈廣愈好，並且要準確的估計不同能力下的人需要有均勻分佈的題目難度，即盡量減少在測量尺度上題目分佈的間隔（gap）及重疊性（redundancy）。在評估範疇中的題目有無間隔時，我們是利用題目分佈的圖示來看每個範疇中兩個題目的間距若大於一個logit，即表示有間隔存在。判別一組題目間難度的重疊性時，

可利用範疇平均難度（β⁾）的2 個題目測量值的標準誤（2 standard error of measurement）。分別將兩種管理模式先依題目的難度排序，比較兩種管理模式間的難度順序差異，若是難度順序有差異，則表示受測者填答試題時在這兩種管理模式的感受性不同。

(4) 試題差別功能的評估

試題差別功能（DIF）主要對於不同管理模式間的估計值，來檢查在不同的族群間題目是否有顯著不同的重要性。藉由比較兩個或以上樣本的題目特質，評估DIF 所要呈現的是題目難度是否具有不變性。這個評估過程中，

需要分開估計每一個樣本的題目難度，並且以不同樣本題目的測量值來畫散佈圖。在本分析中我們要比較自填及面訪是否有DIF 存在。

以本研究為例，要評估WHOQOL-BREF 的題目難度會不會因為管理模式的不同而不同。所以需要以管理模式分群分別估計在自填與在面訪的題目

難度。以自填及面訪題目難度畫散佈圖，若是題目的難度具有的不變性，此兩組人相對的難度估計值將會落在散佈圖中的45 度角附近。本研究中用 0.5-logit 作為評估的標準¹⁰²以 45 度角的對角線往上下平移 0.5-logit，若是兩組人相對的難度估計值落在此範圍外，就表示此題目有DIF。

在文檔中世界衛生組織生活品質問卷用於自填模式與面訪模式之比較 (頁 46-50)

第三章 研究方法

第五節 資料統計與分析

第三章研究方法

第五節資料統計與分析