• 沒有找到結果。

第三章 研究方法

第五節 資料統計與分析

(intraclass correlation coefficient, ICC)分析指標,進而評估組間每個範疇的 再現性(reproducibility)98,進行面訪與自填問卷結果之比較。

本研究採用SPSS10.0 英文版來分析組內相關係數 ICC 用再評估再現性

σe 2:組內變異量 σs 2:組間變異量

σs 2e 2:組內變異量+組間變異量=總變異量

內在等級相關係數則根據Shrout &Fleiss100, ICC 值小於 0.4 則代表低度 再現性(poor reproducibility), ICC 值介於 0.4~0.7 則代表中等再現性(fair to good reproducibility), ICC 值介於 0.7~1 則代表再現性非常好(excellent reproducibility)101

項目反應理論看不同管理模式下之心理特質

以 IRT 的 Rasch 系列模式中的 Partial credit model 來分析範疇及題目的 心理計量特質。分析項目包括:(1)以適合度指標(infit statistic)來檢驗各範疇 單一向度的假設。(2)IRT 的信度評估,受測者潛在特質的信度指標與傳統的 測量信度的Cronbach’s alpha 相同,用以比較其內在一致性。(3)題目難度的 測定值來檢驗題目難度的範圍及順序。(4)以試題差別功能 (differential item functioning, DIF)分析來檢驗性別及年齡間題目難度的順序是否相同。

(1)以適合度指標來檢驗各範疇單一向度的假設

一個範疇中的所有題目應該是要同一個方向或概念。例如,我們如果想 要測量生理健康,這個範疇的題目就不應該包含測量心理的題目。假如一個 範疇中包含許多不同概念的題目,所得分數的解釋將是困難的。在Rasch 分 析中,題目若缺少單一向度會反應在適合度檢定(misfit statistic),即當同 一範疇的題目間所測量的並非同一個概念時,misfit statistic 指標將會大於判 別標準,本研究中評估單一向度採用infit 統計量,並以 1.4 作為判別標準,

大於此值則代表此題在此範疇不符合單一向度的假設。

(2)IRT 的信度評估

Person separation reliability 是真實的變異數與獲得的誤差的比值。當誤 差愈小,這個比值就愈大。

數值的範圍為 0~1 並且結果解釋同 Cronbach’s alpha。係數為 0.7(可接 受),係數為0.8(良好),係數為 0.9(極好)。

(3)以題目難度的測定值來檢驗題目難度的範圍及順序

利用 Rasch 模式將人能力及題目難度放在同一個尺度上。當 logit 愈大,

表示題目愈難;logit 愈小,表示愈簡單。題目難度範圍愈廣愈好,並且要 準確的估計不同能力下的人需要有均勻分佈的題目難度,即盡量減少在測量 尺度上題目分佈的間隔(gap)及重疊性(redundancy)。在評估範疇中的題 目有無間隔時,我們是利用題目分佈的圖示來看每個範疇中兩個題目的間距 若大於一個logit,即表示有間隔存在。判別一組題目間難度的重疊性時,

可利用範疇平均難度(β))的2 個題目測量值的標準誤(2 standard error of measurement)。分別將兩種管理模式先依題目的難度排序,比較兩種管理模 式間的難度順序差異,若是難度順序有差異,則表示受測者填答試題時在這 兩種管理模式的感受性不同。

(4) 試題差別功能的評估

試題差別功能(DIF)主要對於不同管理模式間的估計值,來檢查在不 同的族群間題目是否有顯著不同的重要性。藉由比較兩個或以上樣本的題目 特質,評估DIF 所要呈現的是題目難度是否具有不變性。這個評估過程中,

需要分開估計每一個樣本的題目難度,並且以不同樣本題目的測量值來畫散 佈圖。在本分析中我們要比較自填及面訪是否有DIF 存在。

以本研究為例,要評估WHOQOL-BREF 的題目難度會不會因為管理模 式的不同而不同。所以需要以管理模式分群分別估計在自填與在面訪的題目

難度。以自填及面訪題目難度畫散佈圖,若是題目的難度具有的不變性,此 兩組人相對的難度估計值將會落在散佈圖中的45 度角附近。本研究中用 0.5-logit 作為評估的標準102以 45 度角的對角線往上下平移 0.5-logit,若是 兩組人相對的難度估計值落在此範圍外,就表示此題目有DIF。

相關文件