• 沒有找到結果。

Chapter 2  文獻回顧

2.5  量表的效度評估

除了量表的信度(reliability)之外,即我們可以反覆使用此量表測量某個我們有興趣的事物

(attribute),測量結果可以重複相同的表現出來,我們尚且需要知道這個可以被反覆測量出的

Observed CI SE RE

liability σ σ σ

σ

CI=有興趣的事物(construct of interest)的變異數

2

σ

SE=系統性誤差(systemic error)的變異數

2

Observed CI SE RE

Validity σ σ

σ σ σ

= =

+ + σ

2 (2-10) 因此,信度一定大於等於效度(0≦validity≦reliability≦1),信度為效度的上限。

效度主要分為三類:1. 內容效度(content validity), 2. 效標關聯效度(criterion validity), 3.

建構效度 (construct validity)。至於效度驗證(Validation)則為一個驗證假說測試的過程(a process of hypothesis testing),驗證一個量表測量出來的結果是不是我們真正想要測量的事物或 面向,並藉由這個量表量測出的分數可以推論(inference)這個人有多少這個面向的特質。在闡 述量表效度時,我們不能說這個量表已經被證實具有效度了,只能說這個量表已經被證實當使 用在測量某個族群的某個特質或構想具有效度。

表面上的效度(Face validity):其定義為是否這些問題或項目是否在看起來就是要量測我們想 要有興趣的事物。

內容效度(Content validity,亦可稱為 content coverage 或 content relevance):我們的問卷內容

是否能夠充分的包含研究題目的所有面向(domain),尤其當我們遺漏了某個重要的組成,那我 們對於此量表量測出的結果做出的推論便會有錯誤。

效標關聯效度(Criterion validity):一般來說即是這個量表可以多正確的預測他所要量測的事 物。主要可以分成1. 一致性效度(concurrent validation) 2. 預測效度(predictive validation)。

一致性效度:我們研究一個新量表和一個已被接受的舊量表相關性,便是一致性效度。

預測性效度:受試者經過黃金診斷標準或者確切的診斷標準分類為個案及非個案,我們評估利 用此量表是否可以事先預測受試者為個案或非個案,即為此量表的預測性效度。

至於為什麼已經有一個很好的舊量表或診斷標準的情況下,還需要一個新的量表或診斷標準 呢?最主要的原因為舊量表或診斷標準可能因為題目過多太花費時間,或者是昂貴,具有侵入 性,對受試者有危險性或者是結果需要很長的時間才會知道,我們希望可以早一點預測結果,

因此需要一個較簡易的量表或診斷標準。

利用receiver operating characteristic curves (ROC curves,如 Figure 2.5-1)來找出較適切的切點來 分辨受試者是不是具有這項疾病或者特質。當我們提高切點的分數時,可以減少偵測到非個案 病人,但也有較多個案被遺漏,降低切點的分數時,可以偵測到較多個案病人,但也有較多非 個案被偵測到。ROC 的縱軸為敏感性(sensitivity)而橫軸為 1-特異性(1-specificity)或者偽 陽性率(false positive rate)。而一個診斷方法的好壞則是視 ROC curves(Figure 2.5-1)的 Area Under Curve (AUC)的大小來決定診斷方法的好壞。

Figure 2.5-1 Receiver Operating Characteristic curve(ROC curve)

0 20 40 60 80 100

0 20 40 60 80 100

100-Specificity

S e n s it iv it y

建構效度(Construct validity)

比如當我們要測量焦慮、智商、疼痛的程度時,我們無法直接測量這些潛在變項(latent variable),但根據我們對於焦慮的假設,焦慮會有冒汗,心悸,來回踱步(躁動),失眠等等 的表現,而我們可以觀察到這些表現,為可觀察變項(observed variables)。由於這些可觀察變 項為焦慮造成的結果,因此又稱為effect indicator。這些潛在變項即為假設性的建構(hypothetical construct),需要有他的理論(theory)去連結可觀察變項與建構之間的相關性。

以極端族群(Extreme groups)檢驗量表的效度

最簡單可以檢驗量表效度的方法為將量表量測兩組受試者,一組為個案(具有我們有興趣以此 量表量測的特質或行為)一組為非個案,因此,個案應該在此量表會有較高的分數。這種方法 又稱為以極端族群驗證建構效度(construct validation by extreme groups)又稱為區辨效度

(Discriminative validation)。