量表的效度評估 - 文獻回顧 - 中文化兒童排尿障礙問卷量表之信度及效度統計分析

Chapter 2 文獻回顧

2.5 量表的效度評估

除了量表的信度（reliability）之外，即我們可以反覆使用此量表測量某個我們有興趣的事物

（attribute），測量結果可以重複相同的表現出來，我們尚且需要知道這個可以被反覆測量出的

Observed CI SE RE

liability σ σ σ

σ

CI＝有興趣的事物（construct of interest）的變異數

σ

SE＝系統性誤差（systemic error）的變異數

Observed CI SE RE

Validity σ σ

σ σ σ

= =

+ + σ

² (2-10) 因此，信度一定大於等於效度(0≦validity≦reliability≦1)，信度為效度的上限。

效度主要分為三類：1. 內容效度（content validity）, 2. 效標關聯效度（criterion validity）, 3.

建構效度（construct validity）。至於效度驗證（Validation）則為一個驗證假說測試的過程（a process of hypothesis testing），驗證一個量表測量出來的結果是不是我們真正想要測量的事物或面向，並藉由這個量表量測出的分數可以推論(inference)這個人有多少這個面向的特質。在闡述量表效度時，我們不能說這個量表已經被證實具有效度了，只能說這個量表已經被證實當使用在測量某個族群的某個特質或構想具有效度。

表面上的效度（Face validity）：其定義為是否這些問題或項目是否在看起來就是要量測我們想要有興趣的事物。

內容效度（Content validity，亦可稱為 content coverage 或 content relevance）：我們的問卷內容

是否能夠充分的包含研究題目的所有面向(domain)，尤其當我們遺漏了某個重要的組成，那我們對於此量表量測出的結果做出的推論便會有錯誤。

效標關聯效度（Criterion validity）：一般來說即是這個量表可以多正確的預測他所要量測的事物。主要可以分成1. 一致性效度（concurrent validation） 2. 預測效度（predictive validation）。

一致性效度：我們研究一個新量表和一個已被接受的舊量表相關性，便是一致性效度。

預測性效度：受試者經過黃金診斷標準或者確切的診斷標準分類為個案及非個案，我們評估利用此量表是否可以事先預測受試者為個案或非個案，即為此量表的預測性效度。

至於為什麼已經有一個很好的舊量表或診斷標準的情況下，還需要一個新的量表或診斷標準呢？最主要的原因為舊量表或診斷標準可能因為題目過多太花費時間，或者是昂貴，具有侵入性，對受試者有危險性或者是結果需要很長的時間才會知道，我們希望可以早一點預測結果，

因此需要一個較簡易的量表或診斷標準。

利用receiver operating characteristic curves (ROC curves，如 Figure 2.5-1)來找出較適切的切點來分辨受試者是不是具有這項疾病或者特質。當我們提高切點的分數時，可以減少偵測到非個案病人，但也有較多個案被遺漏，降低切點的分數時，可以偵測到較多個案病人，但也有較多非個案被偵測到。ROC 的縱軸為敏感性（sensitivity）而橫軸為 1-特異性（1-specificity）或者偽陽性率（false positive rate）。而一個診斷方法的好壞則是視 ROC curves（Figure 2.5-1）的 Area Under Curve (AUC)的大小來決定診斷方法的好壞。

Figure 2.5-1 Receiver Operating Characteristic curve（ROC curve）

0 20 40 60 80 100

100-Specificity

S e n s it iv it y

建構效度（Construct validity）

比如當我們要測量焦慮、智商、疼痛的程度時，我們無法直接測量這些潛在變項（latent variable），但根據我們對於焦慮的假設，焦慮會有冒汗，心悸，來回踱步（躁動），失眠等等的表現，而我們可以觀察到這些表現，為可觀察變項（observed variables）。由於這些可觀察變項為焦慮造成的結果，因此又稱為effect indicator。這些潛在變項即為假設性的建構(hypothetical construct)，需要有他的理論（theory）去連結可觀察變項與建構之間的相關性。

以極端族群（Extreme groups）檢驗量表的效度

最簡單可以檢驗量表效度的方法為將量表量測兩組受試者，一組為個案（具有我們有興趣以此量表量測的特質或行為）一組為非個案，因此，個案應該在此量表會有較高的分數。這種方法又稱為以極端族群驗證建構效度(construct validation by extreme groups)又稱為區辨效度

（Discriminative validation）。

在文檔中中文化兒童排尿障礙問卷量表之信度及效度統計分析 (頁 29-32)