傳統與現代測驗理論之比較

第二章文獻探討

第三節傳統與現代測驗理論之比較

傳統測量理論主要是以真實分數模式（觀察分數=真實分數+誤差分數）為理論架構，依據弱勢假設（weak assumption）而來，其理論模式的發展已為時甚久，且發展得相當規模，所採用的計算公式簡單明瞭、

淺顯易懂，適用於大多數的教育與心理測驗資料，以及社會科學資料的分析，為目前使用與流通最廣的理論依據。然而傳統測量理論卻有下列諸項先天的缺失：^{(31, 39)}

1. 傳統測量理論所採用的指標，諸如：難度（difficulty）、鑑別度

（discrimination）、和信度（reliability）等，都是一種樣本依賴（sample dependent）的指標，這些指標的獲得會因接受測驗的受試者樣本的不同而不同，因此，同一份試卷很難獲得一致的難度、鑑別度、或信度。

2. 傳統測量理論以一個相同的測量標準誤（ standard error of measurement），做為每位受試者的測量誤差指標，這種做法並沒有考慮受試者能力的個別差異，對高、低能力兩極端組的受試者而言，這種指標極為不合理且不準確，致使理論假設的適當性受到懷疑。

3. 傳統測量理論對於非複本（nonparallel）但功能相同的測驗所測

得的分數間，無法提供有意義的比較，有意義的比較僅侷限於相同測驗的前後測分數或複本測驗分數之間。

4. 傳統測量理論對信度的假設，是建立在複本（parallel forms）測量的概念假設上，但是這種假設往往不存在於實際測驗情境裡。因為不可能要求每位受試者接受同一份測驗無數次，而仍然假設每次測量間都彼此獨立不相關，且每一種測驗並不一定同時都有製作複本，因此複本測量的理論假設是行不通的。

5. 傳統測量理論忽視受試者的試題反應組型（ item response pattern），認為原始得分相同的受試者，其能力必定一樣；其實即使原始得分相同的受試者，其反應組型亦不見得完全一致，因此其能力估計值應該會有所不同。

為了克服傳統測量理論的缺失，於是有現代測量理論的誕生，其理論主要是以試題反應理論為理論架構，依據強勢假設（strong assumptions）

而來，其理論模式仍不斷的在發展當中，所採用的計算公式複雜深奧、

艱澀難懂，為一立論與假設均合理與嚴謹的學說，深受測驗學者的青睞，

已有逐漸凌駕傳統測量理論之上，甚至進而取而代之之勢。

現代測量理論具有下列幾項特點，這些特點正是傳統測量理論所無法具備的：^{(31, 39)}

1. 現代測量理論所採用的試題參數（item parameters）（如：難度、

鑑別度、猜測度等），是一種不受樣本影響（sample-free）的指標，這些參數的獲得，不會因為所選出接受測驗的受試者樣本的不同而不同。

2. 現代測量理論能夠針對每位受試者，提供個別差異的測量誤差指標，而非單一相同的測量標準誤，因此能夠精確推估受試者的能力估計值。

3. 現代測量理論可經由適用的同質性試題組成的分測驗，測量估計出受試者個人的能力，不受測驗的影響（test-free），並且對於不同受試者間的分數，亦可進行有意義的比較。

4. 現代測量理論提出以試題訊息量（item information）及試卷訊息量（test information）的概念，來做為評定某個試題或整份試卷的測量準確性，可取代傳統測量理的「信度」，做為評定試卷內部一致性指標。

5. 現代測量理論同時考慮受試者的反應組型與試題參數等特性，因此在估計個人能力時，除了能夠提供一個較精確的估計值外，對於原始得分相同的受試者，也能給予不同的能力估計值。

6. 現代測量理論所採用的適合度考驗值 (statistic of goodness-of-fit)，可以提供考驗模式與資料間之適合度、受試者的反應是否為非尋常（unusual）等參考指標。

雖然現代測量理論克服了許多傳統測量理論上的缺失，但在現代測量理論的實際運用上卻需要非常小心，因為現代測量理論是一種大樣本

模式，需要有足夠大的樣本才能準確的估計出參數值⁽²⁴⁾，且其理論建立在假設嚴謹的數理統計學機率模式上，是一種複雜深奧、艱澀難懂的測量理論，其模式參數之估計更須有專業的電腦套裝軟體即時配合，難以用手算或小型計算機進行，因此在應用上更受限制；而傳統測量理論雖然不夠嚴謹，理論卻淺顯易懂，便於在一般實際情境（尤其是小規模資料）中實施^{(24, 39)}；所以這兩派測驗理論各有所長，在應用上也各有其限制。

在文檔中測量攝護腺癌患者的生活品質：EORTC-C30及EORTC-PR25問卷之心理計量特質 (頁 31-34)

第二章 文獻探討

第三節 傳統與現代測驗理論之比較

第二章文獻探討

第三節傳統與現代測驗理論之比較