• 沒有找到結果。

第二章 文獻探討

第三節 傳統與現代測驗理論之比較

傳統測量理論主要是以真實分數模式(觀察分數=真實分數+誤差分 數)為理論架構,依據弱勢假設(weak assumption)而來,其理論模式 的發展已為時甚久,且發展得相當規模,所採用的計算公式簡單明瞭、

淺顯易懂,適用於大多數的教育與心理測驗資料,以及社會科學資料的 分析,為目前使用與流通最廣的理論依據。然而傳統測量理論卻有下列 諸項先天的缺失:(31, 39)

1. 傳統測量理論所採用的指標,諸如:難度(difficulty)、鑑別度

(discrimination)、和信度(reliability)等,都是一種樣本依賴(sample dependent)的指標,這些指標的獲得會因接受測驗的受試者樣本的不同 而不同,因此,同一份試卷很難獲得一致的難度、鑑別度、或信度。

2. 傳 統 測 量 理 論 以 一 個 相 同 的 測 量 標 準 誤 ( standard error of measurement),做為每位受試者的測量誤差指標,這種做法並沒有考慮 受試者能力的個別差異,對高、低能力兩極端組的受試者而言,這種指 標極為不合理且不準確,致使理論假設的適當性受到懷疑。

3. 傳統測量理論對於非複本(nonparallel)但功能相同的測驗所測

得的分數間,無法提供有意義的比較,有意義的比較僅侷限於相同測驗 的前後測分數或複本測驗分數之間。

4. 傳統測量理論對信度的假設,是建立在複本(parallel forms)測 量的概念假設上,但是這種假設往往不存在於實際測驗情境裡。因為不 可能要求每位受試者接受同一份測驗無數次,而仍然假設每次測量間都 彼此獨立不相關,且每一種測驗並不一定同時都有製作複本,因此複本 測量的理論假設是行不通的。

5. 傳 統 測 量 理 論 忽 視 受 試 者 的 試 題 反 應 組 型 ( item response pattern),認為原始得分相同的受試者,其能力必定一樣;其實即使原始 得分相同的受試者,其反應組型亦不見得完全一致,因此其能力估計值 應該會有所不同。

為了克服傳統測量理論的缺失,於是有現代測量理論的誕生,其理 論主要是以試題反應理論為理論架構,依據強勢假設(strong assumptions)

而來,其理論模式仍不斷的在發展當中,所採用的計算公式複雜深奧、

艱澀難懂,為一立論與假設均合理與嚴謹的學說,深受測驗學者的青睞,

已有逐漸凌駕傳統測量理論之上,甚至進而取而代之之勢。

現代測量理論具有下列幾項特點,這些特點正是傳統測量理論所無 法具備的:(31, 39)

1. 現代測量理論所採用的試題參數(item parameters)(如:難度、

鑑別度、猜測度等),是一種不受樣本影響(sample-free)的指標,這些 參數的獲得,不會因為所選出接受測驗的受試者樣本的不同而不同。

2. 現代測量理論能夠針對每位受試者,提供個別差異的測量誤差指 標,而非單一相同的測量標準誤,因此能夠精確推估受試者的能力估計 值。

3. 現代測量理論可經由適用的同質性試題組成的分測驗,測量估計 出受試者個人的能力,不受測驗的影響(test-free),並且對於不同受試 者間的分數,亦可進行有意義的比較。

4. 現代測量理論提出以試題訊息量(item information)及試卷訊息 量(test information)的概念,來做為評定某個試題或整份試卷的測量準 確性,可取代傳統測量理的「信度」,做為評定試卷內部一致性指標。

5. 現代測量理論同時考慮受試者的反應組型與試題參數等特性,因 此在估計個人能力時,除了能夠提供一個較精確的估計值外,對於原始 得分相同的受試者,也能給予不同的能力估計值。

6. 現 代 測 量 理 論 所 採 用 的 適 合 度 考 驗 值 (statistic of goodness-of-fit),可以提供考驗模式與資料間之適合度、受試者的反應是 否為非尋常(unusual)等參考指標。

雖然現代測量理論克服了許多傳統測量理論上的缺失,但在現代測 量理論的實際運用上卻需要非常小心,因為現代測量理論是一種大樣本

模式,需要有足夠大的樣本才能準確的估計出參數值(24),且其理論建立 在假設嚴謹的數理統計學機率模式上,是一種複雜深奧、艱澀難懂的測 量理論,其模式參數之估計更須有專業的電腦套裝軟體即時配合,難以 用手算或小型計算機進行,因此在應用上更受限制;而傳統測量理論雖 然不夠嚴謹,理論卻淺顯易懂,便於在一般實際情境(尤其是小規模資 料)中實施(24, 39);所以這兩派測驗理論各有所長,在應用上也各有其限 制。