貳、測驗評鑑

從統計學的觀點來看，試題的鑑別度指標與難度指標之間，具有很密切的關係（Ebel，1967）。從圖 2-5-1 中可清楚的看出，當難度指標趨近兩端時（P＝0 或 1），鑑別度的指標將趨近於 0；當難度指標欲接近 .50 時，鑑別度指標的值可能達到最大。

0.5 1.0 -1.0

0.0 1.0

難度指標鑑

別度指標

圖 2-6-1 難度指標與鑑別度指標的關係圖（引自余民寧，1997）

信度與效度是測驗的兩大特徵，評鑑一份測驗的品質應考驗其信度及效度的高低，信度與效度的意義與種類分述如下：

一、信度：

信度的定義是指真實分數的變異數占實得分數之變異數的百分比，但是由於真實分數是未知的，它必須由實得分數中去推估才能得知；信度也可說是測驗的可靠性與一致性。以下介紹一般較常見的三種信度的估計方法（余民寧，1997）。

（一）再測信度：

同一份測驗於不同的時間對同一批受試者前後重複施測兩次，則根據這兩次測驗的分數求相關係數，此相關係數就是我們所謂的再測信度係數（test-retest reliability coefficient）。

（二）複本信度：

兩份測驗在試題格式、題數、難易度、指導語說明、施測時間與例題舉例等方面均相當接近或相似，並且都是用來測量相同潛在特質或能力，但是試題的內容卻不相同的測驗，施測同一批受試者，再根據兩次施測的測驗分數求相關係數，

此相關係數即為複本信度係數（parallel-forms reliability coefficient）。

（三）內部一致性信度：

以上的兩種信度估計方法，都需要對相同受試者進行兩次施測，這樣的做法在實務上是有困難的，包括增加測驗編製的負擔、受試者合作意願低落、動機減低等現象，而直接或間接影響到施測的結果。因此測驗統計學者就嘗試尋找只要根據一份測驗結果，就可以估算出此份測驗的信度。用這種方式所估計出來的信度係數，就是內部一致性信度係數（internal consistency reliability coefficient）。本研究採用測驗統計學者 Cronbach 於 1951 年提出α係數方法的信度係數。

二、效度：

效度是指測驗分數能夠代表它所要測量之能力或潛在特質的程度，或測驗能達到其編製目的的程度。效度分析主要有三個類型（余民寧，1997）：

（一）內容效度：

內容效度（content validity）是指抽樣的測驗試題樣本內容是否具有教學目標與教材代表性或適當性程度的一種指標。測驗的試題若能涵蓋所有教學目標和教材內容，並且根據雙向細目表來命題，且具有足夠的代表性試題，即能確立

該測驗的內容效度的適當性。

（二）效標關聯效度：

效標關聯效度（criterion-related validity）是指以證實分析方法研究測驗分數與外在效標間關連性的一種指標。它能夠預測受試者未來的表現或評估受試者在某些效標表現上的目前學習表現情形。

（三）建構效度

根據心理學或社會學的理論建構，對測驗分數能否達成它的測驗目的所做的分析和解釋，即為建構效度（construct validity）。

本研究之網路影像評量系統透過試題與測驗分析，以難度、鑑別度刪選修改槓桿概念調查表試題，考驗測驗的信度與效度，建立一套偵測槓桿迷思概念網路影像評量系統。

在文檔中網路影像評量在國小高年級槓桿概念之探討 (頁 41-44)