• 沒有找到結果。

從統計學的觀點來看,試題的鑑別度指標與難度指標之間,具有很密切的關 係(Ebel,1967)。從圖 2-5-1 中可清楚的看出,當難度指標趨近兩端時(P=0 或 1),鑑別度的指標將趨近於 0;當難度指標欲接近 .50 時,鑑別度指標的值可 能達到最大。

0.5 1.0 -1.0

0.0 1.0

難度指標 鑑

別 度 指 標

圖 2-6-1 難度指標與鑑別度指標的關係圖(引自余民寧,1997)

貳、測驗評鑑

信度與效度是測驗的兩大特徵,評鑑一份測驗的品質應考驗其信度及效度的 高低,信度與效度的意義與種類分述如下:

一、信度:

信度的定義是指真實分數的變異數占實得分數之變異數的百分比,但是由於 真實分數是未知的,它必須由實得分數中去推估才能得知;信度也可說是測驗的 可靠性與一致性。以下介紹一般較常見的三種信度的估計方法(余民寧,1997)。

(一)再測信度:

同一份測驗於不同的時間對同一批受試者前後重複施測兩次,則根據這兩次 測驗的分數求相關係數,此相關係數就是我們所謂的再測信度係數(test-retest reliability coefficient)。

(二)複本信度:

兩份測驗在試題格式、題數、難易度、指導語說明、施測時間與例題舉例等 方面均相當接近或相似,並且都是用來測量相同潛在特質或能力,但是試題的內 容卻不相同的測驗,施測同一批受試者,再根據兩次施測的測驗分數求相關係數,

此相關係數即為複本信度係數(parallel-forms reliability coefficient)。

(三)內部一致性信度:

以上的兩種信度估計方法,都需要對相同受試者進行兩次施測,這樣的做法 在實務上是有困難的,包括增加測驗編製的負擔、受試者合作意願低落、動機減 低等現象,而直接或間接影響到施測的結果。因此測驗統計學者就嘗試尋找只要 根據一份測驗結果,就可以估算出此份測驗的信度。用這種方式所估計出來的信 度係數,就是內部一致性信度係數(internal consistency reliability coefficient)。本研究採用測驗統計學者 Cronbach 於 1951 年提出α係數方法 的信度係數。

二、效度:

效度是指測驗分數能夠代表它所要測量之能力或潛在特質的程度,或測驗能 達到其編製目的的程度。效度分析主要有三個類型(余民寧,1997):

(一)內容效度:

內容效度(content validity)是指抽樣的測驗試題樣本內容是否具有教學 目標與教材代表性或適當性程度的一種指標。測驗的試題若能涵蓋所有教學目標 和教材內容,並且根據雙向細目表來命題,且具有足夠的代表性試題,即能確立

該測驗的內容效度的適當性。

(二)效標關聯效度:

效標關聯效度(criterion-related validity)是指以證實分析方法研究測 驗分數與外在效標間關連性的一種指標。它能夠預測受試者未來的表現或評估受 試者在某些效標表現上的目前學習表現情形。

(三)建構效度

根據心理學或社會學的理論建構,對測驗分數能否達成它的測驗目的所做的 分析和解釋,即為建構效度(construct validity)。

本研究之網路影像評量系統透過試題與測驗分析,以難度、鑑別度刪選修改 槓桿概念調查表試題,考驗測驗的信度與效度,建立一套偵測槓桿迷思概念網路 影像評量系統。