• 沒有找到結果。

第一章 緒論

自古以來,測驗一直是評量能力、篩選人才、診斷盲點及未來發展潛力的不 可或缺的工具。隨著時代的進步,測驗結合科技,突破了許多以往的限制,更職 稱地發揮了它的功能。從文獻及實證經驗上,發覺目前常用之測驗模式,一般均 採用二元計分模式,二元計分之觀點是將所有錯誤選項之誘答力視為相同,實為 損失訊息之欠佳模式,不能忠實反應資料訊息。本研究針對國小高年級學童數學 能力編制測驗工具,以部分給分模式進行概念探討,期能提供教師們針對不同能 力學童之教學參考。本章首先介紹研究背景,並說明本研究之目的,最後再界定 本研究所使用之專有名詞,以釐清其意義。

第一節 研究動機

測驗依計分方式不同可分為二元計分與多元計分。二元計分意指受試者的答 題反應,結果只有對或錯二種情況,只考慮正確與錯誤兩種資料,並將未作答視 同錯誤資料,成為正確(1)與錯誤(0)之二元資料。常見的單選題、是非題均 屬於二元計分的題型。單憑最後答案的對錯,以決定受試者能力的方式,並未考 慮到受試者答題的歷程及作答反應情形,可能會有答對總分相同,但作答反應組 型不同,其表示的意義也可能不同(Harnisch, D.L. & Linn, R.L.,1981a)。如果只 探討正確選項而忽略其他誘答選項,則會有損失不同誘答力的選答訊息,所以有 多元計分選項分析模式的產生。

多元計分係指將受試者的作答反應區分為數種型態,再對應到數個類別之中,

不同的類別會有不同的分數(秦靜儀,1999),不只探討正確選項的選答情形,

還兼顧了同一試題各誘答選項誘答力不盡相同所影響的訊息,且各誘答選項有專 有的反應特徵曲線,所以多元計分模式所估得的參數值,必較以二元計分模式所 估得的參數值,訊息充分且有效,可以較精確地估計受試者的特質,甚至更可進 一步達到診斷的功能。

2

由於目前的 S-P 表分析理論僅能適用於二元資料(0、1 或對、錯);如果遇 到有分段給分的計算題、證明題之類的評量,每個學生在每個試題上的反應類型 可能得分 0 分、1 分、2 分、3 分、…等的多元計分模式,其試題反應類型就不再 單純是屬於對或錯的二元資料,此時 S-P 表分析方法就無法針對多元計分的資料 型態,提供類似分析結果,非常可惜(林原宏,1999)。本研究欲發展既有的 S-P 表分析理論,使得能夠分析多元計分測驗資料。在計分的模式上採取多元計分下 部分給分模式,並以佐藤隆博曼哈頓距離量尺概念,來發展部分給分 S-P 表,以 獲得 S-P 表的差異係數(D)、學生的注意係數(caution index of student,簡稱 CS)

和試題的注意係數(caution index of problem,簡稱 CP)。

S-P 表提供受試者學習狀況的診斷資料,但 S-P 表受限於二元計分的測驗資 料,綜觀現今許多的測驗資料裡,有許多的施測資料不再局限於二元計分的試題,

如:數學情境的文字題、證明題等,評分者根據受試者答題正確性程度,給予部 分給分(partial credit),亦即試題的計分點數不再只是兩點,極為常見的多元計 分(polytomous)。此時傳統 S-P 表分析理論便無法分析多元計分的測驗資料。因 此,如何發展既有 S-P 表分析模式,使得能夠分析多元計分的測驗資料,其有比 要可行之處(陳慶恩,2010)。如果能夠將其是用範圍擴大,相信日後將協助教 師能更深入的掌握學生的學習認知動態。

第二節 研究目的

基於上述研究動機,本研究的主要目的包含:

壹、應用部分給分 S-P 表的差異係數(D*)、試題注意係數(CP)和學生注意係 數(CS),進行試題診斷分析及學生學習診斷分析。

貳、對試題做質的分析,包括試題內容分析、內容效度分析、雙向細目表分析。

參、對試題做量的分析,包括難度、鑑別度、信度分析及試題選項要素。

肆、根據以上的研究結果提出具體建議,作為日後增進教學效能及進一步研究的

3

4

其中 1

1 N

i i

x x

N

m[xk]。在兩個注意係數的公式中,[ ] 係指 Gauss 整數值符號。

叁、雙向細目表

雙向細目表示測驗的架構藍圖他描述了一份測驗中所應包含的內容以及所評 量到的能力,也是命題的依據。他是以教學目標和學習內容為兩個軸,分別說明 各項評量目標。其目的可以幫助命題者釐清教學目標和學習內容的關係,以確保 測驗反映教材的內容,並能夠真正評量到預期之學習結果。

肆、信度

信度(reliability)是指衡量工具的正確性或是精確性。亦指測驗分數未受測 量誤差影響的程度。信度有兩分面的意義,一是穩定性:在不同時間點重複衡量 相同的事務或個人,然後比較兩次衡量分數的相關程度;一是一致性:一個態度 的尺度中,各個項目間具有一致性或內部同質性。

伍、內容效度

內容效度(content validity)是指該衡量工具能足夠涵蓋主體的程度。從測量工具 的內容來檢查,看看是否符合測量目標所預期的內容。

5

相關文件