結合建構反應題之認知診斷模式估計成效-以國小體積、容量與容積單元為例

(1)

國立臺中教育大學教育測驗統計研究所

國民小學教師在職進修教學碩士學位班碩士論文

指導教授：許天維博士

吳慧珉博士

結合建構反應題之認知診斷模式估計成效

-以國小體積、容量與容積單元為例

研究生：呂淳郁撰

中華民國一百零一年七月

(2)

謝詞

在一個因緣際會，在學姐綺雯的推薦之下串起這些年與臺中教育大學測統所不解之緣。這三年多的研究生涯將邁入尾聲，首先要先感謝許天維教授與吳慧珉教授的這幾年來的指導，經常犧牲假日時間指導論文，細心引導在實驗與程式上的疑惑，讓我對於教育測驗統計這門學問有更深一層的了解，也才能完成這篇論文。同時也感謝口試委員施淑娟教授、曾建銘教授與郭伯臣教授給予論文方面的批評與指教，讓此篇論文更加嚴謹與完整。在寫論文的歷程裡經常要在金門與台灣之間飛渡，要同時兼顧教職工作與研究生涯著實不易，十分感恩曾經協助、鼓勵過我的師長及協助的同學們，也感謝系上多位教授在這些年來上課及各方面的指導及多位學長姐的幫忙，特別感謝俊彥學長、俊華學長、智為學長、敏嫻學姊，協助設計統計相關程式及解答論文的相關問題。另外也要感謝陪我一路走來的同窗好友惠萍、小嵐、育蓁總是給粗線條的我許多叮嚀和建議，四年的暑假生活有你們一同在燈下奮戰，彼此互相加油打氣，即使辛苦也不覺孤單，感謝有你們的陪伴，一路上有你們真好。還要謝謝西口國小同校室友瑋琳協助翻譯的艱難工作，以及每次都在我熬夜奮戰論文時給我最大支持的西口幫團員們，雖然我調回彰化了，還是很愛你們喔！最後感謝我最愛的家人們，從小的栽培與照顧，雖然暑假了仍忙碌於課業，感謝你們仍默默的幫我打氣，給我支持的力量，讓我無後顧之憂順利的畢業了，你們真是最棒的家人了，我愛你們，也祝福這一路上相伴的所有貴人們祝你們永遠幸福平安！呂淳郁國立臺中教育大學教育測驗統計研究所中華民國一 O 一年七月

(3)

摘要

本研究的目的是探討「結合建構反應題之認知診斷模式估計」之成效，以國小階段五年級體積、容量與容積單元為研究範圍，編製包含建構反應題之認知診斷測驗試題，以國小五年級312 位學生為研究對象。本研究分別使用模擬資料與實徵資料以DINA 模式分析「不同比例受試者認知屬性標記已知」、「建構反應題認知屬性標記已知」成效比較。根據研究結果結論如下：一、本研究建置結合建構反應題與選擇題之測驗具良好信效度、鑑別度，透過建構反應題解題歷程可得知選擇題中不易測知的重要概念。二、模擬資料分析當「不同比例受試者認知屬性標記已知」若提供的訊息太少， 對提升整體診斷辨識率沒有太大的助益。 三、實證資料分析： (一)「30%受試者認知屬性已知」即可達到平均 90%以上診斷辨識率。 (二) 建構反應題上位認知屬性可提升下位認知屬性，但下位的認知屬性對上位認知屬性提升的效果不佳。 (三) 整體而言，結合建構反應題的診斷辨識率提升平均 4.16%，成效良好。 (四) 模擬資料與實證資料在受試者人數增加時診斷辨識率均有提升。關鍵詞：建構反應題、認知診斷模式估計、「體積、容量與容積」、認知診斷測驗

(4)

Exploring the Performance of Cognitively Diagnostic

Model Incorporating Information of Constructed

Response Items

Taking Capacity、Volume、Bulk for 5th Graders as An Example

Abstract

This study aims to explore the performance of cognitively diagnostic model incorporating information of constructed response items. Researchers tested 312 fifth graders in the elementary school. According to the mathematical curriculum, the unit of “capacity、 volume and bulk＂is used to construct response items. This paper respectively uses simulated data and empirical data to analyze the accuracy with DINA model. The result can be used to the comparison between cognitive attributes unknown, part of the subjects of cognitive attributes marked as known and part of the cognitive property marked as known.

The results of the study show:

1. With multiple choice questions and constructed-response items, this study has nice reliability, validity, and discrimination. The important concepts that couldn’t easily be examined from choice questions can be analyzed on constructed-response questions. 2. When part of the cognitive attributes were marked as known in the simulated data analysis,

it can’t enhance the accuracy if the elements of information. 3. The paper concludes that:

(1) When 30% of the cognitive attributes were marked as known in the empirical data, it was better than others.

(2) The upper concepts with constructed-response will conducive to the enhancement of the accuracy for the lower concepts. But, the lower concepts will not conducive to the enhancement of the accuracy for the upper concepts.

(3) Overall, it will enhance 4.16% of the average accuracy with constructed response items.

(4) It will be conducive to the enhancement of the accuracy if the number of subjects increases in simulated data and empirical data.

Keyword: constructed-response items、cognitive diagnostic models、”capacity、volume、 bulk “、cognitively diagnostic test

(5)

目錄

謝詞 ...1 摘要 ... I Abstract ... II 表目錄 ... IV 圖目錄 ... VI 第一章緒論 ...1 第一節研究動機 ...1 第二節研究目的 ...4 第三節待答問題 ...5 第四節名詞解釋 ...6 第五節研究範圍與限制 ...8 第二章文獻探討 ...9 第一節體積、容量與容積教材分析 ...9 第二節建構反應題 ...17 第三節認知診斷模式 ...22 第三章研究方法 ...27 第一節研究流程 ...27 第二節研究工具 ...30 第三節實驗設計 ...33 第四節研究對象 ...45 第四章研究結果 ...47 第一節「體積、容量與容積」單元選擇題與建構反應題題型分析 ...47 第二節模擬資料分析 ...57 第三節實證資料分析 ...59 第五章結論與建議 ...73 第一節結論 ...73 第二節建議 ...75 參考文獻 ...76 中文部分 ...76 英文部分 ...79 附件一、體積、容量與容積試題命題卡 ...82 附件二、指標 5-n-19 體積、容量與容積試題 ...96

(6)

表目錄

表 2-1-1 國小五年級體積、容量與容積相關的能力指標與分年細目整理 ...11 表 2-1-2 國小五年級體積、容量與容積相關的認知屬性整理 ...12 表 2-1-3 與體積、容量與容積相關的錯誤類型或迷思概念的整理 ...13 表 2-1-4 能力指標與錯誤類型關聯表 ...15 表 2-2-1 將建構反應題應用於教育測驗上的相關研究 ...20 表 2-3-1 分數的減法認知屬性 ...25 表 2-3-2 「分數的減法」例題數 ...25 表 2-3-3 例題之 Q 矩陣 ...25 表 2-3-4 受試者的認知屬性狀態 ...25 表 3-2-1 「體積、容量與容積」認知屬性一覽表 ...31 表 3-2-2 「體積、容量與容積」Q 矩陣 ...32 表 3-3-1 「體積、容量與容積」錯誤類型一覽表 ...36 表 3-3-2 「體積、容量與容積」命題卡示例 ...37 表 3-3-3 全部的受試者認知屬性標記未知 Q 矩陣 ...38 表 3-3-4 不同比例的受試者認知屬性標記已知之 Q 矩陣 ...40 表 3-3-5 建構反應題的認知屬性標記為已知 Q 矩陣 ...43 表 4-1-1 選擇題題型之信度分析 ...48 表 4-1-2 第 11 題之試題選項分析 *表示正確選項 ...49 表 4-1-3 第 13 題之試題選項分析 *表示正確選項 ...49 表 4-1-4 第 15 題之試題選項分析 *表示正確選項 ...50 表 4-1-5 試題難度表 ...51 表 4-1-6 試題鑑別度表 ...51 表 4-2-1 模擬「不同比例受試者認知屬性標記已知」之診斷辨識率 ...57

(7)

表 4-3-1 「不同比例受試者認知屬性標記已知」之診斷辨識率 ...60 表 4-3-2 「受試者認知屬性未知」與「建構反應題認知屬性標記已知」診斷辨 識率比較 ...62 表 4-3-3 「受試者認知屬性未知」與屬性 A1 標記已知診斷辨識率比較 ...63 表 4-3-4 「受試者認知屬性未知」與屬性 A3 標記已知診斷辨識率比較 ...63 表 4-3-5 「受試者認知屬性未知」與屬性 A7 標記已知診斷辨識率比較 ...64 表 4-3-6 「受試者認知屬性未知」與屬性 A8 標記已知診斷辨識率比較 ...66 表 4-3-7 「受試者認知屬性未知」與屬性 A10 標記已知診斷辨識率比較 ...67 表 4-3-8 「受試者認知屬性未知」與屬性 A11 標記已知診斷辨識率比較 ...68 表 4-3-9 「受試者認知屬性未知」與屬性 A12 標記已知診斷辨識率比較 ...69 表 4-3-10 「受試者認知屬性未知」與「不同建構反應題的認知屬性已知」診斷 辨識率比較 ...70 表 4-3-11 DINA 模式下模擬資料與實證資料「不同比例受試者認知屬性標記已 知」之診斷辨識率比較 ...72

(8)

圖目錄

圖 3-1-1 研究流程圖 ...29 圖 3-3-1 專家知識結構圖（賴淑錦等人，2009） ...35 圖 3-3-2 模式一：全部受試者認知屬性標記未知 ...39 圖 3-3-3 模式二：不同比例的受試者認知屬性標記已知 ...42 圖 3-3-4 模式三：建構反應題認知屬性標記已知 ...44 圖 4-2-1 第 21 題解題歷程分析 ...53 圖 4-2-2 第 22 題解題歷程分析 ...54 圖 4-2-3 第 23 題解題歷程分析 ...55 圖 4-2-4 第 24 題解題歷程分析 ...56

(9)

第一章緒論

本研究的目的在於以模擬資料及實証資料探討結合建構反應題之認知診斷模式估計，藉由認知診斷測驗判斷受試者認知屬性與診斷辨識率的比較。本章共分為四小節，第一節說明「研究動機」；第二節說明「研究目的」；第三節說明「待答問題」；第四節說明與本研究相關的「名詞解釋」；第五節說明「研究範圍與限制」。

第一節研究動機

九年一貫課程(教育部，2003)強調教學應以學生為主體，以學生的數學能力發展為考量，透過教學評量分析學生的學習問題，做適當的診斷、導引與解決。教育測驗與評量除了能測量出學生的學習狀況，若能診斷出學生在學習上所缺失的訊息，則教師就能利用這些診斷訊息來進行有效的補救教學。Nichols （1994）即主張傳統評量理論並無法提供有效的訊息，因此，他提倡將認知科學（cognitive science）與心理計量學（psychometrics）結合，發展新的診斷評量方法，以幫助教學目標的達成。Nichols 將這種新的診斷評量方法，稱為認知診斷評量

（cognitively diagnostic assessment,簡稱為CDA）（涂金堂，2003）。使用認知診斷模式（cognitive diagnostic models, CDMs）時，須依據測驗目的建立所要評量的認知屬性，再考量屬性的難易度與相似程度組合成試題，並藉由關聯矩陣（incidence matrix）或稱為Q矩陣，Q矩陣表示每個試題對應到的概念（Tatsuoka, 1985）。施測者可藉由受試者的試題反應組型與Q矩陣，推估受試者具備或缺乏哪些認知屬性，進而據此瞭解受試者的學習狀況，進行補救教學（de la torre, 2008）。

認知診斷模式能將受試者的認知變量進行量化的分析，藉此了解受試者的認知概念與參數的特徵分布。以目前的認知診斷模式而言， Junker & Sijtsma

(10)

（ 2001）提出 NIDA 模型（Noisy Input; Deterministic “And” gate model）；Hartz （2002）提出 RUM 模型（Reparameterized Unified Model）；de la Torre （2009a）提出DINA（Deterministic Input; Noisy “And” gate）模式均是。其中 DINA 模式採用了較簡單的模式定義。以往認知診斷評量以選擇題為主，選擇題具有計分容易、客觀、可靠等特性，它在計分上有客觀性及使用的便利性，卻易受猜測因素影響，而建構式反應題（constructed-response）可測量學生整合、應用、分析等能力，其試題取樣範圍也更廣泛和具代表性，可以透過解題歷程具體了解哪些是學生已有或未達成的認知屬性，不像選擇題容易受猜測因素的影響，無法真實了解學生對概念的理解情形（盧雪梅，2009；教育部，2004）。在 IRT（Item Response Theory）模式中，受試者的能力定義在連續量尺，故專家很難給予適當之標記，而在認知診斷模式中是診斷受試者有無此認知屬性，屬於離散的資料，專家較容易定義認知屬性之有無，但如果要定義全部受試者在所有認知屬性之有無，亦是費時又費力。因此，本研究欲透過增加建構反應題或實作測驗，期能透過部分的認知屬性已知之認知診斷模式估計演算法獲得更多的資訊以瞭解受試者的學習狀況。國小數學課程中「體積」、「容積」與「容量」屬於「量與實測」領域，容量是一種三維的量，需從寬度、長度、高度三者同時掌握（張淑怡，2004）。 NCTM(National Council of Teachers of Mathematics)在2000年提出的Principles and Standards for School Mathematics中聲明量與實測課程因為在實際生活中常常運用得到，所以不論從幼稚園到中學都是非常重要的，容積與體積的學習對其他數學領域也提供了學習和應用的機會（NCTM，2000；陳穆鶯，2005），顯示了容積與體積在國小學童數學能力中的重要性。綜上所述，本研究擬以國小五年級學童之「容量」、「容積」與「體積」教材做為研究範圍，配合九年一貫能力指標分年細目表中五年級部分「5-n-17 能認識體積單位『立方公尺』，及『立方公分』、『立方公尺』間的關係，並作相關計算」、

(11)

「5-n-18：能理解長方體和正方體的體積公式」、「5-n-19：能理解容量、容積和體積間的關係」將與學科專家討論之建構反應題型，紀錄學生的解題歷程，針對學生建構反應題之解題歷程先以人工閱卷的方式進行診斷分析，更利用模擬資料分析與實證資料分析部份認知屬性已知對整體認知屬性掌握的成效，冀望此分析結果可運用於教學現場，作為進行補救教學或設計成電腦化適性學習或測驗之參考。

(12)

第二節研究目的

基於上述之研究動機，本研究以國小階段五年級「容量」、「容積」與「體積」為研究範圍，有以下目的：一、「容量」、「容積」與「體積」選擇題與建構反應題題型開發分析。二、模擬資料分析「不同比例受試者認知屬性標記已知」的認知診斷模式參數估計之成效比較。三、實證資料分析「不同比例受試者認知屬性標記已知」的認知診斷模式參數估計之成效比較。四、實證資料分析「建構反應題認知屬性標記已知」的認知診斷模式參數估計之成效比較。

(13)

第三節待答問題

根據上述之研究目的，本研究之待答問題條述於下：一、「容量」、「容積」與「體積」之選擇題與建構反應題題型測驗題目品質與測驗信度是否良好? 二、模擬資料中加入「不同比例受試者認知屬性標記已知」是否能提升認知診斷模式參數估計成效? 三、實證資料中加入「不同比例受試者認知屬性標記已知」是否能提升認知診斷模式參數估計之成效？四、實證資料中加入「建構反應題認知屬性標記已知」是否能提升認知診斷模式參數估計之成效？

(14)

第四節名詞解釋

一、能力指標

本研究中涵蓋的能力指標範圍指教育部（2003）頒訂的「國民中小學九年一貫課程綱要修訂版」數學學習領域中，五年級有關容量、容積和體積的分年細目。「5-n-17 能認識體積單位「立方公尺」，及「立方公分」、「立方公尺」間的關係，並作相關計算」、「5-n-18：理解長方體和正方體的體積公式」、「5-n-19：能理解容量、容積和體積間的關係」三項能力指標。

二、認知屬性

認知屬性是指學生在學習「容量、容積與體積」單元後所需具備的數學概念與能力。研究者配合九年一貫能力指標分年細目表中五年級部分「5-n-19：能理解容量、容積和體積間的關係」的數學能力指標為依據，由學科專家共同討論分析分析學生在學習後應具備之認知屬性，共十二個認知屬性，建置相關的試題，也就是學生在學完此單元應具備之能力。

三、診斷辨識率

本研究使用診斷辨識率（diagnosis accuracy rate, ACC）評估兩種認知診斷模式演算法則之成效。辨識率是指受試者的認知屬性狀態在認知診斷模式的估計是否與專家判定的結果一致，辨識率愈高，其估計的結果愈準確。公式如下：

診斷結果

(15)

Yes（1） n₁₁ n₁₀ （專家判斷） No（0） n₀₁ n₀₀ 其中N_{為本測驗資料樣本數。}nij代表真值（或專家判斷）為i且估計結果為j的事件總數。辨識率計算公式為：ACC= N n n₁₁+ ₀₀

(16)

第五節研究範圍與限制

本研究以國小階段五年級體積、容量與容積單元為範圍，來進行選擇題與建

構反應試題之編製，「表面積」、「不規則容器」並未列入討論範圍。由於取樣較

不易，因此本研究取樣採立意抽樣，研究結果具有內容的特定性，無法直接推論至其他單元。

(17)

第二章文獻探討

本研究以「五年級容量、容積和體積單元」為例，建置含選擇題與建構反應題型的認知診斷測驗，本章將對與本研究相關文獻進行探討，分為以下幾節：「容量、容積和體積教材分析」、「建構反應題型」以及「認知診斷模式」。

第一節體積、容量與容積教材分析

壹、「體積、容量與容積」的意義

在國民中小學九年一貫課程綱要中，量與實測是國小數學的核心課程之一，其中量包含長度、重量、容量、時間、角度、面積、體積等生活中常用的七種量。其中長度、容量、角度、面積、體積屬於幾何（視覺）量（教育部，2003）。學童若缺乏量的概念，將造成解題上的困難（劉秋木，1996），本研究就容量、容積和體積三個部分加以分析探討。一、容量的概念一般人所稱的容量，有時是指「液量」，有時是指「容量」。嚴謹的來說，容量是指流體物質佔滿容器的最大盛載量，藉容器所盛裝液量的最大限度，以平容器口為準，即用容器所能盛載的最大液量來表示該容器的容量。例如：杯子裡裝滿的水量（教育部，2003）。二、容積的概念可定義為某一具有確定三度空間的周界內的空間大小，通常此空間有容納物質可以隨時存取的功能。換言之，為容器內部空間的大小；也就是空體（中間是空的物體，例如：箱、桶、罐、倉庫等）所能容納物體的體積大小，其概念是體

(18)

積概念，例如：冰箱內部的容積（教育部，2003）。三、體積的概念可定義為物體在空間所佔的大小。單位是長度的立方數，如立方公尺、立方公分。例如：長方體的體積可由長、寬、高相乘所得。學者的研究中也對體積的區分做了不同層面的定義（引自譚寧君，1996）：一、外體積（external volume）即透過視覺，知覺到的物體占空間的大小，不論其為實心或空心，如：皮球、積木或空桌子。二、內體積（internal volume）即物件內部空間大小，此乃指空心物件的內部容積，一般指的是裝載固體的小個物，如：盒子內可裝27 個白色小積木，表示盒子的容積是 27 立方公分。三、排他性體積（displace volume）即物件體積的大小是透過排出的液量表示原物件的體積，如：石頭的體積，可透過將其擲入滿水位的水缸內，流出的液體體積即表示石頭的體積。

四、液積與容量（liquid volume and capacity）

液積表示液體所佔有空間的量，代表液體體積又稱液量。容量則是容器的最大裝載量，一般表示裝載液體的量。綜合以上所述，可分析得容量是代表「容器所盛的最大液量」，而容積則是「容器內部的大小」，最後體積則主要指「立體物所占的空間大小」。本研究將以此概念來分析認知屬性，並進行認知診斷測驗的編製。

貳、單元教材地位

本研究依據教育部於 2003 年頒佈「九年一貫課程綱要」數學學習領域中「體積、容量與容積」相關的能力指標標示如下表2-1-1。

(19)

表 2-1-1 國小五年級體積、容量與容積相關的能力指標與分年細目整理 年級分年細目內容能力指標 2-n-15 能認識容量，並作直接比較。 N-1-14 2-s-01 能認識周遭物體上的角、直線與平面（含簡單立體形體）。 S-1-03 二 2-s-01 能認識周遭物體上的角、直線與平面（含簡單立體形體）。 S-1-03 3-n-13 能利用間接比較或以個別單位實測的方法比較不同容器的容量。 N-1-15 三 3-n-14 能認識容量單位「公升」、「毫公升」（簡稱「毫升」）及其關係，並作相關的實測、估測與計算。 N-1-16 N-1-17 四 4-n-17 能利用間接比較或以個別單位實測的方法比較不同體積的大小，並認識體積單位「立方公分」。 N-1-15# N-1-16# 5-n-17 能認識體積單位「立方公尺」，及「立方公分」、「立方公尺」間的關係，並作相關計算。 N-2-15 N-2-16 5-n-18 能理解長方體和正方體的體積公式。（同5-s-07） N-2-17 S-2-07 5-n-19 能理解容量、容積和體積間的關係。 N-2-18 5-s-06 能運用「頂點」、「邊」與「面」等構成要素，辨認簡單立體形體。 S-2-01 五 5-s-06 能運用「頂點」、「邊」與「面」等構成要素，辨認簡單立體形體。 S-2-01 6-n-13 能理解簡單直立柱體的體積為底面積與高的乘積。（同6-s-06） N-3-17 S-3-06 6-s-05 能認識直圓錐、直圓柱與直角柱。 S-3-05 6-s-06 能理解簡單直立柱體的體積為底面積與高的乘積。（同6-n-13） N-3-17 S-3-06 六 6-a-05 能用中文簡記式表示圓面積、圓周長與柱體的體積公式。 S-3-04 S-3-06 綱要中能力指標係依主題及階段學習能力而訂定，然因多數指標須採分年進階式教學方能達成其教學目標。第二階段與此單元相關能力指標為「N-2-15 能認識測量的普遍單位，並處理相關的計算問題」、「N-2-16 能理解普遍單位間的關

(20)

係，並在描述一個量時，作不同單位間的換算」、「N-2-17 能理解長方形面積、周長與長方體體積的公式」、「N-2-18 能理解容量、容積和體積間的關係」，因此，由階段能力指標演繹出更細緻的分年細目及詮釋，以利分年進階式教學進度目標的明確掌握（教育部，2003）。本研究針對五年級分年細目部分，從中歸納出各分項的認知屬性，如下表2-1-2。 表 2-1-2 國小五年級體積、容量與容積相關的認知屬性整理 分年細目認知屬性（A4）能計算立方公尺與立方公分換算，1 立方公尺=1000000 立方公分。 5-n-17 能認識體積單位「立方公尺」，及「立方公分」、「立方公尺」間的關係，並作相關計算。（A6）能計算立方公尺與立方公分二階單位換算。（A1）能運用長方體體積公式。 5-n-18 能理解長方體和正方體的體積公式。（A2）能運用正方體體積公式。（A3）能計算容器內部體積。（A5）能了解容積的定義。（A7）能計算容量換算成容積 1 公升=1000 立方公分。（A8）能計算容積與容量換算成容積 1 毫升=1 立方公分。（A9）解決容積換算應用問題。（A10）能計算有厚度容器容積。（A11）能報讀有刻度容器內水位升降的高度應用題。 5-n-19 能理解容量、容積和體積間的關係。（A12）能計算不規則物體體積的應用問

(21)

題。

参、錯誤類型分析

錯誤類型是指在數學分析答題歷程中所產生的系統性錯誤（system error），這種錯誤的緣由是來自於穩定的錯誤或因不完全、誤導的學習概念所造成，可能由學生自行所建構而成，與專家知識有所出入，其特點是高度抗拒改變，經常會造成學習障礙（許志毅，2004）。在學習數學過程中學生產生的錯誤概念，容易造成解題上的困難。許多學者也提出了關於此單元的錯誤類型與迷思概念的研究，資料統整鄭涵（2010）等人研究，歸納如下表2-1-3： 表 2-1-3 與體積、容量與容積相關的錯誤類型或迷思概念的整理 研究者錯誤類型王瑋樺（2001） 1. 瞭解題意，但無法列出算式。 2. 以關鍵字選擇運算的方法。 3. 不瞭解算式的概念。 4. 無法了解題目中字、詞或數字含意和題意。徐存姮（2003） 1. 無法分辨立方公分與平方公分的不同。 2. 平方公分的概念不完整，影響立方公分概念的建立。 3. 長度公分的概念不完整、影響對平方公分概念的建立。 4. 計算時轉換單位錯誤。張淑怡（2004） 1. 對「容量」定義概念不清楚。 2. 缺乏相互性的邏輯運思能力。 3. 欠缺單位換算的能力。 4. 估側策略除憑靠量感外，多以「單位」作判斷標準。

(22)

5. 量感不足且缺乏有效的估量策略。劉政霏（2005） 1. 使用錯誤的符號運算。 2. 高低階單位換算乘除符號錯誤。 3. 進位時的錯誤。 4. 直接將二階單位做運算。 5. 將數值直接做加減。 6. 容量概念錯誤。劉穎民（2005） 1. 計算錯誤。 2. 進位、退位錯誤。 3. 抄錯題目數字。 4. 不懂題目意思。紀承耀（2007） 1. 對二階單位間的關係不清楚。 2. 乘法概念不夠清晰。 3. 小數位值概念錯誤。 4. 誤解題意。 5. 乘法計算錯誤。 6. 除法計算錯誤。康軒手冊（2008） 1. 不知道公升與毫公升的關係。 2. 不瞭解毫公升與c.c.間的意義。鄭涵（2010） 1. 「公升」與「毫公升」的單位換算概念不清 2. 「分公升」與「毫公升」的單位換算概念不清 3. 忽略單位 4. 無毫公升量感 5. 不瞭解ml 與c.c.的意義

(23)

6. 估測能力的不足 7. 直接由題目數字來實測(實測能力的不足) 8. 以視覺判斷 9. 直接由數了幾個刻度點來表示實測結果(實測能力的不足) 10. 容量概念錯誤 11. 進位或退位錯誤 12. 其他計算錯誤 13. 將數值直接做運算 14. 使用錯誤的數字運算 15. 使用錯誤的符號運算 16. 直接將二階單位做運算 17. 高低階單位換算乘除符號錯誤 18. 不懂題意 19. 以關鍵字來判斷題目所需要的運算方法 20. 欠缺解題策略及運算能力從文獻中與研究者教學經驗，從中可以歸納彙整五年級學生學習「體積、容量與容積」單元時容易產生的錯誤概念有：「對『容量』定義概念不清楚」、「欠缺單位換算的能力」、「量感不足且缺乏有效的估量策略」、「高低階單位換算錯誤」、「瞭解題意，但無法列出算式」、「不瞭解算式的概念將數值直接做加減」、「不瞭解題意」、「使用錯誤的符號運算」。根據以上所彙整出的錯誤類型與能力指標，再參考專家學者與實際教學工作者的意見，整理出本研究單元之分年細目與錯誤類型的關聯表如表2-1-4。 表 2-1-4 能力指標與錯誤類型關聯表

(24)

分年細目錯誤類型 5-n-17 能認識體積單位「立方公尺」，及「立方公分」、「立方公尺」間的關係，並作相關計算。 1. 立方公分與立方公尺換算錯誤。 2. 單位未換算。 3. 數字位值看錯。 5-n-18 能理解長方體和正方體的體積公式。 1. 體積公式概念錯誤。 2. 體積與高概念混淆。 3. 計算錯誤。 4. 不懂題意，直接由題目數字來實測。 5. 不懂題意，直接乘除或加減。 5-n-19 能理解容量、容積和體積間的關係。 1. 容積概念錯誤。 2. 容積與重量概念錯誤。 3. 立體圖形厚度估算錯誤。 4. 公升與毫公升單位轉換錯誤。 5. 立方公分與毫公升單位換算錯誤。 6. 單位未換算。 7. 數字位值看錯。 8. 對於題意了解錯誤。 9. 其他計算錯誤。

(25)

第二節建構反應題

依據林世華、盧雪梅、陳學志等（2004）「國民中小學九年一貫課程學習成就評量指標與方法手冊」提到，教學評量方法可約略區分為三類：1.選擇式反應測驗題；2.建構式反應測驗題；3.實作評量。其中建構反應題是指由學生自行組織、思考產生答案之試題。常見建構式反應題有填充題（completion item）和論文題（essay question），論文題有時也稱作開放式問題（open-ended question）。填充題通常要求學生提供一明確答案，而論文題允許學生自由建構、組織和呈現想法，根據給予學生組織和表達觀念的自由程度，論文題可分為兩大類：限制反應題（restricted-response question）和擴展反應題（extended-response question），擴展反應題又稱申論題。

壹、選擇題

選擇式反應測驗題（selected-response items）要求學生從試題提供的選項中，挑選出適當的答案，無須自己建構答案，又稱客觀式測驗題（objective items），閱卷者在評分時無法做個人判斷。選擇題、是非題、配合題均屬此類。選擇題的結構包括題幹和選項兩個部分。題幹的部分為呈現問題，可用直接問句（direct question）或不完全敘述句（incomplete statement）。一般來說，直接問句題幹敘述可能較長，但題意較清晰。題幹之後通常有三到五個選項，包括一個正確或最佳答案（指單選題而言）和數個誘答選項（distracters）。誘答選項的設計應與正確答案有似真性或邏輯合理性，吸引對此認知屬性不甚理解的學生選擇，並提醒所有學生謹慎思考判斷。選擇題有以下幾項優點：（1）可以測量不同層次的學習結果，適用於各種不同的學科，結合影音媒材，可以測量學生聆聽能力、情境觀察能力等生活技能，

(26)

也是題組（即解釋式問題，interpretive exercise）最常使用的題型。因此，選擇題是目前最普遍使用的評量方式。（2）和是非題相比，其題意較清楚明確，受到猜測因素和學生反應心向的影響較小；此外，選擇題之誘答選項經過精心設計，可以提供有價值之診斷訊息，了解學生錯誤所在。（3）和開放式問題（open-ended questions）與實作評量相比，其計分容易、客觀、可靠，若採電腦閱卷計分則更正確和快速，除此，其試題取樣範圍也更廣泛和具代表性，換言之，在技術面，選擇題有較高的信度和較佳的內容效度。選擇題有以下幾項限制：（1）編製具有誘答力的誘答選項並非容易的事，若誘答編製不佳，不但喪失誘答功能，甚至成為學生答題的線索。（2）和開放式問題相比，選擇題較無法測量到學生書寫表達、統整和組織的能力；和實作評量相比，選擇題無法測量到「做」（doing）的能力。（3）和建構式反應題（如填充題和開放式問題）相比，選擇題較容易受猜測因素影響。

貳、限制反應題

限制反應題對學生反應的內容和形式加以設限，常在問題中指明討論主題的內容範圍和反應的方式，例如「比較選擇題和論文題的信度和效度。」有時也可能限制作答的篇幅。限制式反應題的另一種變通題型，是給予學生一些使用導引材料（introductory material），如同解釋式問題一樣，但要求學生根據提示說明提出和建構答案，即以論文題取代選擇題或是非題。限制反應題有以下幾項優點：（1）適合用來測量解釋、應用和分析資訊的能力。（2）和選擇式反應題相比，限制反應題可免於猜測因素影響，在試題預備上也較容易；此外，限制反應題可測量學生組織和書寫表達的能力（3）和擴展反應題相比，學生答題方向與範圍較能和預期測量的目標相符，較有利於計分，在試題取樣上也能較廣泛，內容效度較佳。也有以下幾項限制：（1）和選擇式反應

(27)

題相比，限制式反應題在閱卷計分上較費時、費力，而且評分較不易客觀；除此，試題取樣範圍亦有限，較不易具代表性，內容效度較差。（2）和擴展反應題相比，較無法測量到組織、統整和創意表達的能力。相對而言，擴展反應題給予學生相當大的答題自由，學生可以自由選擇自己認為有關的知識，根據自己最佳的判斷組織答案，整合和評鑑自己認為適當的想法觀念，並將之呈現出來。但以下幾項限制：（1）給予學生作答自由度大，不適合用來測量特定的學習結果，且造成計分上的困難。（2）和限制反應題相比，計分難度增高，試題取樣範圍亦更為侷限，信度和內容效度受到的威脅更大。本研究採用之建構反應題屬於「限制反應題」。我們透過限制反應題既可免於猜測因素影響施測結果，也不若擴展反應題因學生作答自由度大，而難以客觀評分。透過研究者設計的題型，寄望能改良限制反應題在閱卷計分上較費時、費力，而且評分較不易客觀的缺點。

参、建構反應題與選擇題的比較

選擇題與建構反應題各有優劣，增加建構反應題的優勢在於：一、在估計上，透過增加額外的已知訊息，如：建構反應題，可增加模式的精準度。透過分析學生作答建構反應題時所列的式子，可以具體瞭解學生對欲測之概念是否了解或哪些是學生已知的認知屬性；而選擇題常會受猜測因素的影響，無法真實瞭解學生對概念的理解情形，除非經過訪談才能確認。二、建構反應題計分較選擇題複雜，若欲知道學生的認知屬性訊息，需要蒐集學生資料一一的做人工比對才能判定學生已知的認知屬性，當我們希望以有限的人力成本進行，只判定部分的認知屬性或是部份的受試者認知屬性，就可以達到提升精準度的效果。三、若整份試題都採用建構反應題，學生的作答反應時間會增加很多，以一

(28)

堂課四十分鐘，若作答時間拉長學生會受到疲勞等其他外在因素影響，故以一堂課而言，可增加數題的建構反應題來增加測驗的準確度。由文獻中可發現目前已有許多學者提出選擇題的不足，並設法在測驗中加入建構反應題以及將建構反應題應用於教育測驗上的相關研究，表2-2-1臚列研究者整理歸納近年來國內學者的相關研究。 表 2-2-1 將建構反應題應用於教育測驗上的相關研究 研究者測驗題型研究內容摘要賴淑錦（2009）多元評量以國小五年級「容量」單元為研究領域，進行容量單元之多元評量設計。探藉由多元評量活動及問卷調查，觀察五年級學生在多元評量活動上的表現。討多元評量的設計理念。黃文信（2009）選擇題與建構反應題電腦化測驗多以選擇題呈現，雖能收集到的學生作答歷程，但非常有限。希望能從建構反應題收集更多學生的作答反應，並由記錄解題時所做的所有動作來分析學生的錯誤類型。周麗莉（2009）選擇題與建構反應題建構題型電腦化測驗採部分給分模式，按作答反應分項計分，對於觀察學生的作答能力的面向較完備，比選擇題型電腦化測驗按選項結果一視同仁的計分方式更具有彈性及公平性，並且能減少學生答題時的猜測因素。施淑娟、賴淑錦、郭伯臣、吳慧珉（2009）選擇題與建構反應題建構反應題題型將完整呈現受試者的想法與作法，並記錄受試者作答的解題歷程，比起選擇題題型，能提供更多元的錯誤類型，也能更正確地判斷出受試者真實的錯誤類型，讓受試者本身或是授課教師參考。巫俊杰（2010）選擇題與建構反應題透過電腦呈現建構適性題庫，是傳統紙筆測驗無法實行的。藉由分析建構反應題可以診斷出學生的迷思概念以及需要補救教學的部分，進而針對學生需要加強的部分進行補強。

(29)

莊峰魁、王文卿、劉育隆、郭伯臣（2010）建構反應題建構反應題可以完整記錄學生的解題歷程，除了可以減少施測後教師閱卷的時間，快速診斷出受試者所犯的錯誤類型，最重要的功能是可了解學生在作答的過程中思考的歷程，而非一般測驗僅能獲得最後的答案，降低學生作答時的「猜測」比例，得到更為精確的評量成效。鄭涵（2010）選擇題與建構 反應題 開發建構反應題型，能夠紀錄學生解答非例行性問題的解題歷程，並針對學生在建構反應題之解題歷程進行自動化分析、計分及診斷學生的錯誤類型，除了降低教師的閱卷負擔之外，使用貝氏網路作為概念習得與錯誤類型分析工具，其分析結果更可作為教師設計補救教學活動，或進行電腦化適性教學之參考。建構反應題應用在診斷測驗上的研究，範圍包含國中、國小的數學科與自然科，至今已有不少的成果。從文獻中可以發現，大部分具有建構反應題的診斷測驗會結合選擇題並以電腦化診斷測驗作為推估工具；而利用電腦進行自動化分析錯誤類型的研究，也都必須先用人工閱卷的方式建立模型以達到良好的分析成效。因此，本研究將利用「建構反應題」的優點，蒐集作答反應資料，將結果提供教師設計補救教學活動或進行電腦化適性測驗之參考。

(30)

第三節認知診斷模式

壹、認知診斷模式定義

傳統評量的目的在透過精心篩選的題目，將學習者依照一定的順序排列在某種潛在變量的連續量尺上。傳統評量主要根據邏輯分類與內容細目來進行評量設計，但這些評量設計缺乏對該領域知識結構與歷程的詳細描述。近年來，認知心理學對教學與學習歷程提供更多的診斷和有用的訊息，以此理論為基礎所建立的教育評量較能正確的評量出學習者真實性的認知能力（涂金堂，2003）。此種結合認知科學（cognitive science）與心理計量學（psychometrics）的新興評量模式， Nichols（1994）特別將其稱為「認知診斷評量」，主要討論學生潛在的特質與作答反應之間的關係，透過受受試者在測驗中的作答反應型態推論其認知歷程及知識結構（Nichols, 1994；余民寧，1995；涂金堂，2003）。因此認知診斷模式的開發和相關測驗分析十分重要，從中建構出能夠融合不同認知變量的模型，並且能夠準確的估計出模型中的參數來，才能對各個認知變量進行量化的分析，藉此了解受試者的認知屬性與參數的特徵分布。認知診斷模式是可判斷受試者優勢、劣勢的心理計量模式，它提供了受試者的分數形態可用來測量學生的學習狀態和進步情形（de la Torre, 2009b）。認知診斷模型可分為潛在特質模型（latent trait model）和潛在分類模型（latent class model）兩大類。國內外研究者關於認知診斷模型的開發相當蓬勃，其中，比較具有代表性的是以 Fischer（1973）的線性邏輯潛在特質模型（linear logistic trait model, LLTM）為基礎的潛在特質模型和以Tatsuoka （1983）的規則空間模型（rule space model, RSM）為基礎的潛在分類模型（de la Torre, 2009；王文卿，2010）。

認知診斷模式表示試題與技能的關係時，須依據測驗目的建立所要評量的認知屬性，再考量屬性的難易度與相似程度組合成試題，並藉由關聯矩陣，通常以 Q矩陣（Qmatrix）表示每個試題對應到的概念（Tatsuoka, 1985）。施測者可藉由

(31)

受試者的試題反應組型與Q矩陣，推估受試者具備或缺乏哪些認知屬性，進而據此瞭解受試者的學習狀況，進行補救教學（de la torre, 2008）。Q矩陣在認知診斷測驗設計上具有相當重要地位，例如：Rupp&Templin （2008）探究不正確使用或不適合的Q矩陣的結果。 Q矩陣表示每一個題庫中的試題所需要測量的認知屬性，若有K個認知屬性及J個試題，則Q矩陣大小為J× ，K q 代表要解答第jk j個試題，是否需具備認知屬性k ，Q矩陣內公式的定義如下： ⎩ ⎨ ⎧ = 其他 k 需要認知屬性假如答對試題j 0 1 jk q （1）舉例來說，我們假設Q矩陣如下： ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ = 1 0 1 0 1 0 0 0 0 1 0 1 0 0 1 1 Q 代表第一題需要認知屬性1和2，而第二題需要第1個和第3個認知屬性，第三題只需要認知屬性第4個。

貳、DINA 認知診斷模式

DINA 模式是許多認知診斷評估模式的基礎（Doignon & Falmagne, 1999； Tatsuoka, 1995），該模式的創建與流行始於 Junker 等人（2001）的研究。該模式適用於二元計分的認知診斷測驗，是屬於非補償性（noncompensatory）模式，即學生不具備某一認知屬性時，無法藉由精熟其他認知屬性補償。DINA 模式假定受試者答對某試題的機率，會受到粗心（slip）及猜測（guess）兩個參數影響，數學運算式表示如下：

(32)

ij ij j j ij s g s g X P( =1|

α

, , )=(1− )η 1−η （2）其中，

∏

= = K k q ik ij jk 1 α η sj =P(Xij =0|ηij =1) gj =P(Xij =1|ηij =0) （3）上述公式中 j s ：粗心參數，表示受試者具備了正確作答試題 j 所要求的認知屬性（ηij =1）卻因為粗心而答錯此題的機率。 j g ：猜測參數，表示受試者缺少一個以上試題所需的認知屬性（ηij =0）卻因為猜測而答對此題的機率。 ik α ：表示受試者 i 是否具備認知屬性 k，具備該屬性其值為 1，反之為 0。 jk q ：表示解試題 j 是否需要認知屬性 k，需要該屬性其值為 1，反之為 0。 ij η ：表示受試者 i 是否完全具備試題 j 所需具備的認知屬性，完全具備其值 為1，反之，缺少一個以上所需認知屬性其值為 0。模式中，規定（1-s ）>_j g ，也就是說假定受試者具備答對試題 j 的認知屬_j 性者比不具備答對 j 的認知屬性者答對試題 j 的可能性大。DINA 模式將學生分為 兩類，一種為掌握了作答所需具備的全部認知屬性，另一類受試者至少有一個必需的認知屬性未掌握，也就是說只要少了一個解題所需的認知屬性，答對的機率將大大的降低，如果受試者答對該試題，則歸屬於猜測答對的情形發生。以de la torre（2008）中的範例說明：表 2-3-1 為分數的減法的認知屬性，表 2-3-2 為測驗學生是否具備這些認知屬性而設計的題目，表 2-3-3 為例題之 Q 矩陣，由表2-3-4 可知，解此題目需具備認知屬性 A1~A3。

(33)

表 2-3-1 分數的減法認知屬性 表 2-3-2 「分數的減法」例題數 = − 12 7 12 4 2 （A） 12 3 2 （B） 4 1 2 （C） 12 9 1 （D） 4 3 1 表 2-3-3 例題之 Q 矩陣 A1 A2 A3 A4 A5 試題 1 1 1 1 0 0 表 2-3-4 受試者的認知屬性狀態 認知屬性敘述 A1 從整數部分借1 A2 基本分數減法 A3 化簡 A4 將整數與分數部分分開 A5 將整數變成分數認知屬性受試者 A1 A2 A3 A4 A5 學生1 1 1 1 1 0 學生2 0 1 0 0 1 學生3 0 1 1 1 1

(34)

假設試題參數s1=0.2 、g1=0.2今有三名受試者，其所具備的認知屬性如表 2-3-4所示，可知學生1 具備解題所需的三個認知屬性，因此其η11=1，學生2 及學生3 都有缺少一個以上的認知屬性，因此其η21=η31=0，則三位受試者的答對機率經計算後分別為0.8、0.2、0.2。具備解題所需的三個認知屬性只有學生1，答對機率最高，在DINA模式的界定下，學生2及學生3缺少一個以上的認知屬性，若答對則是是屬於猜測的機率。由上述可知，DINA模式採用了簡化的模式定義，僅涉及到「粗心」和「猜測」兩個參數，雖然簡單，卻有很好的的模式適配（de la Torre &Douglas, 2004, 2005）。本研究使用上述之步驟為基礎，結合建構反應題之認知診斷模式演算法則進行估計。

(35)

第三章研究方法

本研究依據國小康軒、翰林、部編版課程中「體積、容量與容積」學習內容，與學科專家共同討論自編試題，並整理歸納出相關的錯誤類型，將其中部分題目作為建構反應題，先進行紙筆測驗收集資料，再進行認知屬性未知與兩種演算法的資料分析模擬。本章將說明相關的研究方法，分為以下幾節：「研究流程」、「研究工具」、「模擬實驗設計」及「研究對象」。

第一節研究流程

為達到研究目的，本研究的研究步驟如下，其研究流程如圖3-1-1：步驟 1：擬訂研究主題，蒐集相關文獻，整理歸納出錯誤類型，與學科專家共同討論出認知屬性與Q 矩陣，進行實證資料分析與模擬資料分析。步驟 2：模擬資料分析：進行模擬實驗設計，設定 s 和 g 參數和實驗樣本人數，隨機抽樣進行資料分析。步驟 3：使用 DINA 模式進行模擬資料分析，評估「不同比例受試者認知屬性標記已知」之診斷辨識率成效。步驟4：實證資料分析：編寫命題卡，自編「體積、容量與容積」試題與建構反應題，進行預試收集資料及修正試題後正式施測整理歸納出錯誤類型，與學科專家共同討論出認知屬性與Q 矩陣，編寫命題卡，自編「體積、容量與容積」試題與建構反應題，進行預試收集資料及修正試題後正式施測。步驟5：將實際施測所得到的選擇題與建構反應題之解題歷程與結果進行認知屬

(36)

性分析，分析學生作答反應的資料；藉由訪談分析學生在選擇題的解題

歷程。結合專家知識結構與學生作答反應資料，建立專家Q 矩陣。

步驟6：使用 DINA 模式進行實證資料分析，分別分析「不同比例受試者認知屬

性標記已知」、「建構反應題認知屬性標記已知」之診斷辨識率成效。

(37)

圖 3-1-1 研究流程圖 DINA 估計結論與建議實證資料分析模擬資料分析參數設定s 和 g 均為 uniform（0.1,0.45）建立 Q 矩陣建立錯誤類型資料認知屬性預試與修正試題正式施測分析作答資料建立專家Q 矩陣編製「體積、容量與容積」試題文獻探討「建構反應題認知屬性標記已知」之診斷辨識率成效評估 DINA 估計「不同比例受試者認知屬性標記已知」之診斷辨識率成效評估「不同比例受試者認知屬性標記已知」之診斷辨識率成效評估

(38)

第二節研究工具

壹、OX 軟體 利用 ox 軟體，配合 de la Torre（2008, 2010）撰寫的 DINA 模式程式，估計受試者在認知屬性的狀態。 貳、MATLAB R2010a 本研究使用之MATLAB 軟體，其主要功能用於數值運算，另外還有為數眾多的附加工具箱（Toolbox）它也適合不同領域的應用。本研究使用 MATLAB 數據分析以及附加工具箱的特點，撰寫自動化分析工具。参、能力指標轉化認知屬性本研究目的之ㄧ在建置建構反應題之電腦適性診斷測驗，研究者與學科專家以及具有多年教學經驗的國小老師共同制訂「體積、容量與容積」的課程內容範圍，整理出該範圍內共12 個認知屬性，如表 3-2-1 與「容量、容積和體積」Q 矩陣，如表3-2-2。

(39)

表 3-2-1 「體積、容量與容積」認知屬性一覽表 代號認知屬性 A1 _{能運用長方體體積公式} A2 能運用正方體體積公式 A3 _{能計算容器內部體積} A4 能計算立方公尺與立方公分換算，1 立方公尺=1000000 立方公分 A5 能了解容積的定義 A6 _{能計算立方公尺與立方公分二階單位換算} A7 能計算容量換算成容積1 公升=1000 立方公分 A8 _{能計算容量換算成容積}_{1 毫升=1 立方公分} A9 _{解決容積換算應用問題} A10 能計算有厚度容器容積 A11 能報讀有刻度容器內水位升降的高度應用題 A12 能計算不規則物體體積的應用問題

(40)

表 3-2-2 「體積、容量與容積」Q 矩陣

A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12 總計

Item 1 1 0 0 0 0 0 0 0 0 0 0 0 1 Item 2 1 0 0 0 0 0 0 0 0 0 0 0 1 Item 3 0 1 0 0 0 0 0 0 0 0 0 0 1 Item 4 0 1 0 0 0 0 0 0 0 0 0 0 1 Item 5 1 0 1 0 0 0 0 0 0 0 0 0 2 Item 6 0 0 0 1 0 0 0 0 0 0 0 0 1 Item 7 1 0 0 1 0 0 0 0 0 0 0 0 2 Item 8 0 0 0 1 0 0 0 0 0 0 0 0 1 Item 9 1 0 0 0 1 0 0 0 0 0 0 0 2 Item 10 0 1 0 0 1 0 0 0 0 0 0 0 2 Item 11 1 0 0 1 1 0 0 0 0 0 0 0 3 Item 12 0 0 0 1 0 1 0 0 0 0 0 0 2 Item 13 1 0 0 0 0 0 1 0 0 0 0 0 2 Item 14 1 0 0 0 0 0 0 1 0 0 0 0 2 Item 15 1 1 0 0 0 0 0 1 0 0 0 0 3 Item 16 0 0 0 0 0 0 0 0 1 0 0 0 1 Item 17 0 0 0 0 0 1 0 1 1 0 0 0 3 Item 18 0 0 1 0 0 0 0 0 0 1 0 0 2 Item 19 0 0 0 0 0 0 0 0 0 0 1 0 1 Item 20 1 0 0 0 0 0 0 0 0 0 0 1 2 Item 21 0 0 0 0 0 0 1 0 0 0 0 0 1 Item 22 1 0 1 0 0 0 0 1 0 1 0 0 4 Item 23 0 0 0 0 0 0 0 1 0 0 1 0 2 Item 24 0 0 1 0 0 0 0 0 0 1 0 1 3 總計 11 4 4 5 3 2 2 5 2 3 2 2

(41)

第三節實驗設計

本研究探討加入建構反應題比較分析認知診斷模式參數估計之成效：一為將不同比例的受試者之認知屬性標記為已知；一為透過建構反應題，將部分的認知屬性定義為已知的標籤。 壹、模擬實驗設計 此部分使用模擬樣本資料的實驗方式，模擬不同認知屬性分佈與不同能力分佈的受試者，對試題參數不變性估計的準確性與受試者認知屬性的診斷診斷辨識率的影響。一、模擬受試者人數本模擬實驗設計依據實證資料所取樣本人數 312 人採用隨機抽樣，共抽出十筆資料。二、屬性個數屬性 12 個。三、參數設定參數設定 s 和 g 分佈均為 uniform（0.1,0.45）在DINA 模式下進行人數 10~50%的屬性診斷辨識率的模擬比較。 貳、實證資料設計 本研究目的之ㄧ在建置建構反應題之電腦適性診斷測驗，以下對試題編製的過程進行說明：一、建立內容效度研究者與學科專家以及具有多年教學經驗的國小老師共同制訂「體積、容量與容積」的課程內容範圍，整理出該範圍內共12 個認知屬性；由文獻中探討錯

(42)

誤類型錯誤類型如表3-3-1；並建立專家知識結構如圖 3-3-1 與原始 Q 矩陣，同時依據分析受試者建構反應題解題歷程與個別晤談建立本研究效標。二、紙筆測驗試題確定專家知識結構後，以每個題目包含1～4 個認知屬性為原則，試題有兩種題型共24 題，分別為「選擇題」、「建構反應題」，編製後命題卡例題如表3-3-2，完整內容詳見附件一，試題完整紙筆測驗試題內容如附件二。三、紙筆測驗試題的信度分析本研究參考鄭涵（2010）編製之國民小學五年級數學領域「容量」單元試題與紀承耀（2007）國小五年級學童容量單位合成與分解單元試題，測驗長度共24 題，含選擇題20題，建構反應題4題，本測驗之Cronbach’s α 值達0.80，顯示本研究試題具有良好的信度。建構反應題題型之建置是由專家知識結構中挑選出具有較高層次且適宜之認知屬性，設計成建構反應題。

(43)

圖 3-3-1 專家知識結構圖（賴淑錦等人，2009） A2 能運用正方體體積公式【3、 4、10、15】 A11 能報讀有刻度容器內水位升降的高度應用題【19、23】 A4 能計算立方公尺與立方公分換算，1 立方公尺=1000000 立方公分【6、7、8、11、12】 A9 解決容積換算應用題【16、17】 A12 能計算不規則物體體積的應用題【20、24】 A7 能計算容量換算成容積 1 公升=1000 立方公分【 13、21】 A6 能計算立方公尺與立方公分二階單位換算【12、17】 A10 能計算有厚度容器容積【18、22、24】 A3 能計算容器內部體積【5、18、22、24】 A5 能了解容積的定義【9、 10、11】 A1 能運用長方體體積公式【1、2、5、7、9、11、13、 14、15 、20、22】 A8 能計算容量換算成容積 1 毫升=1 立方公分【14 、15、17、22、23】 5‐n‐19 能理解容量、容積和體積間的關係

(44)

表 3-3-1 「體積、容量與容積」錯誤類型一覽表 代號錯誤類型內容 B1 體積公式概念錯誤 B2 計算錯誤：加減法錯誤 B3 計算錯誤：乘除法錯誤 B4 容積概念錯誤 B5 其他計算錯誤 B6 不懂題意，直接由題目數字來實測 B7 立方公分與立方公尺換算錯誤 B8 公升與毫公升單位轉換錯誤 B9 立方公分與毫公升單位換算錯誤 B10 單位未換算 B11 容積與重量概念錯誤 B12 數字位值看錯 B13 不懂題意，體積與高概念混淆 B14 立體圖形厚度估算錯誤 B15 不懂題意，直接乘除或加減 B16 對於題意了解錯誤

(45)

表 3-3-2 「體積、容量與容積」命題卡示例 編號（S1）（A01）能運用長方體體積公式題目（）1.算出下面圖形中長方體的體積？（ c 72 d 22 e 18 f 13 ）立方公分選項選項1 選項2 選項3 選項4 反應類型 ◎ 4×3×6=72 （B5）其他計算錯誤 3×6+4=22 （B1 ）體積公式錯誤。 3×6=18 （B15）直接由題目數字來加減 4+3+6=13 欠缺的認知屬性（A01）能運用長方體體積公式（A01）能運用長方體體積公式（A01 ）能運用長方體體積公式編號（S2） （A01）能運用長方體體積公式 題目（）2.長方體的體積是 336 立方公分，長是 8 公分，寬是 6 公分，求此長方體的高是多少？（c322 d288 e24 f7 ）公分選項選項1 選項2 選項3 選項4 反應類型（B15）不懂題意直接相減 336－8－6=322 （B1）體積公式概念錯誤。 336－8×6=288 （B1）體積公式概念錯誤。 8+6=14 336÷（8+6）=24 ◎ 336÷ （8×6 ） =7 欠缺的認知屬性（A01）能運用長方體體積公式（A01）能運用長方體體積公式（A01）能運用長方體體積公式

(46)

参、估計模式

如圖 3-3-1、圖 3-3-2、圖 3-3-3 所示即是結合專家知識結構圖與原始 Q 矩陣所分析之模式圖，左右共分為兩個層次，最左邊是試題（Item 1- Item 24），其中 Item 21~ Item 24 為建構反應題，右邊為認知屬性（A1-A12），表示學生在解題過程中需要的認知能力。

一、模式一

全部的受試者認知屬性標記為未知，以-1 表示，最左邊是試題（Item 1- Item 24），右邊為認知屬性（A1-A12），下表3-3-3 為模式一之 Q 矩陣，結構如圖 3-2-2。 表 3-3-3 全部的受試者認知屬性標記未知 Q 矩陣

A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12

Sub 1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 Sub 2 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 Sub 3 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 Sub 4 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ‧ ‧ ‧ ‧ ‧ Sub j-3 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 Sub j-2 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 Sub j-1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 Subj -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1

(47)

圖 3-3-2 模式一：全部受試者認知屬性標記未知

試題

Item 1 Item 2 Item 3 Item 4 Item 5 Item 6 Item 7 Item 8 Item 9 Item 10 Item 11 Item 12 Item 13 Item 14 Item 15 Item 16 Item 17 Item 18 Item 19 Item 20 Item 21 Item 22 Item 23 Item 24

認知屬性

A 1 A 2 A 3 A 4 A 5 A 6 A 7 A 8 A 9 A 10 A 11 A 12

(48)

二、模式二不同比例的受試者認知屬性標記已知，以 1 或 0 表示，1 表示受試者具備該認之屬性，0 表示受試者位具備該認之屬性。本模式將所有受試者(Sub1、Sub2…、 Subj)試卷總分依序由高到低排列，區分成不同能力的五個群組，從五組中各抽取 10%、20%、30%、40%、50%到 90%的人，並由專家判定其認知屬性設其已知，利用MATLAB 撰寫的 DINA 程式以判別剩餘人數的未知之認知屬性，如下表 3-3-4 為模式二之 Q 矩陣。最左邊是試題（Item 1- Item 24），右邊為認知屬性（A1-A12），結構如圖 3-3-3。 表 3-3-4 不同比例的受試者認知屬性標記已知之 Q 矩陣

A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12

Sub 1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 Sub 2 1 0 0 0 0 0 0 0 0 0 0 0 Sub 3 0 1 0 0 0 0 0 0 0 0 0 0 ‧ 第一層 ‧ Sub a1 0 0 0 1 0 0 0 0 0 0 0 0 Sub a2 1 0 0 1 0 0 0 0 0 0 0 0 Sub a3 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ‧ 第二層 ‧ Sub b1 1 0 0 1 1 0 0 0 0 0 0 0 Sub b2 0 0 0 1 0 1 0 0 0 0 0 0 Sub b3 1 0 0 0 0 0 1 0 0 0 0 0 ‧ 第三層 ‧ Sub c1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 Sub c2 0 0 0 0 0 1 0 1 1 0 0 0 Sub c3 0 0 1 0 0 0 0 0 0 1 0 0 ‧ 第四層 ‧ 第五層 Subd1 0 0 0 0 0 0 1 0 0 0 0 0

(49)

Sub d2 1 0 1 0 0 0 0 1 0 1 0 0

Sub d3 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ‧

(50)

圖 3-3-3 模式二：不同比例的受試者認知屬性標記已知

試題

Item 1 Item 2 Item 3 Item 4 Item 5 Item 6 Item 7 Item 8 Item 9 Item 10 Item 11 Item 12 Item 13 Item 14 Item 15 Item 16 Item 17 Item 18 Item 19 Item 20 Item 21 Item 22 Item 23 Item 24

認知屬性

A 1 A 2 A 3 A 4 A 5 A 6 A 7 A 8 A 9 A 10 A 11 A 12

(51)

三、模式三本模式將所有受試者(Sub1、Sub2…、Subj)依序排列，建構反應題的認知屬性為A1、A3、A7、A8、A10、A11、A12，將部分的建構反應題認知屬性標記為已知，依獲得的認知屬性設計不同的比較模式，再進行資料分析模擬，下表3-3-5 為模式三之專家Q 矩陣。最左邊是試題（Item 1- Item 24），右邊為認知屬性（A1-A12）圖 3-3-4 為建構反應題認知屬性標記已知之模式圖 表 3-3-5 建構反應題的認知屬性標記為已知 Q 矩陣 *框線表示建構反應題認知屬性標記為已知

A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12

Sub 1 1 -1 0 -1 -1 -1 0 0 -1 0 0 0 Sub 2 1 -1 0 -1 -1 -1 0 0 -1 0 0 0 Sub 3 0 -1 0 -1 -1 -1 0 0 -1 0 0 0 Sub 4 0 -1 0 -1 -1 -1 0 0 -1 0 0 0 Sub 5 1 -1 1 -1 -1 -1 0 0 -1 0 0 0 ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ Sub j-4 1 -1 0 -1 -1 -1 0 0 -1 0 0 1 Sub j-3 0 -1 0 -1 -1 -1 1 0 -1 0 0 0 Sub j-2 1 -1 1 -1 -1 -1 0 1 -1 1 0 0 Sub j-1 0 -1 0 -1 -1 -1 0 1 -1 0 1 0 Sub j 0 -1 1 -1 -1 -1 0 0 -1 1 0 1

(52)

圖 3-3-4 模式三：建構反應題認知屬性標記已知

試題

Item 1 Item 2 Item 3 Item 4 Item 5 Item 6 Item 7 Item 8 Item 9 Item 10 Item 11 Item 12 Item 13 Item 14 Item 15 Item 16 Item 17 Item 18 Item 19 Item 20

認知屬性

A 1 A 2 A 3 A 4 A 5 A 6 A 7 A 8 A 9 A 10 A 11 A 12

(53)

第四節研究對象

壹、施測對象

本研究施測對象以台北市、南投縣、彰化縣、高雄縣、金門縣共十一個班級，五年級學生共計322 人，有效樣本共 312 份。

(54)

(55)

第四章研究結果

本章節依據研究目的，分別於以下各節呈現研究成果，共分為幾個部分：第一節，模擬資料分析「受試者認知屬性未知」與「部分的認知屬性已知」認知診斷模式參數估計之成效比較。第二節，「容量」、「容積」與「體積」選擇題與建構反應題題型分析，第三節，探討「受試者認知屬性未知」與「部分的認知屬性已知」認知診斷模式參數估計之成效比較。

第一節「體積、容量與容積」單元選擇題與建構反應題題型分

析

研究者依據國小康軒、翰林、部編版課程中「體積、容量與容積」單元學習內容，與學科專家共同討論建立專家知識結構圖與Q 矩陣，自編「體積、容量與容積」選擇題與建構反應題，並透過預試收集資料及修正試題，以下介紹選擇題與建構反應題題型之題目以及解題歷程分析。 壹、選擇題之題型分析 本研究依據古典測驗理論和受試者作答資料進行效度、信度、難度及鑑別度的分析。一、內容效度研究者與學科專家以及具有多年教學經驗的國小老師依據九年一貫能力指標「5-n-19：能理解容量、容積和體積間的關係」及國小「體積、容量與容積」的課程內容範圍，整理出該範圍內共12 個認知屬性，並建立專家知識結構。專家採用邏輯判斷的方式界定內容效度，同時依據受試者建構反應題解題歷程分析與個別晤談建立本研究效標。因此本項測驗具有良好的內容效度。二、信度

(56)

研究者與學科專家共同討論自編之試題經過預試，獲得之信度分析如下表 4-1-1。 表 4-1-1 選擇題題型之信度分析 題號答對人數答對率刪題後信度 Item 1 309 95.96 0.7976 Item 2 291 90.37 0.7874 Item 3 302 93.79 0.7931 Item 4 248 77.02 0.7944 Item 5 253 78.57 0.7854 Item 6 275 85.40 0.7910 Item 7 229 71.12 0.7825 Item 8 218 67.70 0.7879 Item 9 215 66.77 0.7912 Item 10 251 77.95 0.7834 Item 11 219 68.01 0.8060 Item 12 242 75.16 0.7852 Item 13 127 39.44 0.8043 Item 14 171 53.11 0.7920 Item 15 133 41.30 0.8068 Item 16 243 75.47 0.7930 Item 17 182 56.52 0.7903 Item 18 168 52.17 0.7963 Item 19 242 75.16 0.7964 Item 20 213 66.15 0.7875 由表中數據可知，經信度分析Cronbach’s α 值達 0.80，試題具有良好之效度，但在第11、13、15 題的部分刪題後信度有增高的情形，因此對此三題作進一步的分析。題目11.有一個水族箱，它內部的長是30公分、寬是17公分、高是15公分，下列何者描述正確？ c它的容積是 0.0765 立方公尺 d它的容積是 7650 毫升

(57)

e它的容積是 7650 立方公分 f它的容積是7650公克 表 4-1-2 第 11 題之試題選項分析 *表示正確選項 選項 1 2 3* 4 其他選項率 .07 .23 .68 .02 .00 高分組 .00 .16 .83 .00 .01 低分組 .15 .26 .53 .06 .00 第 11 題之試題選項分析如表 4-1-2，通過率 68.012，難度 0.6750，鑑別度 0.30，經個別訪談分析發現部分高分組受試者在課程上對於容積與容量概念並沒有做區隔，因此會將容積誤以為是容量的概念。與專家討論過後，此題可以確實測驗容積的定義，因此決定保留此題。題目13. 學校的游泳池長、寬、高分別是 2500 公分、800 公分、180 公分。如果將水注入直到裝滿游泳池，共需要多少公升的水？（c360 d36000 e360000 f360000000 ）公升 表 4-1-3 第 13 題之試題選項分析 *表示正確選項 選項 1 2 3* 4 其他選項率 .11 .16 .39 .32 .01 高分組 .05 .10 .70 .15 .00 低分組 .19 .16 .29 .36 .00 第13 題之試題選項分析如表 4-1-3 所示，通過率 39.441，難度 0.4937，鑑別度0.4125，此題運用到 A7（容量換算成容積 1 公升=1000 立方公分）的概念與 A1（長方體體積公式），經過訪談得知高分組答錯的受試者，多為沒有看到「公升」因此未進行單位的換算，經過專家會議的討論，決定修正題目在「公升」下

(58)

加底線以提醒受試者。題目15.下列哪一個容器裝滿水倒入一個容積 22178 毫升的花瓶之後不會溢出？ c長寬高 19 公分、1 公分、1 公分 d底邊長 25 公分、高 42 公分 e長寬高 19 公分、28 公分、45 公分 f底邊長 19 公分、高 63 公分 表 4-1-4 第 15 題之試題選項分析 *表示正確選項 選項 1* 2 3 4 其他選項率 .41 .11 .37 .10 .01 高分組 .60 .06 .24 .10 .00 低分組 .25 .11 .46 .16 .01 第 15 題之試題選項分析如表 4-1-4，通過率 41.304，鑑別度 0.35，難度 0.425，此題測量到複合的概念，分別為A1（能運用長方體體積公式）、A2（能運用正方體體積公式）、A8（能計算容積與容量換算成容積 1 毫升=1 立方公分），經過訪談受試者發現受試者對題意不甚了解，有的將「不會溢出」看成「會溢出」，有的則對底邊長的定義不清，經專家會議討論修正題目與選項如下：題目15.下列哪一個容器裝滿水倒入一個容積 22178 毫升的花瓶之後不會溢出？ c長寬高 19 公分、1 公分、1 公分 d底邊長和寬均 25 公分、高 42 公分 e長寬高 19 公分、28 公分、45 公分 f底邊長和寬均 19 公分、高 63 公分三、難度難度分析本研究採內部一致性（internal consistency），將受試者之得分按高

(59)

低排序，以全體受試人數最高分數之27%為高分組，全體受試人數最低分數之27% 為低分組，將每個試題高分組的答對率PH和低分組的答對率PL求平均值，此即為

該試題之難易度指數（item difficulty index）。本項測驗獲得之難度分析如下表 4-1-5： 表 4-1-5 試題難度表 試題難度試題難度 Item1 0.93 Item 11 0.68 Item 2 0.83 Item 12 0.68 Item 3 0.89 Item 13 0.49 Item 4 0.73 Item 14 0.58 Item 5 0.71 Item 15 0.43 Item 6 0.79 Item 16 0.72 Item 7 0.60 Item 17 0.54 Item 8 0.64 Item 18 0.53 Item 9 0.66 Item 19 0.72 Item 10 0.66 Item 20 0.62 本測驗之選擇題難度介於0.43～0.93（平均 0.6715），屬於中偏易的測驗試題符合認知診斷測驗理論。四、鑑別度本研究的試題鑑別度指標採內部一致性（ internalconsistency），將受試者之得分按高低排序，以全體受試人數最高分數之27%為高分組，全體受試人數最低分數之27%為低分組，將高分組的答對率PiH減低分組之答對率PiL即得該試題之

鑑別度指數di（item difficulty index）。本項測驗獲得之鑑別度指數如下表4-1-6：

表 4-1-6 試題鑑別度表

試題鑑別度試題鑑別度

Item 1 0.14 Item 11 0.30

(60)

Item 3 0.21 Item 13 0.41 Item 4 0.40 Item 14 0.65 Item 5 0.56 Item 15 0.35 Item 6 0.40 Item 16 0.51 Item 7 0.73 Item 17 0.66 Item 8 0.62 Item 18 0.61 Item 9 0.61 Item 19 0.45 Item 10 0.58 Item 20 0.66 本測驗之選擇題鑑別度約介於 .14 ~ .73 之間（平均 0.491），屬於優良的測驗試題，可作為本研究施測用之工具。 貳、建構反應題題型分析 以下為4 題建構反應題題型之題目以及解題策略分析流程： 一、第21 題（一）題目：一個底部正方形的啤酒桶，底邊長15 公分、高 60 公分，注入 9 公升的啤酒後，啤酒桶內的的啤酒高度是幾公分？（二）分析解題歷程：如下圖 4-2-1。

結合建構反應題之認知診斷模式估計成效-以國小體積、容量與容積單元為例

國立臺中教育大學教育測驗統計研究所

國民小學教師在職進修教學碩士學位班碩士論文

指導教授：許天維 博士

吳慧珉 博士

結合建構反應題之認知診斷模式估計成效

-以國小體積、容量與容積單元為例

研究生：呂淳郁 撰

中 華 民 國 一百零一 年 七 月

謝詞

摘要

Exploring the Performance of Cognitively Diagnostic

Model Incorporating Information of Constructed

Response Items

Abstract

目錄

表目錄

圖目錄

第一章 緒論

第一節 研究動機

第二節 研究目的

第三節 待答問題

第四節 名詞解釋

一、能力指標

二、認知屬性

三、診斷辨識率

第五節 研究範圍與限制

第二章 文獻探討

第一節 體積、容量與容積教材分析

壹、「體積、容量與容積」的意義

貳、單元教材地位

参、錯誤類型分析

第二節 建構反應題

壹、選擇題

貳、限制反應題

参、建構反應題與選擇題的比較

第三節 認知診斷模式

壹、認知診斷模式定義

貳、DINA 認知診斷模式

α

∏

第三章 研究方法

第一節 研究流程

第二節 研究工具

第三節 實驗設計

試題

認知屬性

試題

認知屬性

試題

認知屬性

第四節 研究對象

第四章 研究結果

第一節 「體積、容量與容積」單元選擇題與建構反應題題型分

析

指導教授：許天維博士

吳慧珉博士

研究生：呂淳郁撰

中華民國一百零一年七月

第一章緒論

第一節研究動機

第二節研究目的

第三節待答問題

第四節名詞解釋

第五節研究範圍與限制

第二章文獻探討

第一節體積、容量與容積教材分析

第二節建構反應題

第三節認知診斷模式

第三章研究方法

第一節研究流程

第二節研究工具

第三節實驗設計

第四節研究對象

第四章研究結果

第一節「體積、容量與容積」單元選擇題與建構反應題題型分