混合選擇題與建構反應題之國小六年級槓桿單元電腦化診斷測驗建置

全文

(1)國立臺中教育大學教育測驗統計研究所碩士論文. 指導教授：施淑娟博士. 混合選擇題與建構反應題之國小六年級槓桿單元電腦化診斷測驗建置. 研究生：王冊銓撰. 中. 華. 民. 國. 一. ○. 二. 年. 七. 月.

(2) 謝辭回想這兩年的碩士生涯，一路上承蒙朋友、家人的祝福與同學的陪伴，過程中除了付出的汗水與光陰，也收穫了更多的友誼與歡笑。感謝家人的支持，沒有他們的付出，我沒有辦法完成自己的夢想。感謝指導教授施淑娟老師的諄諄教誨，無論老師再忙，仍督促我們每個禮拜該有的進度不可荒廢，並且不厭其煩的幫我們解惑。在施測期間，老師還幫忙我們找尋施測的學校，關心我們施測的情形及學生作答情況，在論文寫作上，一遍又一遍的幫我修改論文內容及檢查格式，並適時地提出疑點，讓我省思問題的癥結，使我在論文寫作上更精進，在此非常謝謝老師。接著，我要感謝口試委員黃孝雲老師與吳慧珉老師撥冗費心審查，針對我的論文提出清晰、具體的建議，使本論文更加嚴謹完備。還有幫忙施測的老師，謝謝你們。除此之外，還要謝謝給予我許多幫助的俊華學長、俊彥學長、宗恩學長、彥鈞學長、敏嫻學姐，以及一起奮戰的同學-姵錡、緯誠、弘旻等，有你們的一路陪伴，才能在這條路上無怨無悔的奮鬥。最後，我要感謝我的家人支持我繼續攻讀碩士學位，感謝你們無怨無悔地為我付出，你們的包容是支持我完成學業的最大動力。. 王冊銓謹誌 2013 年 7 月. I.

(3) 中文摘要學生基本能力的培養在於學習科學與技術的探究方法和基本知能，並能應用所學於當前和未來的生活。在日常生活中，學生所接觸到關於槓桿原理的應用隨處可見，但是在教學現場，常常發現學生在學習的過程中出現許多的迷思概念。因此，本研究試圖以槓桿單元為例，建置一套包含選擇題與建構反應題的混合題型電腦化診斷測驗系統，利用此系統進行施測，以評估建構反應題的自動診斷效果，並結合貝氏網路(Bayesian networks)，探討包含建構反應題的試題對學生子技能與迷思概念診斷率的影響，研究結果發現：一、利用專家效標所建置之槓桿單元電腦化建構反應題型自動計分模式，不僅可以透過電腦立即診斷受試者的子技能與迷思概念，幫助教師增進教學的成效，更可以減輕教師閱卷的負擔。二、以 Cronbach α 係數計算加入建構反應題型試題內部一致性，其測驗信度.789，高於單純選擇題型試題，顯示本槓桿單元診斷測驗具有良好之信度。三、加入建構反應題之 3 種貝氏網路其平均辨識率皆高於僅加入選擇題之貝氏網路，其中又以第 4 種將建構反應題診斷結果視為已知模式的總平均辨識率為最高。顯示建構反應題題型所提供的子技能與迷思概念診斷訊息比單純選擇題型要來的更多，能有效提升貝氏網路的準確性。. 關鍵詞：建構反應題、貝氏網路、迷思概念、槓桿單元. I.

(4) Abstract The basic competences of students focus on developing science fundamental conception, inquiry skill and apply the acquired knowledge to present and future lives. Students tend to understand the leverage principle in the daily lives, yet misconceptions often occur in the learning settings. Therefore, this study aims to establish a computerized diagnostic test system with mixed item types such as multiple choice items and constructed-response items in the leverage unit. Next, this test system is applied to testing and analyzing the effect of automatic diagnoses of the constructed-response items. Moreover, by combining the Bayesian networks, this study discusses the influences of the constructed-response items on the cognitive diagnoses of students’ sub-skills and misconceptions. The results of study show as follows: 1. The auto-scoring model designed according to the experts’ diagnoses in the computerized constructed-response items not only offers the instant diagnostic feedback about participants’ sub-skills and misconceptions, but also enhances teachers’ teaching efficiency and lessens the burden of test correction. 2. The Cronbach α coefficient of the mixture of the constructed-response items indicates higher internal consistency reliability of .789 than the mere multiple choice items. 3. All. three. Bayesian. network. models. with. the. informations. of. constructed-response items indicate higher average recognition rates than the Bayesian network with the multiple choice items only. Among all, the Bayesian. network. model. which. the. diagnostic. results. of. the. constructed-response items regarded as known shows the highest average. II.

(5) recognition rate. The results suggest that the constructed-response items provide more diagnostic information about sub-skills and misconceptions than the mere multiple choice items to enhance the accuracy of the Bayesian networks.. Key words: constructed-response items, Bayesian networks, misconceptions, lever unit. III.

(6) 目錄第一章緒論....................................................................................................... 1 第一節研究動機 ........................................................................................... 1 第二節研究目的 ........................................................................................... 3 第三節名詞解釋 ........................................................................................... 3 第四節研究範圍與限制 ............................................................................... 5 第二章文獻探討............................................................................................... 7 第一節教材分析與迷思概念研究 ............................................................... 7 第二節迷思概念的診斷方法 ..................................................................... 14 第三節貝氏網路 ......................................................................................... 28 第三章研究方法............................................................................................. 31 第一節研究流程 ......................................................................................... 31 第二節研究對象 ......................................................................................... 32 第三節研究工具 ......................................................................................... 33 第四節槓桿原理單元電腦化建構反應題型設計 ..................................... 43 第五節評估方法與指標 ............................................................................. 47 第四章分析與討論......................................................................................... 51 第一節建構反應題題型計分模式分析 ..................................................... 51 第二節評估建構反應題對測驗診斷結果的影響 ..................................... 54 第三節貝氏網路在不同模式下的比較 ..................................................... 64 第五章結論與建議......................................................................................... 73 第一節結論 ................................................................................................. 73 第二節建議 ................................................................................................. 74. IV.

(7) 表目錄表 2-1-1 各版本槓桿原理教材整理 ................................................................. 9 表 2-1-2 各版本教材槓桿原理單元教學目標整理......................................... 9 表 2-1-3 國內外槓桿原理迷思概念研究整理............................................... 11 表 2-2-1 電腦化建構反應題文獻整理 ........................................................... 25 表 3-3-1 槓桿原理子技能列表 ....................................................................... 36 表 3-3-2 槓桿原理迷思概念列表 ................................................................... 37 表 3-3-3 預試試題評量架構表 ....................................................................... 38 表 3-3-4 試題難度鑑別度一覽表 ................................................................... 39 表 3-3-5 難度分析摘要表 ............................................................................... 40 表 3-3-6 鑑別度分析摘要表 ........................................................................... 41 表 3-5-1 選擇題第 25 題與建構題第 1 題迷思概念對應表......................... 47 表 3-5-2 選擇題第 26 題與建構題第 2 題迷思概念對應表......................... 48 表 3-5-3 選擇題第 27 題與建構題第 3 題迷思概念對應表......................... 48 表 4-1-1 建構反應題第一題作答反應編碼................................................... 52 表 4-2-1 測驗信度比較模式列表 ................................................................... 54 表 4-2-2 選擇題與建構反應題型的信度比較表........................................... 55 表 4-2-3 建構題第一題迷思概念統計表....................................................... 56 表 4-2-4 選擇題第 25 題命題卡 ..................................................................... 57 表 4-2-5 選擇題與建構反應題迷思概念比較............................................... 57 表 4-2-6 建構題第二題迷思概念統計表....................................................... 58 表 4-2-7 選擇題第 26 題命題卡 ..................................................................... 59 表 4-2-8 選擇題與建構反應題迷思概念比較............................................... 60 表 4-2-9 建構題第三題迷思概念統計表....................................................... 61 表 4-2-10 選擇題第 27 題命題卡 ................................................................... 62 表 4-2-11 選擇題與建構反應題迷思概念比較............................................. 62 表 4-3-1 貝氏網路 4 種模式子技能辨識率比較表....................................... 69 V.

(8) 表 4-3-2 貝氏網路 4 種模式迷思概念辨識率比較表................................... 70 表 4-3-3 貝氏網路 4 種模式總平均辨識率比較表....................................... 71. VI.

(9) 圖目錄圖 2-1-1. 第一類型槓桿：施力臂等於抗力臂............................................... 7. 圖 2-1-2. 第一類型槓桿：施力臂大於抗力臂............................................... 8. 圖 2-1-3. 第一類型槓桿：抗力臂大於施力臂............................................... 8. 圖 2-1-4. 第二類型槓桿：施力臂大於抗力臂............................................... 8. 圖 2-1-5. 第三類型槓桿：抗力臂大於施力臂............................................... 8. 圖 2-2-1. TIMSS 2007 科學試題 ................................................................... 20. 圖 2-2-2. 台灣 PISA 科學樣本試題 .............................................................. 21. 圖 2-2-3. KSAT 系統首頁 ............................................................................. 23. 圖 2-2-4. BNAT 系統首頁 ............................................................................. 24. 圖 2-3-1. 貝氏網路節點示意圖 ..................................................................... 28. 圖 2-3-2. 估算貝氏網路成效流程 ................................................................. 30. 圖 3-1-1. 研究流程圖 ..................................................................................... 32. 圖 3-3-1. 槓桿原理專家知識結構 ................................................................. 35. 圖 3-4-1. 建構題操作畫面 ............................................................................. 43. 圖 3-4-2. 建構題題目區 ................................................................................. 44. 圖 3-4-3. 建構題工具區 ................................................................................. 44. 圖 3-4-4. 建構題作答區 ................................................................................. 45. 圖 3-4-5. 受試者作答範例 ............................................................................. 45. 圖 3-4-6 「槓桿原理」單元正式題目卷選擇題範例................................... 46 圖 3-4-7 「槓桿原理」單元練習題範例....................................................... 46 圖 4-1-1. 建構反應題第 1 題自動診斷與計分模式..................................... 52. 圖 4-1-2. 建構反應題第 2 題自動診斷與計分模式..................................... 53. 圖 4-1-3. 建構反應題第 3 題自動診斷與計分模式..................................... 53. 圖 4-2-1. 建構反應題第 1 題學生迷思概念作答範例................................. 58. 圖 4-2-2. 建構反應題第 3 題學生迷思概念 B16 作答範例 ........................ 63. 圖 4-2-3. 建構反應題第 3 題學生迷思概念 B17 作答範例 ........................ 63 VII.

(10) 圖 4-3-1. 全選擇題型對錯結果貝氏網路圖................................................. 65. 圖 4-3-2. 建構反應題型對錯結果貝氏網路圖............................................. 66. 圖 4-3-3. 建構反應題型診斷迷思概念結果貝氏網路圖............................. 67. 圖 4-3-4. 建構反應題診斷結果視為已知貝氏網路圖................................. 68. VIII.

(11) 第一章緒論本研究主要是以貝氏網路為基礎，建立一套具備選擇題與建構反應題的國小自然與生活科技領域槓桿單元之電腦化診斷測驗，開發自動化分析建構反應題型，並比較混合題型與貝氏網路結合的不同模式之診斷效果。本章第一節說明研究動機；第二節說明研究目的；第三節說明名詞解釋；第四節說明研究限制。. 第一節研究動機自然與生活科技領域九年一貫課程綱要著重在培養學生的基本能力，學習科學與技術的探究方法和基本知能，並能應用所學於當前和未來的生活（教育部， 2003）。在日常生活中，學生所接觸到關於槓桿原理的應用隨處可見，包括腳踏車、剪刀、釘書機等都是日常生活中不可或缺的工具，因此在國民小學自然與生活科技領域國小六年級的課程中，槓桿原理為一個非常重要的學習單元。但是在教學現場，常常發現學生在學習的過程中出現許多的迷思概念，賴明照（2003）指出學習槓桿原理對國小學童而言是較為抽象的，學生學習後，往往不容易內化為自己的能力與知識，也因此產生許多的迷思概念。賴俊安（2012）也認為槓桿原理與工具的認識，若能從平衡的概念先介紹，再進入槓桿支點、施力點與抗力點的定義認識，就能正確判斷施力臂與抗力臂的長短，進而歸納出省力、費力工具的判定規則，學生只要能正確找出這些工具的「三點共存」位置，再利用省力、費力的判斷規則，就能解決槓桿課程的相關問題。因此，若能發展一套良好的診斷工具，協助教師及時發現學生的迷思概念，並予以補救教學，勢必有助於提升學生在槓桿單元的學習成效。早期的診斷測驗通常都是以紙筆測驗的方式進行，測驗結束後的閱卷總是費時又費力，若是能夠利用電腦化的方式進行診斷測驗，不僅可以省下人工閱卷的. 1.

(12) 時間，也可以讓教師在學生作答後立即得到作答反應的回饋（吳宜玲，2012）。因此若能利用電腦進行診斷測驗，除了可以即時獲得學生的作答反應外，也可以降低在閱卷過程中所耗費的時間。此外，在測驗題型部分，Berlak(1992)認為測驗除了包含選擇題外，也應該具有建構反應題等開放性試題。以選擇題的方式進行測驗，除了無法避免學生「猜測答案」的問題外，作答反應也未必是學生真正的學習成果，而建構反應題能夠真實記錄學生的作答反應，確保學生的作答並非因僥倖而猜中（鄭俊彥、黃玉臺、謝俊逸、劉湘川、郭伯臣、劉育隆，2010）。然而，全部都是建構反應題題型的測驗在實務上會因為施測時間過長而不可行，而且建構反應題的開發成本過高，所以比較實際可行的測驗通常會同時包含選擇題與建構反應題，因此，混合題型的電腦化測驗方式會是接下來發展的主要趨勢。而在教育測驗領域中，使用貝氏網路診斷學生學習成效的研究眾多（高健智， 2007；白曉珊，2008；林孟君，2009），因為貝氏網路是使用機率的方式來處理不確定性的問題，比過去相關研究所採用的分析模式在診斷學生的子技能與迷思概念的有無上能達到更正確的成果（蘇文君、汪端正、郭伯臣，2006），所以若能以電腦化試題進行線上測驗，並使用貝氏網路分析學生的學習成效，不僅可以節省人工判斷的時間，也可以提供有效的診斷訊息。黃瓊瑩（2011）的研究結果顯示，結合選擇題與建構反應題的貝氏網路分析，在命題概念、迷思概念之辨識率優於傳統選擇題之貝氏網路；蘇家鋒（2012）的研究結果也顯示加入建構反應題的自動化分析結果能偵測到更多的認知概念及錯誤類型。因此，本研究試圖混合選擇題與建構反應題題型，編製一套電腦化診斷測驗試題，並進行施測，以評估包含建構反應題的題型對迷思概念的診斷影響，並探討建構反應題題型之施測結果如何與貝氏網路結合以達到較佳的認知診斷成效。. 2.

(13) 第二節研究目的本研究是以國小六年級自然與生活科技領域的「槓桿原理」單元課程為基礎，研究目的如下：一、開發自動化分析建構反應題型計分模式。二、評估加入建構反應題型對測驗診斷結果的影響。三、比較傳統選擇題與加入建構反應題型後的貝氏網路對於學生子技能與迷思概念有無的診斷效果。. 第三節名詞解釋為能更清楚了解本研究之用語，將本研究所使用到的相關名詞解釋定義如下：. 壹、槓桿原理所謂的槓桿(level)指的是可繞固定轉軸或支點旋轉的工具，其中的固定點被稱作是支點，施力於槓桿的位置為施力點，從施力點到支點的距離稱為施力臂；抗力於槓桿的位置為抗力點，從抗力點到支點的距離稱為抗力臂，而力臂與力的大小的乘積則稱為力矩。在槓桿的一端施力產生力矩，另一端則有抗力的力矩，兩力矩的方向是相反的。若順時鐘力矩=逆時鐘力矩（施力 x 施力臂=抗力 x 抗力臂），此時槓桿就會達到轉動平衡（教育部『國民中學-學習資源網』網站，2013）。. 貳、迷思概念迷思概念一詞最早是出現在 Hancock 於 1940 年在美國科學教育期刊中所發表的一篇文章「An Evaluation of Certain Popular Science Misconception」（陳啟明， 1991），所謂的迷思概念是指相關概念的形成若與其領域專家所接受的概念不相同，則被視為與專家所認同的概念有所出入，則稱作迷思概念。迷思概念又稱做「錯誤概念」(error conception)、「另有想法」(alternative. 3.

(14) conception)、「另有架構」(alternative framework)、「先入概念」(preconception)等，雖然名詞不盡相同，但皆是指在某一特定科學概念中，對某件事情或某些現象，所具有的有別於目前科學界所公認概念的想法（張志銘，2003）。學生若存有迷思概念，對實驗的觀察和示範、對觀察的解釋、對科學課程的理解和記憶會有很大的妨礙（余民寧，1997），若能針對學生在學習中所產生的迷思概念，設計出有效的辨別與診斷方法，對於進行後續的補救教學將會有很大的幫助。因此本研究所謂的迷思概念是指學生在學習槓桿單元過程中所產生的錯誤想法。. 叁、建構反應題建構反應題(constructed-response items)就是所謂的非選擇題，主要是用在測量學生說明、整合、應用、分析、評估和傳達科學資訊的能力(National Assessment Governing Board, 2004)。學生依據題目作答，可以依照自己想法、自由表達與陳述解題的測驗題型，用來評量學生解釋前後因果關係、描述及應用原理、剖析論證、假設關係、組織與整合資訊、表達自我想法…等能力(Linn & Gronlund, 2000)。建構反應題可分為填充題與論文題兩種，其中論文題可再分為兩大類：限制反應題與擴展反應題，本研究所採用的建構反應題型屬於論文題型中的「限制反應題」，因為限制反應題型不僅可以避免一般選擇題型的猜測因素而影響作答結果，也不容易因為擴展反應題型作答範圍過大而難以客觀計分的問題。. 肆、貝氏網路貝氏網路(Bayesian networks)是結合機率與圖形理論，將不確定的事物加以描述與推論的工具(Pearl, 1988)，是一種由節點與連結所組成的非循環的有向圖 (directed acyclic graphs, DAGs)，其中的節點代表所研究的變項，連結代表變項間互相影響的關係，影響的強度可以用條件機率的方式來表達，並計算所有變項的各種狀態的聯合機率分布做為基礎來進行推論(Heckerman, Mamdani, & Wellman, 1995)。. 4.

(15) 第四節研究範圍與限制本研究因資源及人力限制的原因，探討的主題僅限於國民小學六年級自然與生活科技領域「槓桿原理」單元為主。研究樣本侷限於南投縣、彰化縣兩所國小六年級學生為施測對象，有效樣本共585人，研究取樣因地域限制，所得的結果不宜做過度之推論。. 5.

(16) 6.

(17) 第二章文獻探討本章根據研究目的加以探討，第一節分析自然與生活科技領域槓桿原理教材內容與相關的迷思概念，第二節介紹迷思概念的診斷方法和工具，以及電腦化診斷測驗的相關文獻分析與電腦化建構反應題的介紹，第三節介紹貝氏網路。. 第一節教材分析與迷思概念研究壹、槓桿原理教材整理槓桿可視為是一個可以繞著固定點移動的棍子（或橫木），在其上施力用來使物體產生形變或移動的工具。槓桿上用來固定支撐的點稱為支點，在棍上用力的點稱為施力點，放置重物或是反應的點則稱為抗力點（施惠，2009）。不同的的工具，其施力點、支點和抗力點位置可能都不同，依據支點的不同，可以分為三類：以下各種槓桿類型示意圖中，△代表支點，○代表抗力點，□代表施力點。一、第一類型槓桿：支點在中間時，可能省力或費力，也可能既不省力也不費力。（一）當支點正好位於槓桿的中點上時，施力臂和抗力臂相等，不省力也不費力。. 圖 2-1-1. 第一類型槓桿：施力臂等於抗力臂（郭重吉，2006）. 7.

(18) （二）當支點移向抗力點時，抗力臂較短，施力小於抗力，此時會省力。. 圖 2-1-2 第一類型槓桿：施力臂大於抗力臂（郭重吉，2006）（三）當支點移向施力點時，施力臂較短，施力大於抗力，此時會費力。. 圖 2-1-3 第一類型槓桿：抗力臂大於施力臂（郭重吉，2006）二、第二類型槓桿：抗力點位於施力點和支點之間，因為施力臂大於抗力臂，此時會省力。. 圖 2-1-4 第二類型槓桿：施力臂大於抗力臂（郭重吉，2006）三、第三類型槓桿：施力點位於抗力點和支點之間，因為抗力臂大於施力臂，此時會費力。. 圖 2-1-5. 第三類型槓桿：抗力臂大於施力臂（郭重吉，2006）. 8.

(19) 現行九年一貫自然與生活科技領域教材中，槓桿原理包括在「力與運動」概念中，並在國小六年級下學期進行教學，以下列出各版本有關槓桿原理的教材整理：表 2-1-1 各版本槓桿原理教材整理版本（年代）. 年級. 授課時間. 單元名稱. 翰林（2007）. 六. 下學期. 簡單機械. 康軒（2005）. 六. 下學期. 簡單機械. 南一（2009）. 六. 下學期. 巧妙的施力工具. 牛頓（2009）. 六. 下學期. 簡單機械的巧妙. 江文慈（1993）認為，槓桿平衡概念發展是一種高層次的認知能力，對照各家出版商皆將槓桿原理單元放在國小六年級下學期可得知要學習此一單元需要具備較高的判斷與理解能力。而各家出版商對於槓桿原理單元教材中的教學目標，研究者整理如下：表 2-1-2 各版本教材槓桿原理單元教學目標整理出版商（年代）. 教學目標. 南一（2009）. 1. 藉由「槓桿」了解施力臂與抗力臂的長短和省力、費力關係。 2. 設計實驗以數據檢視槓桿原理中省力與費力的解釋。 3. 細心觀察並測量滑輪、輪軸和齒輪等生活中施力工具的工作方式，經過實驗測量後，發現它們都是槓桿原理的應用，並了解其省力、費力的關係。 4. 由腳踏車、腳踏板、齒輪組和後車輪之間的輪軸和齒輪的組合，藉此了解腳踏車的機械功能。. 9. （續下頁）.

(20) 翰林（2007）. 1. 認識槓桿原理。 2. 經由操作槓桿實驗器，了解施力臂長短與施力的關係。 3. 經由操作輪軸實驗器，了解施力在輪與軸上的差別。 4. 利用滑輪實驗，了解定滑輪與動滑輪的差異性。 5. 認識腳踏車等簡單機械結合科技可以為人類帶來便利。. 康軒（2005）. 1. 探討利用槓桿省力的方法。 2. 探討定滑輪和動滑輪不同之處。 3. 察覺輪軸是槓桿原理的應用。 4. 察覺齒輪可以傳送動力，幫我們做事。 5. 應用傳送動力的方法製作玩具。. 牛頓（2009）. 1. 透過操作認識槓桿原理。 2. 透過操作、討論，認識輪軸和滑輪等簡單機械。 3. 透過實驗，察覺動力可以經由齒輪、鍊條等傳送。 4. 透過觀察、操作，察覺許多巧妙的工具常是簡單機械原理的應用。. 貳、槓桿原理相關迷思概念鐘聖校（1994）認為，迷思概念是學生藉由學校教育、日常生活經驗或其他途徑等綜合的影響，產生對某一科學概念錯誤的想法或錯誤的解釋，換句話說就是學生因某些因素所產生的認知，與教科書、教師或者科學界所認同的科學概念，有所不同的想法。蘇家鋒（2012）經過綜合比較各種文獻，歸納出迷思概念具有八種特性：一、過程性：迷思概念是在概念發展或是概念學習的過程中出現的。二、不完整性：對於問題的思考不夠細密周全，以至於說出的概念失之片面或零碎。. 10.

(21) 三、非正統性：鑑定迷思概念的依據是來自正統的、科學家或專家的說法，因此迷思概念乃是非正統的想法。四、思考性：迷思概念是陳述出來的內容，含有概念思考的成分，無論造成思考結果的方式是直覺、錯誤的類比、不正確的推理或是不成熟的運思。五、個別性：人們以自己的想法將外在的訊息內化到自己的認知架構中，用自己的經驗來建構事物的意義，故所得的概念具有個別性。六、普遍性：綜觀全球各地皆可發現許多一樣的迷思概念。七、不穩定性：許多學童在晤談前後迷思概念不一致，乃是學童對概念沒有清楚的認識，沒有確定的見解，因此想法易改變顯得不穩定。八、頑固性：有些迷思概念雖經過教師教學講解，但仍一再出現，讓學者不得不承認其根深蒂固的存在事實。研究者蒐集國內外近年來對於槓桿原理相關的迷思概念的研究，將資料整理如表2-1-3：表 2-1-3 國內外槓桿原理迷思概念研究整理研究者（年代）迷思概念研究結果 Roth (1991). 1. 大部分的學生在使用重量與距離乘積的規則前會發展與使用比例原則。 2. 大部分學生無法對距離正確的編碼。 3. 學生似乎使用先前解決問題的經驗來解決新的問題。（續下頁）. 11.

(22) Stepans (1994) 大多數學生誤用了槓桿原理，將槓桿兩邊的砝碼數與到支點的距離誤用相加來比較平衡與否，而許多學生對於將槓桿原理應用在生活上或把帶入課堂中也有困難，他們認為愈靠近支點，維持平衡所需施的力也愈少。游光純(2002). 高年級在槓桿力矩與平衡方面會有： 1. 砝碼個數多者會傾斜的想法。 2. 以一格力臂換一格砝碼的力臂與重量互補的想法。 3. 將力臂與重量混淆的想法。 4. 位置高低影響槓桿平衡的想法，認為物體高低會影響重量。 5. 懸掛方式影響槓桿平衡的想法，認為物體位於桿子上比較重。 6. 線的長短影響槓桿平衡的想法，認為掛物體的線愈長會愈重。. 賴明照(2003). 槓桿單元的學習對於國小學童而言是較為抽象的，諸如用掃帚掃地、釣魚、用鉛筆寫字、打棒球時，如何判定「支點」、「施力點」、「抗力點」的所在以及「施力臂」、「抗力臂」的認識，可能對大部分的學童並不是容易的事，何況是省力或省時的判定。. 張志銘(2003). 1. 部分學童認為物體愈靠近地面，重量愈重。 2. 部分學童將物體懸掛的線視為力臂的延伸或是一部份，線愈長的一端會愈重。 3. 部分學童會以直觀的體積大小或物體表面數量來認定物體的重量大小。（續下頁）. 12.

(23) 鄭景文(2008). 1. 多數學生只知道力能改變物體的運動狀態，不知道力能改變物體形狀。 2. 學生出現四類迷思概念，第一類認為力是能源，第二類是以詞彙來定義說明力，第三類將身體的痛、麻…等感覺，視為是力的現象，第四類是以直覺或是經驗來解釋說明力。. 戴文雄(2008). 1. 六年級學生對「槓桿定義、轉動概念、轉動條件、名詞理解及效果判定」的理解，表現皆顯著優於五年級學生。 2. 五、六年級學生對於槓桿的判定，在第一類槓桿的表現並無顯著差異；在非槓桿物體、第二和三類槓桿的表現，六年級學生顯著優於五年級學生。 3. 學生對槓桿之想法類型包括：外觀、施力、支撐、擺動、省力、類蹺蹺板、三點共存、轉動八種類型。五年級學生常以施力、支撐、擺動的想法來判定槓桿，而六年級學生常以三點共存的想法來判定槓桿。. 根據上述的文獻可以發現，學生在學習槓桿單元時會產生的迷思概念種類眾多，如果要將所有迷思概念都逕行施測恐遭致阻礙，因此研究者以「槓桿平衡」概念為主，選取其中較為常見的迷思概念如：一、學生對於重量與距離的乘積規則會以比例規則代替。二、無法正確判定施力臂、抗力臂，因而無法正確判斷此工具省力或費力。三、在槓桿平衡問題中，學生會出現以一格力臂換一格砝碼的想法。並參考九年一貫自然與生活科技領域課程綱要，設計成為所要測量的迷思概念誘答選項。. 13.

(24) 第二節迷思概念的診斷方法由於本研究旨在建置槓桿原理迷思概念的診斷測驗，故分析現行診斷科學概念相關迷思概念的工具與方法，分別是：晤談法、選擇題型的紙筆測驗、結合晤談與紙筆測驗的二階層診斷測驗、建構反應題型的紙筆測驗、電腦化診斷測驗和電腦化建構反應題。. 壹、晤談法以晤談來了解學童概念的情況，常見於各類迷思概念的研究中(林明軫，1994；姜滿，1997；陳義勳，1994；劉伍貞，1996)，研究者多以結構式或半結構式訪談的方式來獲取學童之概念，晤談的方式可以深入了解學童概念情況，而且受訪者不必透過紙筆，直接以語言的方式來說出心中的想法，研究者亦可以針對受訪者回答再深入追問相關概念。但晤談僅適用於少量樣本，因此此類研究多屬質化的研究。郭重吉（1990）、吳武雄（1993）將臨床晤談法分為三種：事例晤談、事件晤談及示範—觀察—解釋(demonstrate, observe, explain)晤談(簡稱 DOE 晤談)。王淑琴和郭重吉（1993）提及 DOE 晤談的特色和限制有：一、強調晤談示範的事件是真實的情境，學童可以觀察到實際的現象。適用探究一些比較複雜的、難以用文字或圖片表現的現象或事件。二、強調預測和觀察之間的比較。三、可比較學童預測時所持的理由與觀察後再一次的提出解釋，從中看出學童想法改變情形。四、可擴充成示範式群測實驗，但對個別學童深入引出想法部份則會受限。五、DOE 設計的任務可進一步加以應用，做為教學工具，改進教學法。六、由於需對示範實驗作預測，觀察和解釋等步驟，且要事先準備相關儀器，. 14.

(25) 較為費時費事，且易受場地之限制。七、晤談的事件必須能設計成可以示範的實驗，故其適用之晤談內容有限（引自楊志強，2001）。游光純（2002）也提到，在研究過程中容易遇到晤談題目的設計不易、晤談進行時，學生偶會停頓的問題，或是推翻先前選擇的情形，在資料的分析上也比較不易。因此也建議後續研究可以發展二階層診斷測驗，以更全面的收集學生的另有想法。. 貳、選擇題型的紙筆測驗傳統的紙筆測驗可以分為封閉式的選擇題測驗與開放式的問答題測驗（楊志強，2001），選擇題的功用，可以測量出各種不同程度的學習成果，如：知識、理解、應用、分析、綜合、評鑑或創造等認知能力；同時，也可以適用於各種不同學科範疇的教材內容，以作為測量認知能力的一種測驗工具（余民寧，2002）。黃雅婷（2007）利用次序理論(odering theory)結合自編之選擇題型測驗來進行國小六年級學生對於「平衡槓桿問題」解題規則的階層次序研究，研究結果顯示：總分不同的受試者，其在平衡槓桿問題所使用的解題規則次序性及階層有明顯不同；總分相同但反應組型不同的受試者，其解題規則次序性及階層亦有差異，而在不同組別的受試者之相似性係數達顯著差異，但不同性別受試者之間則無差異。. 叁、結合晤談與紙筆測驗的二階層診斷測驗在傳統的紙筆測驗中，最常使用選擇題的形式，好處是可以一次對大量學生施測，評分方式也相當客觀，缺點則是容易產生猜測的情況，也無法得知個別學生的想法；而為了得到學生的想法，晤談法也是常使用的一種方式，但此種方式不僅費時，也無法對大量學生施測。針對以上兩種缺點，Treagust (1995)便提出了二階層診斷測驗的方法來解決這個問題，其作法為：將題目分成兩個部分，第一. 15.

(26) 個部分包含了內容的回答，第二個部份則是回答選擇第一部分選項的理由，因為每個題目包含了兩個以上的選項要回答，猜對的機會便大大減少；但因為題目包含了許多選項，使得試題過於冗長且複雜，不僅印製時需要大量紙張，測驗時學生也容易失去耐心而隨便作答（江啟明，2010）。二階層診斷測驗（two-tier diagnostic test）發展程序分為三個階段，十個步驟，分別為：一、設定內容（一）分析學科單元內容，確定命題知識敘述，將相關敘述集合在一起。（二）發展與學科內容相關的概念圖。（三）將命題知識敘述與概念圖結合，檢視是否含有相同的概念。（四）請專家學者或教師進行修正，使其具有內容效度。二、獲得學生的迷思概念相關訊息（五）蒐集相關研究文獻，作為發展選擇題的選項基礎。（六）利用非結構化(unstructured)開放式問題對學生進行晤談，以了解學生的迷思概念類型。（七）發展開放性試題：每個試題後增設一個選項讓學生自由作答，以便獲得學生更多的概念或想法。三、發展診斷測驗工具（八）開發二階層診斷測驗工具：每一題中第一部分是選擇題，主要包含學科內容的知識評量，第二部分是選擇選項的理由，包含正確的答案、迷思概念與錯誤的答案。（九）設計一個雙向細目表，確定診斷工具包含命題知識敘述與概念圖中所有的概念。（十）持續修正：透過不斷收集相關文獻、試題，改進測驗工具使診斷測驗能符合需求。. 16.

(27) 黃國慶（2006）針對二階層測驗與傳統測驗在迷思概念上之效益比較研究中發現，就測驗研發的過程而言，編製二階層測驗需要花費比客觀式測驗更多的時間，才能完成。另外兩測驗在研究中，其信、效度的差異並不大，在測驗品質上而言，使用傳統選擇題測驗不會來得比二階層測驗來得差。最後，在教學回饋上，兩測驗都能收集到與文獻上相同的結果，顯示兩者都具有良好收集迷思概念的功能，甚至藉由 IRT (item response theory)中選擇題模式的分析，傳統選擇題測驗結果分析上，更能以圖形清楚說明哪一群能力值的學生可能產生的迷思概念；但是江啟明（2010）也提到，評量若以紙筆測驗的方式進行，整份測驗將顯得十分冗長，學生作答時容易失去耐心而胡亂作答，也可能出現學生先查看第二階段的理由選項，再回答第一階段的情形。因此綜合上述，以傳統選擇題測驗做為一個收集學生迷思概念的工具而言，不失為一個良好的選項，但是使用傳統選擇題作為施測的工具，仍舊無法避免猜測與題目冗長等問題，因此仍需要一套能夠減少施測誤差又能準確判讀學生迷思概念的診斷工具。. 肆、建構反應題型的紙筆測驗相較於選擇題，開放式的非選擇問答題可分為兩大類：一是完全自由，沒有任何限制的「申論題」(extended response type)；另一則是有局部限制作答範圍的「限制反應題」(restricted response type)。這類試題不僅可以測量學生對於組織表達能力方面的訓練成果，也可以促進學生認識、統整和表達自己的觀念。建構反應題即非選擇題，旨在測量學生說明、整合、應用、分析、評估和傳達科學資訊的能力(National Assessment Governing Board, 2004)。Linn & Gronlund （2000）也認為，建構反應試題能測量學生運用思考、解決問題、組織統整和表達想法的能力，即透過學生獨立思考、自我批判、組織整合、系統評鑑、並呈現成果。. 17.

(28) 盧雪梅（2009）將建構反應題分為填充題(completion item)與論文題(essay question)兩種，建構反應題(constructed-response items)的答案由學生產生和提供，需要人工閱卷計分，無法使用電腦閱卷，其中論文題也稱作開放式問題 (open-ended question)。填充題通常要求學生提供一明確答案，而論文題允許學生自由建構、組織和呈現想法。如果根據給予學生組織和表達觀念的自由程度，論文題可再分為兩大類：限制反應題 (restricted-response question) 與擴展反應題 (extended-response question)。其中限制反應題會設定學生的作答限制，在問題中指明討論主題的內容和作答方式，或給予學生一些指導，再要求學生根據提示給予作答，所以限制反應題可以用來測量學生應用、分析的能力，避免被猜測因素所影響；而擴展反應題又稱為申論題，學生可以自由表達想法、歸納並提出解答。擴展反應題相較於限制反應題的範圍更為開放，所以學生會花更多的時間思考事實間的因果關係，而習得比較分析觀念、問題解決的技巧（盧雪梅，2009）。因此本研究採用的建構反應題型屬於「限制反應題」，因為限制反應題型不僅可以避免一般選擇題型的猜測因素而影響作答結果，也不容易因為擴展反應題型作答範圍過大而難以客觀計分的問題，並希望能改善限制反應題型在閱卷上耗費人力、物力，評分不易客觀等等的缺點。以下介紹使用建構反應題型之紙筆測驗的國際大型評量測驗，做為開發本測驗之參考：一、國際數學與科學教育成就趨勢調查(Trends In International Mathematics and Science Study, TIMSS) 本調查旨在於評量各國學生數學與科學領域上學習成就的發展趨勢、了解各國學生數學及科學學習成就及其與各國文化背景、研究各國教育制度的差異等影響因子之相關性，並進一步作國際間之比較分析，以幫助各國提昇其教學與學習。目前全球有約80個國家參與此研究計畫。. 18.

(29) 最近一次的國際數學與科學教育成就趨勢調查為2011年舉行，調查的結果可作為我國數學與科學教育研究與實施之參考。探討之主題如下：（一）了解我國學生數學及科學學習成就，提供規劃我國中小學的數學及科學課程之參考。（二）了解我國學生數學及科學學習成就與學習環境、教師、家庭背景、父母態度、學齡前狀況因素等影響因子的關係，並進一步作國際比較分析。（三）了解我國學生國語學習成就對數學及科學學習的影響，並進一步作國際比較分析。（四）與TIMSS-R、TIMSS2003及TIMSS2007之結果作比較，了解我國學生在數學及科學學習成就之趨勢。（五）了解國際上評量學生學習成就的趨勢與新的評量方法，提供我國教師參考。（六）提昇國內研究人員資料分析研究能力。而TIMSS(2011)計畫目的在於調查我國四年級與八年級（國中二年級）之學生數學與科學學科學習成就，評估他們能否掌握參與社會所需的知識與技能，並比較各參與地區或國家的教育成效。圖2-2-1為TIMSS在2007年的八年級科學試題範例，是測驗受試者是否具備槓桿原理的相關知識，此題目屬於「物理」範疇中的「力與運動」主題，針對八年級學生進行測驗，並預期學生能描述物體的運動；能進行速度的計算；能詮釋距離與時間的關係圖；能依據對物體的施力預測物體運動狀態的改變；以及在密度與壓力部分，能對常見的物理現象中的密度與壓力有基本的認識等相關知識，學生必須依照題目的問題進行作答，並將答案寫在答案卷上完成測驗。. 19.

(30) 圖 2-2-1 TIMSS 2007 科學試題（取自 http://www.dorise.info/DER/01_timss_2007 _html/t2007_04_download.html#03）二、國際學生能力評量計劃 (the Programme for International Student Assessment, PISA) 本計劃重點在評估接近完成基礎教育的十五歲學生，對於未來生活可能面對的問題情境、準備的程度以及他們習得多少必備的知識和技能，並提供跨國際的比較，以及各國教育效能的分析，並由此界定國民素養的內涵。PISA評量內. 20.

(31) 容涵蓋閱讀，數學和科學三個領域的素養程度，每三年進行一次評量，每次評量會詳細測試一個學科領域，其他學科為輔，其學科週期的排列2000年以閱讀為主， 2003年數學為主，2006年科學為主，2009年又回到閱讀主科，2012年則是數學為主科，閱讀和科學為輔，另加測線上問題解決能力(problem solving)。. 圖 2-2-2 台灣 PISA 科學樣本試題（取自 http://www.nsc.gov.tw/cen/public/Attach ment/28211565271.pdf）評分說明：滿分：代號2：乙，腳踩踏板使曲柄均轉動一圈時，因小鏈輪的齒數較少（或半徑較小），小鏈輪（後車輪）轉動圈數較多，故行駛距離較遠。部分給分：代號1：（1）乙。（2）小鏈輪（後車輪）轉動圈數較多。零分：代號0：其他答案。代號9：沒有作答。. 21.

(32) 伍、電腦化診斷測驗一、電腦化診斷測驗的優勢在大型紙筆測驗中，建構反應題型可能包含有問答題及證明題，以傳統的方式仰賴人工閱卷，不僅耗費人力物力，閱卷時所花費的時間成本也是一大負擔。隨著近代電腦科技的蓬勃發展，許多紙筆測驗已經由傳統的人工閱卷轉變成電腦化測驗，以電腦代替人工來評估學生的學習成效與學習歷程（曾彥鈞，2007）。而電腦化診斷測驗也具有下列各種優勢（周文正，1998）：（一）蒐集學生作答反應，幫助測驗進行分析。（二）提升測驗計分的效率。（三）降低人工閱卷出錯的機率。（四）可重複練習，並及時給予學生回饋。（五）可用來進行適性測驗。（六）試題編製具有一致性，可使施測趨向於標準化。（七）可利用網際網路進行施測。二、電腦化診斷測驗的相關研究與發展由於電腦資訊科技的快速進展，在教育測驗領域上也有朝向利用電腦進行線上診斷測驗的趨勢，使測驗評量變得更活潑、生動。以下介紹常用於電腦化診斷測驗的評量工具，分別是「以知識結構為基礎的適性測驗系統」及「以貝氏網路為基礎的適性測驗系統」。（一）KSAT電腦適性診斷測驗 KSAT電腦適性診斷測驗系統(Knowledge Structure based Adaptive Test, KSAT) 為國科會補助研究計畫「國小數學科電腦化適性診斷測驗（I）（II）（III）（郭伯臣，2003，2004，2005）」之計畫， KSAT能精確的診斷出學習上的迷思概念，並節省施測時間，主要是因為 KSAT 系統在建置時，使用到專家知識結構、學. 22.

(33) 生知識結構、補救教學結構，而能達到「因材施測」、「因材施教」之成效（郭伯臣、謝友振、張峻豪、蔡坤穎，2005）。. 圖 2-2-3. KSAT 系統首頁. （二）BNAT適性診斷測驗暨學習系統以貝氏網路為基礎的適性診斷測驗暨學習系統 (Bayesian network based adaptive testing, BNAT)是利用貝氏網路為基礎的診斷測驗系統，命題時先針對教材、學生先備知識、錯誤類型、學習技能及能力指標來進行分析，並蒐集專家學者研究相關文獻找出學生可能發生之錯誤類型，完成專家知識結構之分析，並依此架構一個合乎邏輯推論的貝氏網路圖，再依據此架構來命題（施淑娟，2006）。當學生登入系統歡迎畫面後，會顯示學生的基本資料，確認完畢後才會開始進行測驗，測驗的每一題都必須要回答才能進行下一題，學生於測驗完畢後可立即看到學習診斷報告，給予最即時的回饋，報告中包含了百分等級落點參考、概念診斷列表，直指學生的錯誤類型與學習障礙，施以補救教學，且能列出通單元的學習紀錄，提供學生作為學習上的參考。. 23.

(34) 圖 2-2-4. BNAT 系統首頁. 為了符合本研究需要收集受試者作答歷程、並針對受試者的子技能與迷思概念進行自動化分析診斷的需求，因此本研究採用「BNAT 適性診斷測驗暨學習系統」作為施測工具。. 陸、電腦化建構反應題在電腦化診斷測驗發展的過程中，一開始是以選擇題題型為主，優點是客觀、閱卷簡單，缺點則是無法測得較深入的概念及因易於猜測而產生的不確定性（曾保閔，2012），因此慢慢地開始朝向建構反應題的方向發展。相較於選擇題，建構反應題能更有效的評估複雜的概念與技能，如解決問題所需具備的知識或能力等高層次的結構，而在大型的評量中，建構反應題通常只拿來分類受試者的答案，沒辦法提供有關於錯誤類型以及學生錯誤原因的診斷資訊，以信效度的觀點來看，建構反應題的閱卷與計分過程是非常耗時與耗費人力的，另外全建構反應題題型的題目設計會因為施測時間上的限制，在實務上通常是不可行的，而且建構反應. 24.

(35) 題的開發成本過高，所以比較實際可行的測驗通常會同時包含選擇題與建構反應題，因此，混合題型的電腦化測驗方式會是接下來發展的主要趨勢。國內關於電腦化建構反應題的相關文獻整理如表2-2-1，其中又以數學科領域為大宗，顯示利用建構反應題做為診斷學生學習成效的工具效果良好，若能將此診斷工具擴大應用至國小自然與生活科技領域，不但能協助教師更準確的診斷學生的學習成效，也可以做為教師進行後續補救教學的參考。表 2-2-1 電腦化建構反應題文獻整理研究領域. 研究者（年代）. 論文名稱. 內容摘要. 數學科. 高健智. 以貝氏網路為. 以分數概念為主，開發一套. （2007）. 基礎之學生分. 以貝氏網路為基礎的分數診. 數概念診斷系. 斷系統，以診斷學生在分數. 統. 學習上的錯誤迷思，並提供. 白曉珊. 以知識結構及. 補救教學。主要在建立一套以知識結構. （2008）. 貝氏網路為基. 和貝氏網路為基礎之數學教. 礎之數學教材. 材與電腦適性測驗，供教師進. 及電腦適性測. 行數學教學與補救教學使. 驗. 用，希冀達到「因材施測」與「因材施教」之效果。. 吳任婕. 以建構反應題. 學生在「分數的乘法」單元之. （2009）. 型為基礎之數. 建構反應題診斷測驗之錯誤. 學科診斷測驗. 類型比選擇題型之錯誤類型. 系統建置. 更詳盡、多元。（續下頁）. 25.

(36) 林孟君（2009）. 國小「圓面積」結合貝氏網路研發兼具選擇單元電腦化診. 題與建構反應題之電腦化診. 斷測驗研發. 斷測驗，利用電腦詳細紀錄學生解題過程，藉由系統自動化計分並分析學生作答反應，由此得到學生更多元的錯誤類型及解題策略，以改善教師閱卷上的負擔。. 簡啟全. 國中數學科. 本研究單元「相似形」之電腦. （2011）. 「相似形」單. 化建構反應題可以診斷出學. 元電腦化測驗. 生的多種錯誤類型，有助於學. 與診斷模式研. 生知道自己的錯誤概念，也可. 發. 幫助教師掌握學生的錯誤類型，進行集體補救教學。. 自然科. 吳宜玲. 數學科建構反. 以建構反應題的題型，建置出. （2012）. 應題診斷系統. 可自動計分之七年級「指數律. 的建置－以七. 與科學記號」單元建構反應題. 年級「指數律. 線上診斷系統，透過學生實際. 與科學記號」. 操作作答，記錄學生的解題歷. 單元為例. 程，分析學生的錯誤類型。. 莊峰魁. 「光」單元之. 由學生在本單元之建構反應. （2009）. 選擇題與建構. 題作答反應所獲得的錯誤類. 反應試題之線. 型資訊，比歷來研究所獲得之. 上測驗研發. 錯誤類型更詳盡、多元。且電腦判別之錯誤類型平均正確率為100％，顯示該研究所建置之建構反應題之自然科診斷測驗成效良好。（續下頁）. 26.

(37) 黃文信（2010）. 自然科「簡單電路」單元之. 電腦化測驗多以選擇題呈. 建構反應題及. 現，雖能收集到學生的作答歷程，但非常有限。希望能從建. 診斷測驗系統. 構反應題收集更多學生的作答應，並由紀錄解題時所做的所有動作來分析學生的錯誤類型。. 黃瓊瑩. 國小自然科. 以具有選擇題與建構反應題. （2011）. 「電磁作用」. 的題型，以電腦施測，透過分. 單元電腦化診. 析學生之做答結果，並結合貝. 斷測驗與診斷. 氏網路的各種模式，有效辨識. 模式研發. 學生之命題概念與迷思概念，提供教師補救教學的參考。. 27.

(38) 第三節貝氏網路本研究採用 BNAT 適性診斷測驗暨學習系統來進行施測，是一套利用貝氏網路為基礎的診斷測驗系統，在教育測驗領域中，使用貝氏網路診斷學生學習成效的研究眾多（高健智，2007；白曉珊，2008；林孟君，2009；江啟明，2010；黃瓊瑩，2011），因為貝氏網路使用機率的方式來處理不確定性的問題，比過去相關研究所採用的分析模式在診斷學生的子技能與迷思概念的有無上能達到更正確的成果（蘇文君、汪端正、郭伯臣，2006），所以若能以電腦化進行線上測驗，並使用貝氏網路分析學生的學習成效，不僅可以節省人工判斷的時間，更能提供有效的診斷訊息。貝氏網路是一種結合圖形和機率的推論工具，它使用先驗知識與專家判斷並結合可觀察資訊之機率推論模式（劉湘川，2004）。貝氏網路是一種由節點與連結所組成的非循環的有向圖(directed acyclic graphs, DAGs)，其中的節點代表所研究的變項，若變項 A 的被認為是產生變項 B 的機率性原因，則變項 A 則稱為變項 B 的父節點，連結代表變項間互相影響的關係，每一個節點代表一個變數，節點之間用有向邊的連結表示節點之間條件相依，利用節點之間的有向邊來表示事件之間的因果關係，若無連結則代表節點之間的關係是獨立或條件獨立的關係，並藉由條件機率的大小來表達其影響程度的強弱（李美娟，2008；楊淑菁，2009）。父節點. A. 連結（link）. B 子節點圖 2-3-1. 貝氏網路節點示意圖. 28.

(39) 貝氏網路的定義如下：設 D 為一個具有 n 個節點的非循環有向圖，若 xi 代表 D 中的第 i 個節點， πi 代表節點 xi 之父節點的的集合（i=1,2,…,n），且 P=｛p(x1|π1),…, p(xn|πn)｝為 D 中所有節點的條件機率集合，其中若 πi =ψ則 p(xi|πi) = p(xi|ψ)=p(xi)，則稱（D, P）所組成的序對為貝氏網路。又若令 X =（x1, x2,…, xn），則這一組 P 就可以定義 D 中的所有節點 X 的聯合機率分布如下式（施淑娟，2006，頁 21）： ( )=. ( | ). 使用貝氏網路進行診斷評量，因為是以機率為基礎進行推理，不但可以有效處理、描述及評估變相的不確定性，還可有效整合專家意見、先前的研究成果、理論以及實徵資料的經驗值至診斷模式中，提升診斷的精確性；它的圖形化表徵方式也清楚展現及管理變項間依賴或條件獨立的關係，並且可以簡化計算變項聯合機率分布的複雜性（施淑娟，2006），目前許多研究已顯示貝氏網路在診斷學生數學領域的錯誤類型上具有良好成效（郭伯臣、楊智為，2006；施淑娟、林世華，2006；楊智為，2007；何秀芳，2009；楊淑菁，2009；簡啟全，2011）。而在自然與生活科技領域方面，莊峰魁（2009）也利用貝氏網路進行國中一年級「光」單元之選擇題與建構反應試題研究，顯示在子技能與錯誤類型的辨識率部分，建構反應題的診斷測驗成效良好。黃瓊瑩（2011）的研究也顯示，在國小自然科「電磁作用」單元之電腦化診斷測驗研究中，結合選擇題與建構反應題的貝氏網路分析，在命題概念、迷思概念之辨識率優於傳統選擇題之貝氏網路。蘇家鋒（2012）則利用 DINA、DINO 機率模式分析認知概念及錯誤類型，使用建構反應題在自然科技與生活領域「槓桿」單元進行電腦化測驗研發，研究結果顯示加入建構反應題自動化分析結果於 DINA、DINO 模型，能偵測到更多的認. 29.

(40) 知概念及錯誤類型。以上相關研究證明貝氏網路在診斷學生子技能、錯誤類型等方面具有良好成效，並且應用在檢視國中小學生在自然科的學習成效中也獲得良好結果，因此本研究試圖以貝氏網路為基礎，建立國小自然科之槓桿單元電腦化診斷測驗，以進行學生的學習成效評估，並採用 BNAT 適性診斷測驗暨學習系統做為建立電腦化建構反應題診斷測驗之工具。本研究採用 5-fold CV(cross validation)法來估算精準度，首先將紙筆測驗所收集的樣本平分成五等分，其中四分做為訓練樣本(training samples)，以訓練樣本來估計貝氏網路，剩下一分做為測試樣本(testing samples)，以測試樣本來進行模擬適性測驗，將訓練樣本與測試樣本所得到的結果作比較，兩者的吻合程度稱為辨識率，如此循環 5 次後所得到的辨識率平均值即為最後的辨識率（劉育隆，2006）。. 圖 2-3-2. 估算貝氏網路成效流程（黃瓊瑩，2011，頁 23）. 30.

(41) 第三章研究方法本研究主要目的在依據國小自然與生活科技「槓桿原理」單元，根據本單元的教學重點與常見迷思概念編製試題，建置電腦化建構反應題型與診斷模式的開發，進行線上施測並收集學生的作答過程，邀請專家進行迷思概念分析，並探討學生的解題歷程以建立自動化分析流程來找出學生的迷思概念，作為教師施行補救教學的參考。本章節共分為四個部分，分別為研究流程、研究對象、研究工具及建構反應題的題型設計。. 第一節研究流程壹、研究流程研究流程如圖 3-1 所示。研究步驟如下：步驟１：確定研究主題後，蒐集相關的文獻並建立專家知識結構與迷思概念。步驟２：編製試題並進行預試，根據預試結果進行試題修正並製作電腦化建構反應題，以及建立貝氏網路架構。步驟３：進行線上正式施測，蒐集學生之作答反應，並記錄解題歷程進行分析，建立自動化分析模型。步驟４：透過迷思概念與解題歷程分析的結果，進行計分模式的探討，並建立迷思概念自動化診斷分析模式。步驟５：結合建構反應題之貝氏網路診斷成效分析。. 31.

(42) 建立研究主題與目的相關文獻探討建立專家知識結構與迷思概念編製試題進行預試. 試題修正後進行試題電腦化與建構反應題製作. 建立貝氏網路架構. 正式施測自動診斷與計分模式的探討評估本測驗與貝氏網路結合之成效. 提出結論與建議圖 3-1-1. 研究流程圖. 第二節研究對象壹、預試對象本研究預試採用紙筆測驗，母群為一百零一學年度中部地區國小六年級剛學習完自然與生活科技領域槓桿單元的學生，以立意取樣法（judgemental sampling）從母群中選取彰化縣員林鎮某國小六年級全體學生作為施測對象，施測時間為. 32.

(43) 102 年 3 月 14 日至 3 月 19 日，扣除未作答學生後，有效樣本共 296 人。. 貳、正式施測對象本研究正式施測採用線上測驗，以立意取樣法，從母群中選取南投縣草屯鎮某國小六年級全體學生作為施測對象，施測時間為 102 年 4 月 29 日至 5 月 3 日，扣除未作答學生後，有效樣本共 289 人。. 第三節研究工具本研究所使用的工具有：MATLAB 軟體與貝氏網路工具箱、自編之槓桿單元測驗試題以及 BNAT 適性診斷測驗暨學習系統，茲分別敘述如下：. 壹、MATLAB R2010a MATLAB 是套應用於科學與工程領域中數值計算、分析與模擬的應用軟體，結合了數值分析、矩陣運算、系統模擬與互動式介面協助撰寫程式、編碼及繪圖等功能。在大學線性代數及微積分課程中均可應用 Matlab 來輔助學習。Matlab 包含許多工具箱，如：統計、類神經網路、遺傳演算法、模糊邏輯、財務等，可以處理相關之計算。因此本研究使用MATLAB軟體來進行自動化分析模型程式的撰寫。. 貳、貝氏網路工具箱貝氏網路工具箱是由郭伯臣、謝典佑（2007）以 Matlab 結合 Murphy（2004）所設計的 Bayes Net Toolbox for Matlab 之相關函數，再加上 TASBN（Test Analysis Software based on Bayesian Network）的工具箱三者結合而成的一套程式。是依據施測樣本的單元目標、子技能、迷思概念、作答反應等資料，來計算貝氏網路之辨識率。. 33.

(44) 叁、自編槓桿單元診斷測驗研究者根據所蒐集的相關文獻，與專家學者、實際教學工作者討論提出的意見，訂定出專家知識結構與槓桿單元學習內容中有關的子技能與迷思概念，所整理的專家知識結構如圖3-3-1，圖中的節點代表槓桿單元所需具備的知識概念，愈下層的概念代表屬於基礎的知識，位置愈高則代表所需具備的知識概念愈複雜，並依據列出的節點制訂子技能與迷思概念，子技能與迷思概念如表3-3-1與表 3-3-2。本研究使用「BNAT 適性診斷測驗暨學習系統」來設計建構反應題，以槓桿原理單元內容來進行建構反應題的設計並進行線上施測，記錄學生的作答歷程作為專家判斷學生迷思概念有無的依據。此系統為國立臺中教育大學教育測驗統計研究所重點研究計畫：「貝氏網路線上測驗平台」（郭伯臣、曾彥鈞，2007）之研發成果，相關系統研發及建置由研究者及國立臺中教育大學教育測驗統計研究所曾彥鈞、陳俊華、白宗恩等共同完成。. 肆、BNAT適性診斷測驗暨學習系統以貝氏網路為基礎的適性診斷測驗暨學習系統 (Bayesian network based adaptive testing, BNAT)是利用貝氏網路為基礎的診斷測驗系統，命題時先針對教材、學生先備知識、錯誤類型、學習技能及能力指標來進行分析，並蒐集專家學者研究相關文獻找出學生可能發生之錯誤類型，完成專家知識結構之分析，並依此架構一個合乎邏輯推論的貝氏網路圖，再依據此架構來命題（施淑娟，2006）。當學生施測完畢後，此系統會記錄學生的作答歷程，提供教師做為判斷學生錯誤類型與子技能有無的依據，施以補救教學，提供教師進行補救教學上的參考。. 34.

(45) S12 以重量與距離的乘積(亦稱力矩)，來決定此槓桿工具省力或費力. S11 了解滑輪組的功用是既省力又能夠改變物體的移動方向. S09 了解動滑輪的功用是省. S10 了解定滑輪的功用是. 力但不會改變物體的移動方. 改變物體的移動方向但不. 向. 省力也不費力. S06 當施力臂大於抗力. S07 當施力臂等於抗力臂，. S08 當施力臂小於抗力. 臂，此槓桿工具會省力. 此槓桿工具既不省力也不費力. 臂，此槓桿工具會費力. S04 知道施力臂就是. S05 知道抗力臂就是. 支點到施力點的距離. 支點到抗力點的距離. S01 知道施力點就是施. S02 了解支點為. S03 知道抗力點就是抗. 力作用在槓桿上的點. 槓桿中固定的點. 力作用在槓桿上的點. 圖 3-3-1. 槓桿原理專家知識結構. 35.

(46) 表 3-3-1 槓桿原理子技能列表編號. 子技能. S01. 知道施力點就是手施力於槓桿上的點. S02. 了解支點為槓桿中固定的點. S03. 知道抗力點就是重物掛在槓桿上的點. S04. 知道施力臂就是支點到施力點的距離. S05. 知道抗力臂就是支點到抗力點的距離. S06. 能了解當施力臂大於抗力臂，此槓桿工具會省力. S07. 能了解當施力臂等於抗力臂，此槓桿工具既不省力也不費力. S08. 能了解當施力臂小於抗力臂，此槓桿工具會費力. S09. 了解定滑輪的功用是改變物體的移動方向但不省力也不費力. S10. 了解動滑輪的功用是省力但不會改變物體的移動方向. S11. 了解滑輪組的功用是既省力又能夠改變物體的移動方向. S12. 以重量與距離的乘積(亦稱力矩)，來決定此槓桿工具省力或費力. 36.

(47) 表 3-3-2 槓桿原理迷思概念列表編號. 錯誤類型. B01. 無法判斷施力點的位置. B02. 無法判斷支點的位置. B03. 無法判斷抗力點的位置. B04. 無法判斷施力臂的位置. B05. 無法判斷抗力臂的位置. B06. 無法判斷當施力臂大於抗力臂，此時會省力，但費時. B07. 無法判斷當施力臂等於抗力臂，此時不省力也不費力. B08. 無法判斷當施力臂小於抗力臂，此時會費力，但省時. B09. 無法理解定滑輪的功用是改變物體移動的方向但不省力也不費力. B10. 無法理解動滑輪的功用是省力但無法改變物體移動的方向. B11. 無法理解滑輪組的功用是既省力又改變物體移動的方向. B12. 無法理解當施力乘以施力臂等於抗力乘以抗力臂此時槓桿會平衡. B13. 將力矩等於重量與距離的乘積規則以比例規則代替. B14. 誤以為當重量乘以2倍，力臂也要乘以2倍. 一、測驗架構依據專家知識結構、子技能與迷思概念所編製的試題，製作出試題與子技能及迷思概念對應的架構如表 3-3-3：. 37.

(48) 表 3-3-3 預試試題評量架構表試題. 對應錯誤類型. 對應子技能. Item01. B01、B02、B03. S01、S02、S03. Item02. B01、B02、B03. S01、S02、S03. Item03. B01、B02、B03. S01、S02、S03. Item04. B01、B02、B03. S02、S02、S03. Item05. B01、B02、B03. S02、S02、S03. Item06. B02. S02. Item07. B03. S02、S03. Item08. B03. S02、S03. Item09. B03. S02、S03. Item10. B01、B02、B04. S01、S02、S04. Item11. B01、B02、B04. S01、S02、S04. Item12. B01、B02、B04. S01、S02、S04. Item13. B02、B03、B05. S02、S03、S05. Item14. B02、B03、B05. S02、S03、S05. Item15. B02、B03、B05. S02、S03、S05. Item16. B04～B08. S01～S08. Item17. B04～B08. S01～S08. Item18. B04～B08. S01～S08. Item19. B07. S04、S05、S07. Item20. B04、B05、B08. S01～S05、S08 （續下頁）. 38.

(49) Item21. B04、B05、B08. S01～S05、S08. Item22. B04、B05、B08. S01～S05、S08. Item23. B06～B09. S04～S09. Item24. B06、B10. S04～S06、S10. Item25. B09、B10、B11. S06、S07、S09～S11. Item26. B12、B13、B14. S12. Item27. B12、B13. S12. Item28. B12、B13. S12. 二、預試結果與信效度分析當槓桿單元測驗試題編製完成後，便進行紙本預試及試題的題目分析。本測驗採立意取樣，預試對象為一百零一學年度彰化縣員林鎮某國小六年級學生，共 296 人參與進行預試，預試試題難度與鑑別度分析如表 3-3-4。表 3-3-4 試題難度鑑別度一覽表題號. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 難度. 0.91. 0.88. 0.74. 0.77. 0.41. 0.62. 0.75. 0.57. 0.73. 0.78. 鑑別度. 0.06. 0.21. 0.28. 0.30. 0.39. 0.53. 0.40. 0.57. 0.46. 0.33. 題號. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 難度. 0.68. 0.82. 0.71. 0.31. 0.46. 0.73. 0.60. 0.62. 0.70. 0.63. 鑑別度. 0.23. 0.27. 0.41. 0.54. 0.73. 0.48. 0.58. 0.61. 0.42. 0.70. 題號. 21. 22. 23. 24. 25. 26. 27. 28. 難度. 0.60. 0.59. 0.75. 0.53. 0.75. 0.83. 0.80. 0.75. 鑑別度. 0.50. 0.49. 0.40. 0.54. 0.38. 0.31. 0.28. 0.32. 39.

(50) （一）難度本研究之測驗以通過率表示難易度，計算全體受試者在該題答對人數的比率，稱之為難易度指數（item difficulty index），難度指數愈高，代表該試題愈容易；反之，則代表該試題愈難。難度指數計算公式如下：. Pi =. PH + PL 2. Pi ：難度指數。 PH ：高分組（受試者中原始分數排行的前 25%）答對該試題的比率。 PL ：低分組（受試者中原始分數排行的後 25%）答對該試題的比率。當試題難度指標值接近 0.5 時，則表示該試題難易適中（余民寧，2002）。本研究測驗之試題難度分析摘要如表 3-3-5。表 3-3-5 難度分析摘要表難度. 試題評鑑. 與預試試題對應. 占預試試題比例. 0 .8 ≤ P. 極容易. 1、2、12、26、27. 17.86%. 0.6 ≤ P < 0.8. 容易. 3、4、6、7、9、10、11、. 60.71%. 13、16、17、18、19、20、 21、23、25、28 0 .4 ≤ P < 0 .6. 適中. 5、8、15、22、24. 17.86%. 0 .2 ≤ P < 0 .4. 困難. 14. 3.57%. P < 0 .2. 極困難. --. --. 註：表中註明--代表沒有此項的作答人數. 40.

(51) （二）鑑別度鑑別度分析即在計算試題鑑別度指數，將受試者的評量總分，分成高分組P H 及低分組P L後，計算高、低兩組答對比率的差，即為試題鑑別度指數D，公式如下:. D = PH − PL 由表 3-3-4 可得知本測驗試題鑑別度值介於 0.06～0.73。其中第一題的鑑別度不佳，低於 0.2，與專家學者分析及討論過後發現第一題的題目因為過於簡單導致鑑別度過低，因此刪除第一題，但不會因為刪題而改變試題架構的完整性，鑑別度分析摘要如表 3-3-6。表 3-3-6 鑑別度分析摘要表鑑別度. 試題評鑑. 與預試試題對應. 占預試試題比例. 0.40 ≤ D. 非常優良. 6、7、8、9、13、14、 57.14% 15、16、17、18、19、 20、21、22、23、24. 0.30 ≤ D < 0.40. 優良，但可能需要 4、5、10、25、26、27、 25.00% 修改. 0.20 ≤ D < 0.30. 28. 尚可，但可能需要 2、3、11、12. 14.29%. 修改 D < 0.20. 劣，需要刪題或修 1. 3.57%. 改. 41.

(52) （三）信效度本測驗的信度採用 Cronbach α 係數，作為估計測驗內部一致性的方法，刪題後所得之 α 值為 .8188。本測驗之效度採用的是內容效度及專家效度分析。本研究邀請具有教學及測驗編製經驗的專家學者與現場教學工作者一同開會討論。試題完成後經討論確認試題編製合乎教學目標，並根據建議修改，使本研究有良好的專家效度。. 42.

(53) 第四節槓桿原理單元電腦化建構反應題型設計本節主要介紹「槓桿原理」單元建構反應題題型之介面操作與說明，以下分別就此系統中正式題與練習題的部分加以說明，其中正式題中再舉例列出選擇題與建構反應題各 1 題作為說明，操作介面如圖 3-4-1 所示。一、正式題部分：（一）建構反應題. 圖 3-4-1. 建構題操作畫面. 介面主要分為三個區塊：題目區、操作區及作答區，以下分別就三個區塊加以說明。 1.. 題目區：如圖 3-4-2 所示，本區的功能在展示問題，說明題意並要求受試者根據題意回答問題。. 43.

(54) 圖 3-4-2 2.. 建構題題目區工具區：如圖 3-4-3 所示，本區包含砝碼、操作按鈕等工具，提供受試者作答，因工具區包含正確與錯誤的工具，可藉此判定受試者的作答是否具有迷思概念。. 圖 3-4-3. 建構題工具區：此工具為拖曳砝碼的按鈕，受試者點選此按鈕後即可點選砝. 碼按住左鍵不放拖曳砝碼至作答區。 3.. 作答區：如圖 3-4-4，受試者將砝碼拖曳到此區域來完成作答，受試者需將砝碼擺放在正確的格線上，若偏離或未依照題意作答則視為錯誤或胡. 44.

(55) 亂作答，作答結束點選. 圖 3-4-4 4.. 圖 3-4-5. 即完成這一題。. 建構題作答區學生作答範例：圖 3-4-5 為某一受試者所作答情形的範例。. 受試者作答範例. （二）選擇題選擇題部分分為題目區與作答區，受試者必須在閱讀完題目後檢視四個選項並選取其中一個選項作答，未選擇則無法進行下一題，避免出現漏答之情形。. 45.

(56) 圖 3-4-6 「槓桿原理」單元正式題目卷選擇題範例二、練習題部分受試者登入系統後須先進行練習題的試卷進行練習，之後才能開始正式題的作答。練習題的部分不予計分，用意是為確認受試者能完全了解施測的流程與系統的操作方法，以及避免操作不當造成施測進度的延宕；受試者如果在操作的過程中有任何的疑惑與問題也可以盡早給予協助或排除以免影響施測。. 圖 3-4-7 「槓桿原理」單元練習題範例. 46.

(57) 第五節評估方法與指標壹、專家效標的建立本研究的試題設計中，包括建構反應題 3 題，其中建構題第 1 題對應到選擇題第 25 題、建構題第 2 題對應到選擇題第 26 題、建構題第 3 題對應到選擇題第 27 題，此 3 題建構反應題的專家診斷結果的建立說明如下：一、建構題第 1 題所對應之選擇題第 25 題各選項的迷思概念如表 3-5-1 所示：表 3-5-1 選擇題第 25 題與建構題第 1 題迷思概念對應表選擇題建構題. 迷思概念 B12，無法正確計算力矩的乘積 B13，將力矩等於重量與距離的乘積規則以比例規則代替 B14，誤以為當力臂乘以 2 倍時，砝碼的重量也要乘以 2 倍 B12，無法正確計算力矩的乘積 B13，將力矩等於重量與距離的乘積規則以比例規則代替 B14，誤以為當力臂乘以 2 倍時，砝碼的重量也要乘以 2 倍 (新增)沒有力臂長短概念在選擇題第 25 題的部分預設有 3 個迷思概念，相比較下與之對應的建構題. 第 1 題所測量到的迷思概念超過選擇題所能診斷的數量，另外專家效標的診斷方式是以學生的作答歷程為依據，並不限於此 3 個類型，因此以建構反應題所呈現的迷思概念為主。. 47.

(58) 二、建構題第 2 題所對應之選擇題第 26 題各選項的迷思概念如表 3-5-2 所示：表 3-5-2 選擇題第 26 題與建構題第 2 題迷思概念對應表迷思概念 B12，無法正確計算力矩的乘積 B13，將力矩等於重量與距離的乘積規則以比例規則代替. 選擇題建構題. B12，無法正確計算力矩的乘積 B13，將力矩等於重量與距離的乘積規則以比例規則代替 (新增)沒有力臂長短概念. 在選擇題第 26 題的部分預設有 2 個迷思概念，相比較下與之對應的建構題第 2 題所測量到的迷思概念超過選擇題所能診斷的數量，另外專家效標的診斷方式是以學生的作答歷程為依據，並不限於此 2 個類型，因此以建構反應題所呈現的迷思概念為主。三、建構題第 3 題所對應之選擇題第 27 題各選項的迷思概念如表 3-5-3 所示：表 3-5-3 選擇題第 27 題與建構題第 3 題迷思概念對應表選擇題建構題. 迷思概念 B12，無法正確計算力矩的乘積 B13，將力矩等於重量與距離的乘積規則以比例規則代替 B12，無法正確計算力矩的乘積 B13，將力矩等於重量與距離的乘積規則以比例規則代替 (新增)將力矩的乘積規則以加減規則代替 (新增)直接將砝碼最重放最內、最輕放最外. 48.