網路影像評量在國小高年級槓桿概念之探討

(1)

國立台中教育大學教育測驗統計研究所教學碩士論文

指導教授：范瓊盛博士

網路影像評量在國小高年級槓桿概念之

探討

研究生：林棋銘撰

中華民國九十五年九月

(2)

摘要

本研究旨在針對九年一貫國小階段自然與生活科技領域，發展槓桿概念之電腦網路化影像評量工具，在網頁上建製預先錄製剪輯設計的槓桿實驗實作 DV 錄影帶及槓桿概念試題，受試者從影片中觀察實際操作的情境並在網頁上接受迷思概念之診斷。本研究以立意取樣方式選擇國小高年級學生為研究對象，預試有效樣本共 123 人，進行篩選適合的試題。另以準實驗設計另外抽樣二班六年級學童 66 人，其中一班 33 人為實驗組，進行電腦網路化槓桿概念影像評量；另一班 33 人為控制組，進行槓桿概念影像評量的評量卷評量；在接受前、後測施測樣本方面，五、六年級各四個班級共 251 人，研究結果顯示：一、本研究所發展之網路影像評量工具具有良好之信效度，可作為初步診斷國小高年級學童槓桿迷思概念之工具。二、影像評量施測結果進行六年級實驗組和控制組進行獨立樣本 T 考驗，差異達顯著；五、六年級各分測驗進行評量卷前測及網路影像評量後測相依樣本 T 考驗，總分差異達顯著水準；男、女生在網路影像評量上的表現差異，五年級總分未達顯著水準，六年級總分達顯著水準。三、六年級的迷思概念百分比率比五年級低，顯示經由年齡的增長與學習，學童在槓桿上的概念也隨之成長而有所進步。關鍵詞：自然與生活科技領域、網路化影像評量、槓桿概念

(3)

Abstract

The main purpose of this study was to explore the feasibility of video performance assessment via internet in elementary schools, and investigated elementary school students’ misconceptions in the unit of “lever”. The method was first preparing videos, evaluating and editing the materials, and then utilizing computer/audio visual equipment via internet to present each of the subjects, and the test subjects will view the materials and evaluate the presence of misconceptions.

The test subjects are sampled from students of 5th and 6th grade, which consisted of 123 students for pre-test. In addition, the experiment (a quasi-experimental design) was administered to a sample consisting of 66 stdents from two classes of 6th grade. The experimental group and control group (each with 33 members) were given the internet video performance assessment and the video performance assessment by pencil-paper test.

Pre-test and post-test included a sampling of 251 students from 8 classes of 5th and 6th grade (each with 4 classes). Descriptive statistics, t-test, one-way ANOVA and Pearson’s product-moment correlation were utilized to testify the video performance assessment.

The results were listed as follows:

1. This research developed a video performance assessment with good reliability and validity via internet,which could be used to examine misconceptions of elementary school student for the unit of “lever”

2. The comparison of the video performance assessment pencil-paper test and internet video performance assessment between the experimental group and the control group for 6th grade showed significant differences. There were also significant differences for 5th and 6th grade between the pre-test of the video performance assessment pencil-paper test and the post-test of internet video performance assessment. Evaluating the internet video performance assessment of girls versus boys revealed no significant differences for 5th grade but significant differences for 6th grade.

3. The lower percentage of misconceptions of the 6th grade students than the 5th , revealed that Lever concept could be getting better and clear by learning and growing..

Keywords: science-and-technology domain, internet video performance assessment, concept of lever

(4)

第壹章緒論………1

第一節研究背景與動機 … … … 1 第二節研究目的與待答問題 … … … 4 第三節名詞解釋 … … … 5 第四節研究限制 … … … 6

第貳章文獻探討………7

第一節迷思概念 … … … 7 第二節槓桿概念 … … … 1 1 第三節實作評量 … … … 1 8 第四節影像評量 … … … 2 2 第五節網路測驗 … … … 2 6 第六節試題與測驗分析………31

第參章研究方法與步驟………36

第一節研究架構 … … … 3 6 第二節研究設計流程 … … … 3 8 第三節研究樣本 … … … 4 0 第四節工具發展 … … … 4 2

(5)

第五節分析方法 … … … 4 7

第肆章資料分析與討論………49

第一節影像評量施測結果分析 … … … 4 9 第二節國小高年級槓桿迷思概念的相關結果分析 … … … 5 9 第三節網路影像評量發展的歷程及注意事項 … … … 6 8

第伍章結果與建議………70

第一節研究結果 … … … 7 0 第二節建議 … … … 7 6

參考文獻………77

一、中文部份………77 二、英文部分………80

(6)

表目錄

表 2－2－1 使用規則對六個題型的答對百分比率………14 表 2－2－2 國小自然與生活科技學習領域有關槓桿概念教材內容細目表……16 表 3－3－1 試測樣本學校背景表………40 表 3－4－1 國小高年級槓桿概念調查表題目分配表………43 表 3－4－2 槓桿概念調查表難度與鑑別度一覽表………44 表 4－1－1 組別統計量………50 表 4－1－2 獨立樣本檢定………50 表 4－1－3 六年級前、後測相依樣本檢定………51 表 4－1－4 五年級前、後測相依樣本檢定………52 表 4－1－5 六年級評量卷男、女差異變異數分析………53 表 4－1－6 六年級網路影像評量男、女差異變異數分析………54 表 4－1－7 五年級評量卷男、女差異變異數分析………55 表 4－1－8 五年級網路影像評量男、女差異變異數分析………56 表 4－1－9 五、六年級在網路影像評量表現上的差異組別統計量…………57 表 4－1－10 五、六年級在網路影像評量表現上的差異獨立樣本檢定…………57 表 4－1－11 網路影像評量與傳統紙筆測驗描述性統計量………58 表 4－1－12 網路影像評量與傳統紙筆測驗相關分析………58

(7)

表 4－2－1 六年級評量卷與網路影像評量第一大題評量結果分析表……59 表 4－2－2 五年級評量卷與網路影像評量第一大題評量結果分析表………59 表 4－2－3 六年級評量卷與網路影像評量第二大題評量結果分析表………60 表 4－2－4 五年級評量卷與網路影像評量第二大題評量結果分析表………60 表 4－2－5 六年級評量卷與網路影像評量第三大題評量結果分析表………60 表 4－2－6 五年級評量卷與網路影像評量第三大題評量結果分析表………61 表 4－2－7 六年級評量卷與網路影像評量第四大題評量結果分析表………61 表 4－2－8 五年級評量卷與網路影像評量第四大題評量結果分析表………61 表 4－2－9 六年級評量卷與網路影像評量第五大題評量結果分析表………62 表 4－2－10 五年級評量卷與網路影像評量第五大題評量結果分析表……62 表 4－2－11 六年級評量卷與網路影像評量第六大題評量結果分析表……63 表 4－2－12 五年級評量卷與網路影像評量第六大題評量結果分析表……63 表 4－2－13 六年級評量卷第七大題評量結果分析表………63 表 4－2－14 六年級網路影像評量第七大題評量結果分析表………64 表 4－2－15 五年級評量卷第七大題評量結果分析表………64 表 4－2－16 五年級網路影像評量第七大題評量結果分析表………64 表 5－1－1 國小五、六年級學生對槓桿題型存有迷思概念百分比………72

(8)

圖目錄

圖 2－2－1 Siegler 解決槓桿問題的四種規則流程圖………12 圖 2－6－1 難度指標與鑑別度指標的關係圖………33 圖 3－1－1 研究架構圖………37 圖 3－2－1 研究設計流程圖………38 圖 3－2－2 工作項目與甘梯圖………39 圖 3－4－1 國小高年級槓桿概念圖………42 圖 5－1－1 網路影像評量發展流程圖………73

附錄………82

附錄一國小高年級學生槓桿概念調查問卷………82 附錄二國小高年級學生槓桿概念網路影像評量卷 … … … 8 7 附錄三國小高年級槓桿概念網路影像評量設計腳本 … … … 9 2 附錄四國小高年級網路影像評量預試信度分析 … … … 9 6 附錄五專家效度委員資料表………97 附錄六國小高年級網路影像評量信度分析………98 附錄七國小高年級槓桿概念傳統紙筆評量………99

(9)

第壹章緒論

本研究的目的在建構一套國小自然與生活科技領域中槓桿概念的電腦化網路影像評量的診斷工具，以電腦網路線上測驗的方式，探究國小高年級學生在槓桿上的概念，偵測受試者在槓桿上的迷思概念，提供教師教學上學生迷思概念的所在，以做為教師教學上的參考。本章將依序說明研究的背景與動機、研究的目的、相關特定名詞解釋與研究限制。

第一節研究背景與動機

教育部正推動施行的小班教學精神及九年一貫教育改革中，評量已由傳統評量改為多元評量。但是紙筆測驗因為實施方便，已經根深蒂固，目前依然是教學評量的主要方式，為了在紙筆測驗中獲得高分，學生不斷的重複練習例題，以求得更好的成績，使得學習失去了原有意義。在教育部（2003）「國民中小學九年一貫課程綱要自然與生活科技領域」的實施要點有關學習評量部分，指出「學習評量不宜侷限於同一種方式，除由教師考評之外，得輔以學生自評及互評來完成。其形式可運用如觀察、口頭詢問、實驗報告、成品展示、專案報告、紙筆測驗、操作、設計實驗及學習檔案等多種方式，以能夠藉此了解學生的學習情況來調適教學為目的。例如，教學的目標若為培養學生的問題解決能力，則可採用成品展示或工作報告的評量方式，而非純以紙筆測驗的方式作評量。」由此可見，評量多元化是目前既定的教育政策。未來評量將朝「教學與評量結合化、適性化、評量專業化、目標化，評量方

(10)

式多元化、彈性化、評量內容生活化、多樣化，評量人員多元化、互動化，結果解釋人性化、增強化，結果解釋呈現多元化、適時化、全人化，評量避免誤用或濫用，評量電腦化、網路化，教師逐漸用標準參照測驗，社會大眾、家長關心與期許」等方向發展，其中多元化、人性化、專業化、電腦化乃教育評量的發展趨勢（李坤崇，1999）。為了因應評量的目的、內容、規模和教學的情境，評量的方式不應侷限於某一種特定的形式（陳文典，2000）。教育改革的活動中教師是重要的關鍵，如果沒有教師的參與及領導，任何教育的改革都終究將會失敗（Jeranyama，2001）。教師有責任也有義務改善現行以紙筆評量為主的評量方式，以符合九年一貫課程綱要的精神。實作評量可以讓教師瞭解學生對問題瞭解程度、投入程度、解決的技能和自我表達的能力，能較完整的反應學生的學習成果（盧雪梅，1998）。蔡宗雄、范瓊盛、許天維（2002）針對國小六年級學童，在自然與生活科技領域建構一套「電路與電磁效應單元」之影像評量模式，提供一個模擬實作評量情境的評量內容，建議教師們拋棄傳統的成就測驗模式，以更能了解學生之真正所學，並理解什麼才是符合學生能力的有意義之評量模式。教師經常在教學的過程中，發現在課程及課堂中已經不斷被強調的內容，在測驗時學生還是一再的答錯，學生對於某一概念的理解，不但是片段不完整，甚至是完全不正確。學生並非一塊「空白石版」（blank slate），老師想刻上什麼就可以刻上什麼；相反的，學生對於老師所講授的科學知識、原理、法則、甚至自然界的各種物象，均有他們自己堅信的「概念」（conceptions），都有一套根深蒂固的想法和解釋（鄭湧涇，1998）。這些學童不當的原有概念，經常會影響學生正常的學習，偵測學生原有的概念，並找出其錯誤迷思概念，提出相關的補救教學，是目前自然與生活科技領域的一大課題。

(11)

學生較常具有的另有想法常存在於重力、速度、方向、天體、能量、作用力及反作用力，還有槓桿……等內容（李田英，1995）。槓桿概念為日常生活中經常使用到的重要概念，Chletsos & Lisi（1989）的研究發現不論是學童、青少年及部分成年人普遍存有槓桿迷思概念，可見槓桿迷思概念分布在許多年齡層，並不易予以更改。江文慈（1993）發現四年級學生中，只有一半的學生以重量作為參考，32﹪的學生在重量相等時才會考慮距離，約有 12﹪的學生注意到重量和距離都有影響平衡的結果，但沒有學生能正確利用重量乘距離的關係來解題。在國外研究方面， Bar(1989)對小學生力學概念的研究指出，三到六年級對槓桿概念平衡問題的通過率分別為 8％、29％、55％、75％，而我國五年級的通過率為 40％，還低於 Bar 的研究。唯有先瞭解學生在槓桿上的迷思概念，教師的教學才能針對此迷思概念加以補救（引自游光純，民 91）。因此本研究設計一套模擬實作情境的電腦網路影像評量系統，配合學校現有的教學資源，以診斷學生在槓桿概念學習上所遇到的困難與迷思。

(12)

第二節研究目的與待答問題

本研究的目的在發展一套網路影像評量工具，以診斷國小高年級學童在槓桿概念上的迷思概念，進而提供教學者教學上的參考，適時導正學生的迷思概念。本研究的主要目的有：一、藉由文獻探討和槓桿概念調查表的試題分析結果，建製一套電腦化網路影像評量工具。二、藉由此網路影像評量工具偵測國小高年級學童在槓桿概念上的迷思概念。根據上述研究目的，本研究之待答問題如下：一、網路影像評量工具發展之重要歷程為何？二、網路影像評量和評量卷、傳統試卷在偵測國小高年級學生在槓桿概念上之差異、相關為何？三、槓桿概念網路影像評量之信度、效度為何？四、國小六年級學生在控制組評量卷上的表現與實驗組在網路影像評量上的表現是否有顯著的差異？五、國小五、六年級學生前、後測相依樣本方面，在分測驗及總分上的表現，是否有顯著的差異？五、六年級學生在網路影像評量表現上是否有差異？在男、女生的表現上是否有差異？六、國小五、六年級學生在網路影像評量中，有關槓桿之迷思概念為何？

(13)

第三節名詞解釋

一、網路影像評量

本研究中的網路影像評量乃是針對國小自然與生活領域，以先拍攝的槓桿概念評量內容影片，配合電腦網路線上測驗，給學生觀看，並請學生依據觀察到的內容，在電腦網路上進行的評量。

二、槓桿（lever）

槓桿是由支點、施力點、抗力點所組成的一個系統，可由它來達到改變力的方向，或達到省力或省時的工具。在日常生活中舉凡掃地、開門、指甲剪、開瓶器……等，到處都運用得到槓桿原理，本文中的槓桿概念指的是國小階段自然與生活科技領域學生所學的槓桿原理。

三、迷思概念

迷思概念（misconception）是指學生經由學校的學習、日常生活的經驗、同儕文化或自己觀察到的自然現象或其他途徑，所產生對自然科學概念的認知，而這個認知和科學界所共同認定的正確概念相違背，這些學生共有的另有想法就是迷思概念。

四、網路測驗（on-line test）

本研究所指的網路測驗，是指本研究所發展的電腦化網路影像評量測驗，測驗的類型為四選一的單選擇題。

(14)

第四節研究限制

一、本研究對受試者在槓桿的迷思概念所探討的相關結果為量化的研究，僅適用於對槓桿概念迷思初步偵測，要深入瞭解受試者的迷思概念，需更進一步對槓桿迷思概念進行質性的相關研究。二、本研究之網路影像評量並無立即回饋功能，無法對學生槓桿的迷思概念進行立即補救，記錄並瞭解學生概念的發展狀況。三、因研究者任教在彰化縣某一國民小學，在實驗設計方面僅以彰化縣國小高年級學生為研究對象，因此研究的結果不宜過份推論。

(15)

第貳章文獻探討

本章將對本研究相關文獻做簡介，共分六節說明：第一節迷思概念、第二節槓桿概念、第三節實作評量、第四節影像評量、第五節網路測驗、第六節試題與測驗分析。

第一節迷思概念

壹、認知理論

皮亞傑的認知發展理論中認為運用個體與生俱來的一些基本行為模式來對環境中事物做出反應，從而獲取知識，可視為用以瞭解周圍世界的認知結構（cognitive structure）。每當他遇到某事物，他就用他的認知結構去核對，去處理，稱之為基模（schema）。組織（organization）是個體在處理周圍事物時，能統合運用其身體與心智的各種功能，從而達到目的的一種身心活動歷程。適應（adaption）分為兩個歷程：同化（assimilation）與調適（accommodation），同化是指個體運用他的既有基模處理所面對的問題，即是將新的事物融入既有的基模之內。調適是既有基模不能直接同化新知識時，個體為了符合環境需求，主動修改其既有基模，從而達到目的的一種心理歷程。當個體能夠輕易同化環境中新的知識經驗時，在心理他自然會感到平衡。當個體不能夠同化環境中新的知識經驗時，在心理他就會感到失衡。此時兒童必須重新改變個體或調適既有的基模，以恢復認知平衡的狀態，在學習成長的過程當中失衡而又恢復平衡的歷程會一再地發生（張春興，1996）。人類的認知十分複雜，學習會受到從小到大的學習經驗與先備知識的影響，教師應瞭解學生之前的學習經驗及知識架構。學生在接受課堂上老師的科學教育

(16)

之前，心中已對世界如何運作有了自己的想法，這些想法經常與老師所想傳授的科學概念背道而馳，造成學生所學到的往往比老師所教授的還少得多。

貳、迷思概念的意義

迷思概念一詞最早出現在 1970 年美國科學教育期刊（Science Education）雜誌中，篇名為「An Evaluation of Certain Popular Science Misconception」，從此以後這個概念名詞才開始受全世界重視，而興起了一連串的研究風氣（鍾聖校，1994）。

國外對於迷思概念一詞，有著各種不同的說法，由於研究者的理念各不相同，所使用的「概念」一詞所富含的特質、定義亦有所別異，因此出現了相當多的名詞。例如：前期概念（preconceptions）、私人概念（private conceptions）、另有架構（alternative frameworks）、學生架構（student frameworks）、迷思概念（misconceptions）、不適當的命題階層（inappropriate propositional hierarchies）、天真理論（native theories）、另有概念（alternative

conception）、隱伏錯誤來源（underlying sources of error）、（王美芬、熊召弟，民 84）、原有知識（prior knowledge）、先入概念（preconception）、孩童的科學（children’s science）等（郭重吉，1990）。學生由於過去的生活經驗或是在校的學習，對於某些自然現象有其另有想法或解釋。個人原有的概念，並不一定與科學上的概念相符，有的是不完整，甚至完全錯誤的，不同於一般公認的科學概念或課本知識，科學教育學者將此種與現行科學概念有所抵觸、錯誤不完備的概念，稱為迷思概念（郭重吉，1988）。這些迷思概念經常妨礙到正常的學習（Brown，1992）。

(17)

叁、迷思概念的形成原因與來源

王美芬、熊召弟（1995）認為造成迷思概念的原因有下列六項：一、教師對於學童的迷思概念缺乏察覺心及興趣。二、日常生活語言和譬喻。三、「只要教，馬上會」的假設。四、「字和話語就可以代表理解」的假設。五、教科書呈現錯誤的概念。六、過份強調講述法。迷思概念的來源，林明軫（1994）綜合了不同科學教育專家的研究有下列幾種來源：一、自日常生活的經驗而觀察到的。二、從生活的背景和個別的文化而來。三、來自錯誤的推理。四、來自同儕文化。五、從隱喻而來。六、正式或非正式的教學教材。七、從類比而來。

肆、迷思概念的特性

鍾聖校（1994）綜合比較各種文獻，歸納出迷思概念具有八種特性：一、過程性：迷思概念是在概念發展或是概念學習的過程中出現的。二、不完整性：對於問題的思考不夠細密周全，以致於說出的概念失之片面或零碎。

(18)

三、非正統性：鑑定迷思概念的依據是來自正統的、科學家或專家的說法，因此迷思概念乃是非正統的想法。四、思考性：迷思概念是陳述出來的內容，含有概念思考的成分，無論造成思考結果的方式是直覺、錯誤類比、不正確的推理或是不成熟的運思。五、個別性：人們以自己的想法將外在的訊息內化到自己的認知架構中，用自己的經驗來建構飾物的意義，故所得的概念具有個別性。六、普遍性：綜觀全球各地皆可發現許多一樣的迷思概念。七、不穩定性：許多學童在晤談前後迷思概念不一致，乃是學童對概念沒有清楚的認識，沒有確定的見解，因此想法亦改變顯得不穩定。八、頑固性：有些迷思概念雖經過教師教學講解，但能一再出現，讓學者不得不承認其根深蒂固的存在事實。迷思概念經常存在於學生學習的過程中，教學與評量上應著重於實際操作，以使學生獲得正確的概念，但鑑於課程時間及工具的不足，經常被忽略。教師若要促進學生有效的學習，首先要體認學生「另有概念」是影響學生學習的重要因素，才能使學生獲得正確的概念及解決問題的能力。依據上述的研究，唯有瞭解學生的迷思概念，才能進行有效的教學策略，針對學生的迷思概念設計課程，使學生學習到正確的科學概念。一套模擬實際操作情境能診斷學生迷思概念的評量系統，在科學教育工作上是必要的。

(19)

第二節槓桿概念

壹、槓桿概念的研究

Siegler（1976）假設孩童在解決槓桿問題時，將會使用圖 2-2-1 所示的其中一個規則。（引自賴明照，2003）規則一：如果兩邊的重量相同，將預言槓桿會平衡；如果重量不同，將預言砝碼較多的一邊會向下傾斜。規則二：如果一邊的砝碼數多，將預言砝碼較多的一邊會傾斜向下；如果兩邊重量相同，會選距離較大的一邊。規則三：如果一邊的砝碼數多，將預言砝碼較多的一邊會傾斜向下；如果兩邊重量相同，會選距離較大的一邊；如果兩邊的距離相同，會選重量較大的一邊；如果一邊砝碼較多另一邊距離較遠，就思考混亂或猜測任何答案。規則四：當一邊的重量大另一邊的距離遠，使用重量與距離的乘積，並預言力矩較大的一邊會向下傾斜。 Siegler（1976）設計了六種槓桿題型，來研究孩童所使用的規則：一、簡單平衡題：槓桿兩邊的重量與距離都相等。二、簡單重量題：槓桿兩邊距離相等，但是重量不相等。三、簡單距離題：槓桿兩邊重量相等，但距離不相等。四、衝突重量題：槓桿的一邊重量較重、距離較短，另一邊重量較輕而距離較長，重而短的一邊下垂。五、衝突距離題：槓桿的一邊重量較重、距離較短，另一邊重量較輕而距離較長，輕而長的一邊下垂。六、衝突平衡題：槓桿的一邊重量較重、距離較短，另一邊重量較輕而距離較長，兩邊會達平衡。

(20)

規則三模式重量一樣嗎？距離一樣嗎？是是否否平衡 _距離較大 →下傾是是否否距離一樣嗎？較大重量與較遠距離是同一邊嗎？重量較大 →下傾重量較大 →下傾思考混亂規則二模式重量一樣嗎？距離一樣嗎？是是否否平衡 _距離較大 →下傾較重 →下傾重量一樣規則一模式嗎？是否平衡較重 →下傾圖 2-2-1 Siegler 解決槓桿問題的四種規則流程圖

(21)

規則四模式重量一樣嗎？是否距離一樣嗎？距離一樣嗎？否是較大重量與較遠距離是同一邊嗎？是否重量較大 →下傾平衡 _距離較大 _是 _否 →下傾重量較大 →下傾重量與距離的乘積一樣？平衡乘積較大 →下傾圖 2-2-1 Siegler 解決槓桿問題的四種規則流程圖（續）

(22)

使用不同的解題規則的學童，對於六個題型，會有不同的答對比率，如表 2-2-1：表 2-2-1 使用規則對六個題型的答對百分比率規則一規則二規則三規則四一、簡單平衡題 100 100 100 100 二、簡單重量題 100 100 100 100 三、簡單距離題 0 100 100 100 四、衝突重量題 100 100 33 100 五、衝突距離題 0 0 33 100 六、衝突平衡題 0 0 33 100

Chletsos & Lisi（1989）的研究發現學童會以規則一及規則二來做判斷，青少年使用規則三，他們除了依據重量再進行距離的考量，而成人則使用規則三、規則四居多，意外的發現竟有部分成年人歸類於規則一及規則二，可見槓桿迷思概念分布在許多年齡層，並不易予以更改。 Stepans（1994）在教學中發現學生在槓桿上一些典型的迷思概念，如：大多數學生誤用了槓桿原理，會把兩邊的砝碼數與到支點的距離分別相加來做比較，以作為槓桿是否平衡的判斷，而許多學生對槓桿的應用也有困難，他們認為愈接近支點需要愈少的力來平衡，有些學生很難理解平衡是因為他們在比例概念上有困擾，有些學生能正確回應某些情形，但當有兩個力以上作用時就不能夠正確回應。有的研究發現，學生在個人及有夥伴的不同情境及紙筆、會話、操作的不同形式下評量對槓桿回答情形，學生竟有前後不一的答案，可見情境及形式也會影響答案及判斷（Michelle，1998）在國內的研究方面，江文慈（1993）發現四年級學生中，只有一半的學生以重量作為參考，32﹪的學生在重量相等時才會考慮距離，約有 12﹪的學生注意到

(23)

重量和距離都有影響平衡的結果，但沒有學生能正確利用重量乘距離的關係來解題。樊雪春（1999）依據 Siegler 的兒童解決槓桿問題的方法，將兒童使用規則一、規則二、規則三視為迷思概念規則，規則四視為正確概念，發現接受建構取向教學法的學生在槓桿量表的得分也無顯著差異的存在。游光純（2002）在利用臨床晤談的研究中發現國小高年級學童對槓桿概念的共通的另有想法：一、砝碼個數多者會傾斜的想法：認為砝碼數越多的一邊，重量越重，則槓桿會傾斜向下。二、力臂與重量混淆的想法，當遇到一邊砝碼數多，一邊力臂長時，則判斷依據出現不一的情形。三、力臂與重量互補的想法，會以一格力臂補一顆砝碼的想法去判斷。四、位置高低影響槓桿平衡的想法，認為物體越低重量越重，也有部分認為物體越高重量越重。五、懸掛方式影響槓桿平衡的想法，認為壓在桿子上的物體比較重。六、線的長短影響槓桿平衡的想法，認為掛物體的線越長物體會越重。賴明照（2003）在國小高年級槓桿迷思概念的研究中發現，高年級學童在不同題型中所使用的策略有相當大的不同與變化，並持有多變化與多樣化的迷思概念。並指出研究工具也應富變化性與多樣性，以各種面向去趨近學童的想法，使他們的原有想法充分表達出來。

貳、九年一貫自然與生活科技領域中有關槓桿的教材內容

為了達成本研究建構國小槓桿概念網路影像評量的目的，期望能適用於更多國小學童，更符合現行課程架構與學生學習內容，研究者將現行九年一貫課程綱要（教育部，2003），自然與生活科技領域有關槓桿概念課程之教材內容細目整理如表 2-2-2。

(24)

表 2-2-2 國小自然與生活科技學習領域有關槓桿概念之教材內容細目表細目編號：1 代表國小一二年級、2 代表三四年級、3 代表五六年級。a、b.為流水號。課題、主題、次主題教材內容細目力的作用現象：1b.察覺風、水及手的推力，可使物體運動起來力的作用：2a. 知道物體受力的大小可由形變的程度得知(如彈簧拉長、球被壓扁) 物體的位置：2c. 知道要表達物體的「位置」，應包括座標、距離、方向等資料課題：自然界的作用主題：改變與平衡次主題：215 運動與力 _{平衡與不平衡：3a. 察覺物體受好幾個力的作用，仍可能保持平} 衡靜止不動 3b. 實驗發現槓桿原理(如利用翹翹板懸掛不等重的東西) 力的作用：1a.利用空氣或水的流動製造水槍、吹管(可參考選做) 課題：生活與環境主題：生活科技次主題：412 機械應用簡單機槭：3a. 知道日常生活中常利用簡單機械(如槓桿、滑輪、鏈條、皮帶、齒輪、輪軸等) 來做事 3b.知道鏈條、皮帶、齒輪等裝置可以傳送動力 3c.知道可利用流體傳送動力課題：永續發展主題：創造與文明次主題：530 設計與製作．2a. 分析需求．2b. 圖文表達．2c. 選用材料．2d. 改善機能．3a. 考量資源．3b. 變化形式．3c. 使用機具．3d. 加工處理

(25)

槓桿概念為日常生活中經常使用到的重要概念，生活中舉凡開門、掃地、打球、吃飯時筷子的使用…等，無不使用到槓桿原理，可見槓桿概念為生活中重要的科學概念。綜合以上國內外研究，國小學童普遍存有對於槓桿的迷思概念，因此本研究欲建構一套偵測槓桿迷思概念的網路影像評量系統，用以偵測國小學童槓桿的原有概念，並找出其迷思概念所在，以提供教學者進行相關補救教學參考之用。

(26)

第三節實作評量

壹、實作評量的意涵

我國在民國九十二年全面實施九年一貫課程，其目的就是要培養學生擁有帶著走的問題解決能力，避免讓學生所能學得的只是零碎的知識，課程設計也以分段能力指標為核心。傳統的紙筆測驗對評量學生是否真正的學習到課程所要求的能力指標有所困難，由於教學目標的改變，使得評量的方式也隨之演變，評量多元化使得評量不再僅僅重視學生的學習成就，學習過程的態度、技能也同樣重要。而實作評量便是多元評量中重要的一類評量。實作評量（performance assessment）、另類評量（alternative assessment）、真實評量（authentic assessment）經常被一起使用，另類評量強調異於傳統紙筆測驗，真實評量則強調評量的內涵是現實生活經驗的應用。吳毓瑩（1996）指出實作評量在方式上是另類的，在情境或反應教學上的內容是真實的，在評定的依據上是實作的。

貳、實作評量的類型

Gronlund(1993)依據測驗的真實程度，將實作評量分成五個類型，由低至高分別是：一、紙筆的實作評量：雖使用紙筆測驗，但與傳統的紙筆測驗不同，要求受試者在模擬的情境中運用知識和技能，完成指定工作，如：設計海報、擬定活動流程、撰寫讀書報告等。二、辨認測驗：要求學生辨認解決實作作業問題所需要的知識或技能，如辨認某

(27)

機器故障的原因、未知的化學物質或數學的正確解題程序等。三、結構化表現實作評量：此評量要求學生在標準、控制的結構化情境下完成實作作業，如要求完成明確的實驗操作。四、模擬實作評量：此評量要求學生在模擬情境，完成與真實作業相同的動作，如教學實習時，學生需要進行一連串的準備，對其他同學進行模擬試教。五、工作樣本實作評量：要求學生在實際的作業情境下，表現自己的技能，如直接到工廠操作維修機器。

Linn & Gronlund（1995）依實作表現的限制程度將實作評量分成兩類：一、限制反應實作作業（restricted-response performance task）：要求學生

的表現比較狹隘，明確指出希望學生表現的形式和限制，此類評量較具結構性，計分也較容易，但比較難以評量出受試者的資料統整能力與創造力。二、擴展反應實作作業（extended-response performance task）：開放式的作

業，學生透過觀察、分析資料、實施調查完成作品，展現的作品可能形式不同，學生能自由展現他的選擇、組織、整合和評鑑訊息的能力。

叁、實作評量的優點

盧雪梅（1998）認為理論上，實作評量可以讓教師瞭解學生對問題瞭解程度、投入程度、解決的技能和自我表達的能力，能較完整的反應學生的學習成果；因為實作評量與真實生活較為相近，其支持者認為實作評量能夠增進學生學習的動機、提高學生參與和學習的程度、幫助學生建構有意義的學習環境、發展問題解決的能力、批判性的思考和自我表達的能力。有助於促成教師教學品質和學生學習成就的提升。

(28)

詹元智（2002）歸納國內外多位學者專家的研究，認為實作評量有下列五項潛在的優點：一、真實性：實作評量著重與現實生活相關的工作項目，使學生能在真實生活中的條件與挑戰情境下，應用所學的整合性知識和技巧來解決問題。二、測量全面性：實作評量不僅評量學生有效利用知識來處理複雜作業等高層次的認知能力，亦兼顧社會及情意等更為全面的能力，而非如傳統測驗只把重心放在分割、破碎細節的知識內容上。三、診斷性：實作評量重視學生學習的歷程與結果，與傳統評量只重視結果，較少提供學習過程的詳細診斷訊息相比，實作評量就較具有診斷的功能，隨時能查出學生的學習問題，進而實施補救教學。四、建構性：實作評量要求學生透過實際操作的方式，應用所學的知識與技能完成作業，給予學生在過程中建構並呈現屬於他本身的能力，實作評量是符合建構主義學習與教學的評量方式。五、幫助教學與學習：欲實施實作評量，教師不但要確認教學目標，還要進一步探究其目標的深層意思，如：問題的解決能力為何、它包含哪些面向，才可能訂出適切計分規準，而在思考探究這些問題時，教師便有機會掌握教學與評量的重要能力。具體的表現與計分規準除了能與學生溝通重要的學習目標外，更能提供學生明確的回饋訊息，使其較能主動學習、內省、並擔負起更多評論自己成品與策略的責任。

肆、實作評量的難題

盧雪梅（1998）認為實作評量實施上有以下幾點難題：一、時間上的難題：實作評量在實施及計分上所需的時間比較多。二、經費和設備上的難題：實作評量的花費通常比紙筆測驗來得多，空間需求與

(29)

器材或儀器的取得和維護保管也可能遇到問題。三、評分上的難題：評量和觀察重點的掌握和評分標準的訂定，也是一個難題，尤其是對非結構性的作業進行評量。四、技術品質上的難題：主要的是評量的信、效度問題。信度方面，評分者間評分的一致性通常不高；效度方面由於作業的項目少，以及少數的行為樣本是否能推論學生學習結果的全貌，令人疑慮。實作評量比一般紙筆測驗更能評量出學生的真實能力，但在時間、經費、設備及技術上面的難題不易克服。如若真實情境不可得，新世紀可以透過電腦來虛擬情境，進行逼真於情境的學習（林生傳，2001）。在 STS （Science,Technology and Society）科學教育方面，是一種將科學、技術與社會互相結合統整在一起的科學教育，強調在真實的情境中，以科學的方式來學習，當學生從事於解決他們關切的日常生活問題時，必能引燃其好奇心（蘇育任，2001）。因此建構一套模擬真實情境具有良好信、效度的評量，讓學生能在現有的設備下，進行紙筆以外的網路影像評量是良好的替代方案。

(30)

第四節影像評量

壹、影像評量的意義

人類接受資訊是多元的，教學應是生活的縮影，多媒體的概念於是生成，舉凡文字、圖片、聲音、動畫、視訊等一切以視覺或聽覺為主的感官刺激都稱之。有感於多媒體教育的興起，早期是以聽音為主、圖片為輔助的視聽教育，以視聽媒體為評量工具的方式也開始盛行，而現在由於電視媒體的普遍性，這股風潮也進入校園，班班有電視早已成為真實，加上校園有線電視網路的構建，使得多媒體的教學與評量實施起來更方便（黃朝恭，2000）。國小英語教學在尚未正式列入正式課程時，許多學校早已利用早自習或是導師時間進行英語教學，但是由於國小英語教師的不足，配發英語教學影帶經由電視播放，讓學生觀看學習，學生學習的成果也利用電視影像配合紙筆評量的測驗，這是國小早期影像評量的運用。影像評量是一種令學生感到非常有興趣的評量方式，在評量前先行拍攝評量的內容，透過視聽媒體分段播放給受試學生觀看，請學生紀錄觀察到的內容或解答影片的相關問題。而且任何內容均可以用影像評量，基本上這是一種重要的、值得的評量方式（Doering,2000）。影像評量也引起公司負責人的興趣，公司老闆運用視聽影像模仿真實情境（video simulations）的測試，作為員工在職場上熟練技巧的辨認，預測其將來的工作表現，這些研究結果發現視聽影像模仿真實情境的測試比傳統面試接見有更好的效果（Anderson,Jaffee & Lesure,1995）。

蔡宗雄（2003）指出凡是以攝影機拍攝一些有關評量內容的實作影像，配合影音的各種剪輯方式，以多樣化的影視設備，請學生依觀察到的內容解答影片的

(31)

相關問題；或由老師、學科專家依據評分標準，紀錄觀察學生製作影片的過程的評量方式，稱之影像評量。

貳、影像評量工具的發展之歷程、相關因素及影像評量特點

蔡宗雄（2003）在影像評量在國小六年級電路與電磁效應概念之探討的研究中，歸納了影像評量工具發展之歷程、相關因素及特點，分別如下：一、影像評量工具發展之歷程（一）依據評量內容設計影像評量腳本配合各單元概念及相關課題編寫腳本，編寫腳本時須集合製作教學媒體專家、師生、教學研究會……等眾人之智慧，完成腳本初稿並經導演指導不斷演練後才可定稿。（二）影像拍攝與編輯數位剪輯方式較能配合電腦影音處理軟體做細部剪輯，影音效果也較不易失真。剪輯時應選擇合適電腦影音處理軟體，甚至可搭配不同的影音編輯軟體，交錯運用，使影像更活潑，分段拍攝時，影片前後須預留約三到五秒的背景，以防重要影像被修剪掉。（三）影像評量實施之場地器材配合彈性且多元經由專家審核定稿後編製的多種影片格式，可配合多樣化的影視設備及適合的場地來進行評量，評量前須先安置視聽器材妥當，評量時指導語和範例的說明務必確實。（四）影像評量之修正根據試題分析結果或教學及評量上的需要，可彈性調整影像內容及評量卷。隨時備份且儲存位置最好在二處以上，以防資料破壞或流失。

(32)

二、影響發展影像評量工具之相關因素（一）課程內容影像內容須以重要的概念或原理原則為主，否則受試者一觀看影片內容即知答案，則失去評量意義。因此，如何以國小現有設備，將實驗操作過程的重點和內容，以影像方式呈現出來，必須仔細推敲考量。（二）拍攝過程拍攝過程是一種時間與空間上的配合，往往會遇及突如其來的變因，因此拍攝計劃宜考量地點安排、配合角色扮演的老師或學生之最佳時機等因素，須特寫鏡頭時，宜考量有微距功能之攝影機。（三）影像擷取與剪輯影像擷取與編輯時若以 DV 高畫素製作，以投影放大尺寸時，DV 的高畫素依然清晰。而以電腦擷取類比影像的做法，則較不適合投影放大畫面。（四）實施環境配合電視播映方式進行時，以一至二班為宜，同時多間教室評量時，須注意教室之間的隔音效果。百人以上受試者，應配合足夠試務人員及強光型的投影設備。（五）作答動機和態度受試者在影像評量和單獨評量卷的作答動機和態度上，表現明顯不同，在影像評量進行時，均表現出積極專注的態度，而影像動態加上時間的限制，更能提高其興趣，所表現出的反應，便更能接近其真正的能力。三、影像評量有諸多的特點（一）製作上具多元化（二）腳本設計和拍攝過程趣味化（三）影像評量之修正彈性化（四）時間上易於掌控

(33)

（五）器材配合彈性且多元（六）經濟實用（七）應用廣泛經過設計的影像評量除了具有良好的信度及效度外，在相關的統計分析後，證明能測量出受試者不同的表現能力，對於迷思概念的偵測上，便能更正確的加以探討，而在製作與實施上，亦能配合評量與教學的功用。所以，影像評量實為值得推廣的一種評量模式（蔡宗雄，2003）。綜合上面所述，影像評量是可以呈現實作情境的評量，在自然與生活科技領域上可加以廣泛的運用，學生觀察影片，透過影音模擬真實情境，解答相關問題，以期能培養學生在真實環境中解決問題的能力。

(34)

第五節網路測驗

近年來由於電腦與網路技術發展快速，網際網路已經與生活息息相關，對教育也產生重大的影響， WWW 本身具有節點無限延伸、跨平台、統一的通訊協定、親和的人機介面、即時的互動性等優點，因此應用在教學與評量方面，更可以讓學習突破時空之限制。

壹、電腦化測驗的發展

電腦在教學上的運用，已逐漸形成一種風氣，網路的便捷，資料處理的快速，是電腦強大的優勢。近年來電腦的速度、容量、穩定性與其他功能都有很大的進步，配合電腦來發展與運用測驗，是不可抗拒也是不可避免的趨勢（何榮桂， 1997a）。Mark(1997)認為兩個技術的運用對未來測驗的發展有顯著的影響。第一是以多媒體的電腦技術模擬的呈現方式，使得測驗更接近真實生活問題的情境；第二是人工智慧的運用，讓施測者測量到所想要測量的知識。何榮桂(1997b)認為，依現況來看，測驗的發展趨勢可略分為以下三個方向：一、由古典或傳統測驗理論轉變為現代測驗理論：傳統測量理論的紙筆式測驗，每位受試者須接受同樣的試題，無法顯現個別的能力差異。項目反應理論 (Item Response Theory；IRT)，為適性測驗提供了嚴謹的理論基礎，受試者只要接受適合其能力的題目，就可以精確的估算出能力值。

二、由紙筆式測驗轉變為電腦化測驗：電腦快速、精確特性被運用在測驗工作上，在測驗結束時，可立即獲知測驗結果，不但節省了閱卷、評分的程序，更可利用電腦搜集學生的作答過程，例如作答時間、反覆修改次數、答題順序等，以供更進一步的分析，而非只有作答結果，這些都是紙筆式測驗無法達到的功能。

(35)

三、由單機的施測環境轉變為網路化的施測環境：網路技術的快速發展，測驗的實施已能突破時空的限制，就測驗環境而言，已由單機施測發展為區域網路的施測環境，甚至是網際網路的遠距測驗環境，電腦化結合網路化的優點，提供更開放的空間、更彈性的施測環境，將使測驗的功能更加擴大。劉亞平(1997）將傳統的紙筆測驗電腦化的優點歸納如下：一、更真實的題目呈現：隨著多媒體的發展，電腦不再侷限於文字的方式呈現題目，其可以圖片、聲音、影像、動畫相結合的方式，能將試題表現在一個較為真實的情境，呈現的刺激具有多樣性與動態性。二、立即回饋的提供：電腦可以針對受試者的答題，瞬間給予反應或計算得分，受試者可以得到立即的回饋。三、施測情境的有效控制：因為電腦化測驗可將測驗標準化，避免人為情境的干擾，施測者可賦予電腦相同的動作，使受試者在相同的情境下接受測驗。四、可減少測驗的時間：電腦化測驗和紙筆測驗，在平均數、標準差、信度、標準誤等方面所得一樣，但是電腦化測驗所需的時間較少。五、額外訊息的獲得：利用電腦可以儲存一些測驗過程方面的訊息，能夠蒐集到較豐富的測驗資料，以提供改進測驗的依據。六、工作效率的提昇：電腦化測驗能自動計分和分析結果，節省人力與時間而提高工作效率。

七、適性化的測驗：電腦化適性測驗(Computerized Adaptive Testing, CAT)，可以提供適合個別差異的試題，應試者不須像傳統測驗一樣作完所有題目，因此可以縮短應試時間，減輕考試負擔。

黃朝恭（2000）認為電腦化測驗有其優點，但也有限制，如下列：一、電腦測驗的優點

(36)

(一) 電腦適性測驗受試者不需回答全部的問題，可減少測驗時間。 (二) 電腦適性測驗能準確的估計出受試者的能力值。 (三) 依據 IRT 所設計的電腦化適性測驗，可以將不同受試的測驗結果，轉換成相同量尺的能力分數，如此就可以相互比較與解釋。 (四) 即刻給分，測驗結束後受試者可立即知道其能力值。 (五) 施測的時間較有彈性，受試者可安排最適當的時間接受測驗。 (六) 題庫較具安全性。 (七) 電腦化測驗可應用於證照考試上，例如教師檢定、技術人員檢定考試等。二、電腦測驗的限制： (一) 電腦適性測驗答題時不能回顧、跳題、選擇難易度，受試者必須改變紙筆測驗的習慣。 (二) 在電腦上選答容易誤答。 (三) 測驗結果一般人不容易解釋。 (四) 同時上線施測的人數受限於電腦設備數量。 (五) 試題的型態受限於電腦的呈現模式。電腦測驗系統的利用，在近來已快速的成長，最早將電腦化測驗實際廣大應用的是美國教育測驗服務（Educational Testing Service,ETS）機構，利用電腦和區域網路對不同的測驗目標來進行大規模的測驗，傳統的紙筆測驗漸漸演進成電腦測驗。例如 GRE 的測驗自 1988 年起，傳統的紙筆測驗已全面改為電腦適性測驗。

(37)

網路無遠弗屆，利用電腦建製網頁藉由通訊介面等設備，全球有相關連結的網路系統皆可互通訊息，不論是文字或影像等資訊皆可即時輕易傳遞，已經改變了傳統資訊傳播的方式。由於網際網路本身具有節點無限延伸、跨平台、統一的通訊協定、親和的人機介面、即時的互動性等特性，所以很快地就廣為大眾所接受（江憲坤、林志豪，1999）。蔡振昆（2001）認為，網際網路由於其跳躍式遊歷的特長，無遠弗屆的溝通能力，以及生動活潑的呈現方式，可以提供學習者主動建構知識、與他人合作討論、和情境式學習等之用，因而受到廣泛的重視。網路化測驗能提供以下優點(周文正，1998)：一、提升施測與批閱給分效率，讓教師能有較多的時間在教學研究上。二、便於教師蒐集受試反應資訊，以協助教師做測驗難度與效度分析。三、提供具一致性的測驗準備與試題製作，使施測更趨於標準化。四、有利於發展網路多媒體測驗之呈現型態。五、有利於適性測驗的發展。六、減少紙上作業，降低人工作業出錯的機率。七、易於反覆練習，迅速提供施測結果與正確性的回饋資訊。八、個別化評量，不受時空地點限制。九、易於建立競爭式環境，提高學習動機與成效。電腦網路運用在教學與評量上，已是現代的潮流，功能強大的電腦及無遠弗屆的網路，提供更方便快速並多樣化的服務。使用電腦網路進行測驗，不但能降低老師教學上的負擔，提高學生學習的興趣，能以較接近真實的情境來呈現題目，也可以讓學生得到及時的回饋，有助於學生的學習。

(38)

本研究建構之模擬實作評量的網路影像評量，以現有學校設備，同時結合網路的便利性及趣味化的影像評量，在評量時透過影像聲音呈現真實的情境，必能增強學生解題的動機，提高學生學習的興趣。

(39)

第六節試題與測驗分析

在教學的過程中，教師常需要編製測驗以評量學生學習的情況，以作為教學決定的參考，如何確定教師所編的試題是優良的，則需透過試題與測驗的分析。試題分析在整個測驗編製過程中，扮演一個相當重要的角色，它不僅能夠提供客觀的試題特徵指標，提供測驗使用者參考，以作為評量測驗良窳、驗證測驗效度、和增進命題技巧外，還可以協助教師作為改進教學和診斷學生學習困難所在，以作為補救教學的依據（余民寧，1997）。

壹、試題分析

一、試題內容的分析：試題的內容分析指的是試題在質的分析所做的邏輯分析而言。每一份不同的評量均有其不同的目的和適用的範圍，在編製試題時，要遵照命題的原理原則，才能編製出適切的試題，因此試題必須要依據所要達成的教學目標，並符合課程的內容，就受試者行為變化的不同層面加以評量。試題在質的分析方面，可由試題內容審查、有效命題原則及教學目標等評鑑工作來進行（余民寧，1997）。二、試題難度與鑑別度：經過試題質的分析後，為避免測驗中出現難度過高或鑑別度過低等問題的試題，所有的試題均需經過施測並根據施測結果進行測驗統計分析，以確定試題的統計特徵的數值，挑選具有良好特徵和特質的試題。（一）難度：試題的難度指的是試題難易程度的指標，通常以 P 代表試題的難度指標，Ni

(40)

為受試總人數，Ri 為第 i 題答對的人數，P 代表第 i 題高分組（前 27%）的答對率，P 代表第 i 題低分組（後 27%）的答對率。常見的難度計算方式有兩種： iH iL iL P i _iL 1、Pi= N R_i ×100％。如果一個測驗共有 100 名受試者，其中某一題答對的人數為 35 人，則此題的難易度為 P＝ 100 35 ×100％＝0.35。 2、P =i 2 iH P + 。如果一個測驗其中某一題高分組答對的百分比為 95％，低分組答對的百分比為 35％，P＝ 2 35 . 0 95 . 0 − ＝0.30。難度指標 P 值為介於 0 與 1 之間的一個值，P 值愈大表示試題愈容易，相反的 P 值愈靠近 0 表示試題愈難。一般測驗專家均建議挑選難度約為 .50 的試題，此時試題鑑別度將可能達到最大，但是在實際的運用上，要使每一題的難度都接近 .50 是有困難的。因此有學者便主張以 .40 到 .80 之間的難易度範圍作為選擇題的挑選標準（Chase，1978）。（二）鑑別度：鑑別度是指試題所具有區分學生能力高低的功能如何。試題的鑑別度愈高表示愈能區分不同能力學生的功能越強，也就是高分組傾向答對，低分組傾向答錯；反之如果試題太過容易或太過難造成全部答對或全部答錯，鑑別度指標一定很低。本研究採用的鑑別度指標如下： D ＝PiH－P 其中 D 表示第 i 題鑑別度，P 代表第 i 題高分組（前 27%）的答對率，PiL 代表第 i 題低分組（後 27%）的答對率 i _iH 鑑別度指標為介於-1 與 1 之間的數值，由鑑別度的定義，可得知鑑別度愈高的試題，可以愈清楚地區分能力高與能力低的受試者，一般可接受的最低標準

(41)

至少要 .25 以上，低於此標準者，即可視為鑑別度不佳或品質不良的試題（Noll， Scannell & Craig，1979）。

從統計學的觀點來看，試題的鑑別度指標與難度指標之間，具有很密切的關係（Ebel，1967）。從圖 2-5-1 中可清楚的看出，當難度指標趨近兩端時（P＝0 或 1），鑑別度的指標將趨近於 0；當難度指標欲接近 .50 時，鑑別度指標的值可能達到最大。 0.5 1.0 -1.0 0.0 1.0 難度指標鑑別度指標圖 2-6-1 難度指標與鑑別度指標的關係圖（引自余民寧，1997）

貳、測驗評鑑

信度與效度是測驗的兩大特徵，評鑑一份測驗的品質應考驗其信度及效度的高低，信度與效度的意義與種類分述如下：一、信度：信度的定義是指真實分數的變異數占實得分數之變異數的百分比，但是由於真實分數是未知的，它必須由實得分數中去推估才能得知；信度也可說是測驗的可靠性與一致性。以下介紹一般較常見的三種信度的估計方法（余民寧，1997）。

(42)

（一）再測信度：同一份測驗於不同的時間對同一批受試者前後重複施測兩次，則根據這兩次測驗的分數求相關係數，此相關係數就是我們所謂的再測信度係數（test-retest reliability coefficient）。（二）複本信度：兩份測驗在試題格式、題數、難易度、指導語說明、施測時間與例題舉例等方面均相當接近或相似，並且都是用來測量相同潛在特質或能力，但是試題的內容卻不相同的測驗，施測同一批受試者，再根據兩次施測的測驗分數求相關係數，此相關係數即為複本信度係數（parallel-forms reliability coefficient）。（三）內部一致性信度：

以上的兩種信度估計方法，都需要對相同受試者進行兩次施測，這樣的做法在實務上是有困難的，包括增加測驗編製的負擔、受試者合作意願低落、動機減低等現象，而直接或間接影響到施測的結果。因此測驗統計學者就嘗試尋找只要根據一份測驗結果，就可以估算出此份測驗的信度。用這種方式所估計出來的信度係數，就是內部一致性信度係數（internal consistency reliability coefficient）。本研究採用測驗統計學者 Cronbach 於 1951 年提出α係數方法的信度係數。二、效度：效度是指測驗分數能夠代表它所要測量之能力或潛在特質的程度，或測驗能達到其編製目的的程度。效度分析主要有三個類型（余民寧，1997）：（一）內容效度：內容效度（content validity）是指抽樣的測驗試題樣本內容是否具有教學目標與教材代表性或適當性程度的一種指標。測驗的試題若能涵蓋所有教學目標和教材內容，並且根據雙向細目表來命題，且具有足夠的代表性試題，即能確立

(43)

該測驗的內容效度的適當性。（二）效標關聯效度：效標關聯效度（criterion-related validity）是指以證實分析方法研究測驗分數與外在效標間關連性的一種指標。它能夠預測受試者未來的表現或評估受試者在某些效標表現上的目前學習表現情形。（三）建構效度根據心理學或社會學的理論建構，對測驗分數能否達成它的測驗目的所做的分析和解釋，即為建構效度（construct validity）。本研究之網路影像評量系統透過試題與測驗分析，以難度、鑑別度刪選修改槓桿概念調查表試題，考驗測驗的信度與效度，建立一套偵測槓桿迷思概念網路影像評量系統。

(44)

第參章研究方法與步驟

本研究旨在建構具有良好信、效度的網路影像評量工具，用以偵測國小高年級學童在槓桿上之迷思概念。經由槓桿概念調查表初試刪選適當的題目，依此編製電腦影像評量工具，以影像模擬真實操作情境，經由電腦網路測驗方式，診斷出受試學童迷思概念所在。本章將就研究架構、研究設計流程、研究樣本、工具發展及分析方法加以說明。

第一節研究架構

本研究的設計架構如圖 3-2-1，經由文獻探討，首先編製槓桿迷思概念調查表，以建構網路線上影像評量為核心，進行槓桿迷思概念調查表預試，分析調查表各試題難度、鑑別度與答對率，删選修改槓桿概念試題，製作槓桿紙筆評量工具，編製影像腳本，進行影像拍攝與剪輯，將影像與槓桿概念試題架設於網頁，建構槓桿網路影像評量系統。編輯完成後，先進行預試，並請相關科目及測驗專家提供意見加以修改。進行槓桿概念網路影像評量時，受試學生透過電腦教室區域網路連線，連結到網路影像評量系統網頁，由網頁上播放之影片中觀察槓桿實際操作的情形，並在網頁上回答槓桿相關試題，系統紀錄受試者的答案，經過資料分析後，評量受試者之槓桿概念，分析國小高年級學生槓桿相關迷思概念。

(45)

實驗組（網路影像評量）控制組（紙筆評量）分析國小高年級學生槓桿相關迷思概念製作槓桿紙筆評量工具分析調查表各試題難度、鑑別度與答對率編製槓桿迷思概念調查表製作槓桿網路影像評量工具紙筆評量前測、網路影像評量後測圖 3-1-1 研究架構圖

(46)

第二節研究設計流程

本研究的設計流程依據 3-1-1 的研究架構圖，研究之流程如下圖 3-2-1。首先進行迷思概念、槓桿概念、實作評量、影像評量、網路測驗等文獻探討，再進行影像的拍攝，經影音編輯軟體 Media Studio 剪接加上相關文字、聲音處理，利用 PHP5 ＆ MySQL 5 將拍攝完程之影像評量建製於網頁，受試者經過網頁影片中觀察實際操作的情形，並在網頁上評量受試者之迷思概念。綜合本研究之相關研究程序，工作項目與甘梯圖(Gantt Chart）。如圖 3-2-2。形成結論與建議相關變項考驗分析試題系統測試及修正建立網路影像評量系統編製槓桿概念影像評量試題編製槓桿迷思概念調查表迷思概念、槓桿相關概念、實作評量、影像評量及網路線上測驗等文獻探討圖 3-2-1 研究設計流程圖

(47)

94 年 95 年 9 10 11 12 1 2 3 4 5 6 7 8 9 年、月工作項目月月月月月月月月月月月月月蒐集文獻資料編製槓桿迷思概念調查表編製槓桿影像評量試題影像拍攝槓桿影像評量網頁建製槓桿網路影像評量施測試題分析及相關變項考驗撰寫論文預定累積進度百分比 5 10 15 20 25 30 40 50 60 70 80 90 100 圖 3-2-2 工作項目與甘梯圖（Gantt Chart）

(48)

第三節研究樣本

本研究採立意取樣，以彰化縣五、六年級國小學童為研究對象，預試、準實驗設計及正式施測的樣本有伸港鄉某所仁類學校、田尾鄉某所智類學校、和美鎮某所智類學校等三所學校，此三所學校背景如表 3-3-1。表 3-3-1 試測樣本學校背景表地區規模升五年級有無分班學校背景測驗類別伸港鄉仁類無鄰近工業區，為農工混合區預試田尾鄉智類有位於省道上，農業區六年級兩班準實驗設計，一班正式施測和美鎮智類無鄰近彰化市，工商混合區六年級三班、五年級四班正式施測茲將預試樣本及正式施測樣本分述如下：

壹、預試樣本

槓桿概念調查表以伸港鄉一所仁類學校六年級兩班 62 名，五年級兩班 61 名學生共 123 人為預試對象，進行槓桿概念調查表預試，篩選適合的試題。準實驗設計以田尾鄉一所智類學校升上五年級時經過常態分班的六年級其中兩個班學生為施測對象，一班 33 人為實驗組，進行電腦網路化槓桿概念影像評量，另一班 33 人為控制組，進行槓桿概念影像評量的評量卷評量。

貳、正式施測樣本

本槓桿概念影像評量的評量卷評量前測，電腦網路化槓桿概念影像評量後

(49)

測，六年級部分以和美鎮一所智類國小三個班，田尾鄉一所智類學校一班，共四班 132 名學童為研究對象，但有九人因請病假、參加校外比賽、無力完成電腦測驗等因素，為完成前、後測驗，實際有效樣本 123 人。偵測五年級槓桿迷思概念部分以和美鎮一所智類國小四個班 128 人為受試對象，以網路影像評量偵測其在槓桿的迷思概念。傳統紙筆測驗與影像評量相關考驗，以和美鎮一所智類國小六年級三個班學生 90 人為樣本。

(50)

第四節工具發展

本研究之工具為自編槓桿概念調查表及自編槓桿概念電腦網路影像評量，茲分析如下。

壹、槓桿迷思概念調查表

一、槓桿概念圖賴明照（2003）參照文獻、書籍及自然科教材發展出國小高年級槓桿概念圖槓桿概念圖如圖 3-4-1，本研究參考此概念圖及第二章的文獻探討，發展槓桿概念調查表。分為分為呈現呈現當交叉乘積有兩邊力矩相等兩邊力矩不相等槓桿不平衡槓桿平衡力矩施力臂抗力抗力臂力臂施力力槓桿圖 3-4-1 國小高年級槓桿概念圖

(51)

二、編製槓桿概念調查表依據圖 3-4-1 國小高年級槓桿概念圖及 Siegler（1976）的研究，以六種槓桿題型加上力矩加成題，設計了槓桿迷思概念調查表，共 7 大題，25 小題（如附錄一），詳細分述如表 3-4-1，用以作為調查國小高年級學童槓桿迷思概念初試題目。表 3-4-1 國小高年級槓桿概念調查表題目分配表大題題形一二三四五六七總計簡單平衡題 3 3 簡單重量題 3 3 簡單距離題 3 3 衝突重量題 3 3 衝突距離題 3 3 衝突平衡題 3 3 力矩加成題 7 7 總計 3 3 3 3 3 3 7 25 三、槓桿概念調查表預試試題分析依據本研究之槓桿概念調查表對伸港鄉某仁類學校五、六年級各兩班共 123 名學生施測結果，針對各試題做難度及鑑別度分析，難度計算公式：P=（PH＋PL） ÷2，鑑別度 D＝PH－PL，其中 PH 為高分組通過率，PL 為低分組通過率，以難度 P 介於 0.40 到 0.80，鑑別度 D 大於 0.25 為標準，篩選結果如下：

(52)

表 3-4-2 槓桿概念調查表難度與鑑別度一覽表題號 1 2 3 4 5 6 7 8 9 難度 0.98 0.88 0.83 0.88 0.94 0.81 0.80 0.80 0.53 鑑別度 0.03 0.19 0.34 0.25 0.06 0.19 0.41 0.41 0.70 選取結果刪除修改修改修改刪除修改修改修改保留題號 10 11 12 13 14 15 16 17 18 難度 0.81 0.83 0.80 0.58 0.64 0.70 0.63 0.58 0.58 鑑別度 0.38 0.34 0.41 0.84 0.72 0.59 0.75 0.84 0.84 選取結果修改修改修改保留保留保留保留保留保留題號 19 20 21 22 23 24 25 難度 0.56 0.58 0.66 0.55 0.55 0.61 0.58 鑑別度 0.81 0.78 0.63 0.72 0.84 0.78 0.78 選取結果保留保留保留保留保留保留保留

貳、網路影像評量發展歷程

一、編製影像評量腳本根據篩選出之國小學童網路影像槓桿概念試題如附錄二，編寫影像評量之腳本，腳本內容如附錄三。二、影像拍攝剪輯依據影像評量之腳本以 DV 數位攝影機進行拍攝，配合電腦數位影音剪

(53)

輯，將 DV 數位攝影機拍攝之影音輸入電腦，以電腦進行剪輯影片及影音處理，配合評量內容剪輯影像、聲音，插入相關文字及配樂。三、建製電腦網路化影像評量利用 PHP5 ＆ MySQL 5 將拍攝完成之影像評量建製於網頁，並經測試修正，主要測試當電腦教室所有電腦一起連上網頁測驗時，在電腦教室區域網路中，傳輸速度能否能使網頁運作流暢，確保網路影像評量能順利完成。四、網路影像評量預試內容本研究之網路影像評量影像部分共分為七部分，詳細內容參見腳本附錄二，受試者在網頁上觀看影片的實際操作後，在網頁上回答有關影片內容的槓桿概念問題，影片時間及內容如下：（一）影片一：簡單平衡題，影片時間 1 分 44 秒。槓桿兩邊的重量與距離都相等的槓桿操作，配合第一大題試題測驗。（二）影片二：簡單重量題，影片時間 1 分 35 秒。槓桿兩邊距離相等，但是重量不相等的槓桿操作，配合第二大題試題測驗。（三）影片三：簡單距離題，影片時間 1 分 35 秒。槓桿兩邊重量相等，但距離不相等的槓桿操作，配合第三大題試題測驗。（四）影片四：衝突重量題，影片時間 1 分 9 秒。槓桿的一邊重量較重、距離較短，另一邊重量較輕而距離較長，重而短的一邊下垂的槓桿操作，配合第四大題試題測驗。（五）影片五：衝突距離題，影片時間 1 分 26 秒。槓桿的一邊重量較重、距離較短，另一邊重量較輕而距離較長，輕而長的一邊下垂的槓桿操作，配合第五大題試題測驗。（六）影片六：衝突平衡題，影片時間 1 分 19 秒。槓桿的一邊重量較重、距離較短，另一邊重量較輕而距離較長，兩邊會

(54)

達平衡的槓桿操作，配合第六大題試題測驗。（七）影片七：力矩合成題，影片時間 2 分 6 秒。槓桿的兩邊受到兩個以上的力作用。需經過力矩的加成比較兩邊力矩大小，判斷槓桿是否達成平衡的槓桿操作，配合第七大題試題測驗。五、網路影像評量預試分析本研究之網路影像評量以伸港鄉某一仁類學校，六年級一個班學生 35 人，五年級一個班學生 33 人進行預試，以統計軟體 SPSS 進行分析，如附錄四 Cronbach α 係數值為 .9008 ，具有良好的內部一致性信度。本研究在內容效度上依據圖 3-4-1 及表 3-4-1，有關槓桿概念之教材內容，根據槓桿概念調查表施測結果，進行刪選修改，編寫影像評量拍攝腳本，進行影像評量拍攝，經過剪接插入相關文字、配樂，建製於網頁而成。專家效度上，在編製影像評量時，經兩位在自然生活科技領域任教十餘年的學科專家，及一位任教於小學十餘年具有測驗統計所碩士學位的測驗專家，審核編製而成。專家學經歷詳見附錄五。

(55)

第五節分析方法

本研究以電腦化網路影像評量為工具，偵測學童槓桿概念方面的迷思概念，探討影像評量偵測國小高年級學生在槓桿概念的迷思概念之可行性，資料分析方法如下：一、試題答對率分析答對人數佔答題人數百分比。二、試題難度分析以試題難度分析，界定有關國小高年級學童槓桿迷思概念存在的情形。難度計算公式： P =i 2 iL iH P P + ，計算出來的數值介於 0∼1 之間，數值越小表示試題越難。其中 P 代表第 i 題高分組（前 27%）的答對率，P 代表第 i 題低分組（後 27%）的答對率。 iH iL iH iL 三、試題鑑別度分析 Di表示第 i 題鑑別度，數值介於 -1 到 1 之間，越接近 1 表示鑑別度越高，其計算公式為 Di＝P －P 。四、信度分析以統計分析軟體 SPSS 進行分析，以內部一致性 Cronbach α係數為考驗的依據。五、效度分析專家效度：以教學豐富的學科專家及教育測驗專家參與審查。內容效度：就預試結果分析、槓桿概念圖、槓桿概念題目分配表考驗內容效度。六、對於實驗組與控制組進行獨立樣本的 t 考驗。七、前、後測之差異以相依樣本 t 考驗來檢驗各分測驗。

(56)

八、以變異數分析男、女生在影像評量上的差異。

九、對於五、六年級學生網路影像評量表現進行獨立樣本 T 考驗。十、以 Pearson 相關係數分析影像評量與傳統紙筆測驗之相關。

網路影像評量在國小高年級槓桿概念之探討

國立台中教育大學教育測驗統計研究所教學碩士論文

指導教授：范瓊盛博士