電腦化動態評量在學習與遷移效益分析─以國小數學時間的計算單元為例

(1)

國立臺中教育大學教育測驗統計研究所理學碩士論文

指導教授：陳桂霞博士

電腦化動態評量在學習與遷移效益分析

─以國小數學時間的計算單元為例

研究生：陳惠謙

中華民國九十六年七月

(2)

中文摘要

本研究主要是建置電腦化動態評量系統，基於「漸進提示」動態評量模式，結合情境學習、電腦化測驗等工具加以設計，該評量模式融合「教學─教材─評量」三者結合於動態評量中，提示系統設計利用多媒體來呈現教材與教學結合的部分。電腦化動態評量，當受試者在進行評量過程中無法解題時，利用提示系統依序進行提示，協助受試者進行解題。而電腦化教學則是當受試者作答錯誤立即進行解題教學。本研究除了探討系統的可行性外，並對學生學習成效、學習遷移上進行分析，以 64 位五年級學生為受試樣本，隨機分派成實驗組和控制組，前者接受二次電腦化動態評量，後者接受電腦化教學與電腦化動態評量，研究結果如下所示： 1. 實驗組在學習階段，電腦化動態評量較電腦化教學更能提昇學童的學習成效，且在低成就組有顯著的差異性，由此可知低成就學童使用電腦化動態評量系統具有良好的協助性。 2. 在遷移階段，遷移成績二組無顯著的差異，顯示學童在遷移階段所需的協助更多。 3. 不同性別的學生在測驗階段不因介入處理不同而有差異，在三個測驗階段中皆對學童的解題能力有顯著的差異。 4. 學童對漸進提示動態評量系統採正向的學習態度，使學童能主動的建構學習。關鍵字：電腦化動態評量、漸進提示動態評量、學習與遷移效益、電腦化教學、補救教學

(3)

Abstract

The main purpose of this research is to develop a multimedia computer-based dynamic assessment system, which is based on graduated prompting dynamic assessment model. Using situated learning model and computer testing, this system integrated teaching, teaching materials, assessment into a dynamic assessment. Multimedia is used to present teaching and its material in a progressive prompting system. When an examinee is unable to solve a problem, the progressive prompting system will give some hints to help in a computer-based dynamic assessment procedure. Otherwise, the examinee will be immediately given this problem-solving teaching in a computer teaching procedure. In this research, we explored the feasibility of this dynamic assessment system and analyzed students’ learning and transfer effect by using different prompting methods. The sample size of this study is 64 fifth-grade students, who were randomly divided into two groups: one is the experiment group and the other is the control group. The experiment group takes two times computer-based dynamic assessment and control group takes one computer teaching and one computer-based dynamic assessment. The major experiment results indicate that:

1. In the learning stage, the students using the computer-based dynamic assessment have better learning effect than those using computing teaching and there is significant different in underachievers.

2. Therefore a computer-based dynamic assessment is useful for underachievers. 3. There is no significant difference between two groups in the transfer stage. It

shows that they need more help in this stage. There is significant difference for students’ problem-solving abilities in all three stages.

4. Students have positive attitude to the computer-based dynamic assessment system.

Keyword: Computer dynamic assessment 、 Graduated prompting dynamic

(4)

目錄

中文摘要……… I 英文摘要………II 目錄……… III 圖目錄………V 表目錄……… VI 第一章緒論……… 1 第一節研究動機 ... 1 第二節研究目的 ... 3 第三節名詞定義 ... 3 第四節論文架構 ... 4 第二章文獻探討……… 5 第一節動態評量的理論與模式 ... 5 第二節電腦化動態評量在教育測驗上的應用 ... 19 第三章研究方法與步驟………23 第一節研究步驟 ... 23 第二節實驗設計 ... 24 第三節研究工具 ... 26 第四節資料處理 ... 31 第四章結果與討論………32 第一節學童學習與遷移效益分析 ... 32 第二節不同能力的學童在實驗組與控制組之前、 ... 34 中、後測的影響 ... 34 第三節性別在不同階段的學習成就發展影響 ... 36 第四節電腦化動態評量在高、中、低成就學童所需的提示量的平均數與標準差 ... 39 第五節學童對電腦化動態評量系統之態度分析 ... 40 第五章結論與建議………42 第一節結論 ... 42 第二節建議 ... 43 參考文獻……… 45 中文部份 ... 45 英文部份 ... 47 附錄一學習階段時間概念測驗預試雙向細目表與試題概念對照表 ... 51 附錄二學習階段時間概念測驗試題(含複本甲、乙) ... 53 附錄三遷移階段時間概念測驗預試雙向細目表與試題概念對照表 ... 57 附錄四遷移階段時間概念測驗試題 ... 59

(5)

附錄五學習階段試題測驗預試難易度、鑑別度分析表 ... 62

附錄六遷移階段試題測驗預試的難易度和鑑別度 ... 64

附錄七電腦化動態評量時間概念學習提示系統流程說明 ... 65

附錄八受試者對電腦化動態評量系統態度問卷 ... 69

(6)

圖目錄

圖 3-1 研究步驟………24 圖 3-2 系統架構………27 圖 3-3 提示一畫面………29 圖 3-4 提示二畫面………30 圖 3-5 提示三畫面………30 圖 3-6 提示四畫面………31

(7)

表目錄

表 3-1 不等組前、中、後測實驗設計………25 表 4-1 實驗組在前、中測學童學習效益 t 檢定………32 表 4-2 控制組在前、中測學童學習效益 t 檢定………32 表 4-3 實驗組與控制組描述性統計………33 表 4-4 後測遷移能力共變數分析摘要表………33 表 4-5 實驗組與控制組學童遷移能 t 檢定………33 表 4-6 實驗組高、中、低成就學童在前、中、後測描述性統計………34 表 4-7 實驗組高、中、低成就學童在前、中、後測描述性統計………34 表 4-8 控制組高、中、低成就學童在前、中、後測描述性統計………35 表 4-9 控制組高、中、低成就學童在前、中、後測測驗成績之 t 檢定………35 表 4-10 實驗組二因子混合設計變異數分析表………36 表 4-11 描述性統計………37 表 4-12 相依樣本單因子變異數分析 ………37 表 4-13 二因子混合設計變異數分析表………37 表 4-14 描述統計量………38 表 4-15 描述性統計………38 表 4-16 相依樣本單因子變異數分析………38 表 4-17 高、中、低成就學童學習階段所需提示量的平均數與標準差………39

(8)

表 4-18 高、中、低成就學童遷移階段所需提示量的平均數與標準差………40 表 4-19 學童對電腦化動態評量之態度分析………40

(9)

第一章緒論

動態評量為多元評量之一，但由於動態評量在實施過程中需秏費教師大量的人力與時間，所以一般教師較不願意使用，本研究旨在使用資訊科技建立電腦化動態評量系統，利用電腦去模擬教師與學生之間的互動關係，以實驗設計了解動態評量對學生學習與遷移階段的協助與效益分析，是否具有區辨學童能力的功能，以供教師進行學前檢測或是進行補救教學。本章共分為四節，第一節為研究動機，第二節為研究假設，第三節為名詞解釋，第四節為論文架構。

第一節研究動機

資訊科技的蓬勃發展，數位化、整合化及網路化以融入我們日常生活中。政府近年來提倡將資訊科技融入課程、教學中，使得學習環境不只侷限於學校，教學者也不限於教師，學習內容也不只是在課本上的內容，學生的學習環境也不在只是在教室裡。而由於學習的多元化，評量也不在僅限傳統的紙筆評量，近而發展多元化的評量，而評量的重點也不僅限於學童的成就、分類，由於認知心理學的蓬勃發展，學者剛始意識到傳統評量在評估學習潛能及認知歷程上，未能提供充分的訊息，於是紛紛提出其他評量方法來改善傳統評量的限制，多元評量正是在此環境中所創造的，動態評量是近年來新興的評量方式，評量的焦點不再侷限於個體的現有成就、功能與篩選、分類安置上，而逐漸轉向對個體或社會或他人仲介脈絡下，所引發的學習潛能(learning potential)。動態評量一開始乃是為有特殊心智缺陷的個體設計，直到 1980 年代後，有學者將評量的重心轉向特定的學科學習上，如 Campione 與 Brown(1987)漸進提示模式與 Burns(1987)連續式評量模式此取向為代表。在結合學科學習動態評量取向的學者中，Lidz(1991)提出課程本位動態評量的看法，認為動態評量的實施若抽離於個體的學科學習脈絡外，那對個體的各項學習與能力應用不具有太大的意

(10)

義，同時也無法充分發揮效益。因此，若要動態評量與個體在學校的學習更有關聯，結合特定學科來進行動態評量更具有教學意義的發展方向。在國小數學「量」的概念中是日常生活中最常被應用的概念，時間雖然存在生活中，但它不同於長度、重量、容量這一類具體存在的實物，是一種抽象表徵概念，無法藉由實體表微出來，而不易掌握量感，只能從工具的使用入門(鍾靜， 1994) 。而在國小中、低年級課程設計中，時間概念教學是藉由教具鐘的輔助讓學童比對刻度報讀時刻，透過教師在教學過程中讓學童回想自身生活經驗，以及透過撥動教具鐘上的指針來認識時間、建立量感，達到時間概念的學習。然而中、低年級學童的抽象表徵能力尚未達成熟，且教師在操弄傳統教具時，因傳統教具鐘的大小有所限制，而其功能只有用手撥動指針，並無其它的功能(莊苑芬， 2005)。而中、高年級的課程設計中，時間量的的計算與時間化聚等教學，學生會產生的錯誤類型：不清楚時間單位的高低階關係、不了解時間複名數的意義、不了解時間化聚的意義、易受鐘面結構的影響(朱振生，2002)。故時間的計算最能以日常生活的經驗融入教學、評量、教具的單元，因此本研究以此學科單元來進行動態評量的實徵研究。 Campione 與 Brown(1987)認為動態評量所著重的是評量內容，並不在評量過去既有的知識、技巧或經驗等靜態結果，而在於評量被評量者的成長，評量本身即是一種動態的過程，但因動態評量施測時間較長，且耗費人力與物力，加上實施方式多為一對一的個別施測，實施不易故無法普及應用在教學評量上。因此在一般的班級教學中如何克服動態評量的限制，進行團體施測，是個值得研究的課題。故電腦科技的融入，將有效降低人力及時間耗損，使其經濟性與實用性更加提升。因此，基於上述研究動機研究者擬使用網路、資訊科技、多媒體，發展電腦化動態評量提示系統，結合數學科中「時間的計算」為單元，以動態評量中的漸進提示模式設計具有「教學─評量─教材」的提示系統，分析系統的可行性，同時了解學童經由電腦化動態評量提示系統的學習之後，學童的學習成效。

(11)

第二節研究目的

基於上述研究動機，本研究之主要目的如下：一、學童在學習階段，比較電腦化教學與電腦化動態評量，對學童的學習成效是否有助益，且在遷移階段，學童的遷移能力是否有顯著的差異。二、比較不同能力的學童其學習成就上協助效益。三、不同性別在不同的階段實驗介入狀態中學習，其學習成就是否有所不同。四、電腦化動態評量在高、中、低學童所需提示量。五、學童對電腦化動態評量系統之態度分析。

第三節名詞定義

茲將本研究中所使用的相關特定名詞說明與界定如下：

一、動態評量

動態評量係指將教學納入評量情境中，採取「前測─教學─後測」的程式，透過互動的方式與學童做充份的互動，藉以瞭解學童認知能力發展的一種評量方試。本研究採用 Campione 與 Brown(1987)「漸進提示」動態評量模式，即當學習者遭遇困難時，給予一連串標準化提示線索，由抽象而具體之循環過程，促使學習者瞭解問題進而自行發現解決問題的方法和步驟。

二、時間概念

本研究所提之時間概念包含時間概念、時間等量轉換、時間化聚概念，分述如下： (一)時間概念時刻是指某一事件發生的時候，對於時刻的瞭解是能認識鐘面上二指針所指的刻度，如時針走了一大格，是幾時，分針走了一圈，是幾分鐘，以及能理解 24 小時制。 (二)時間等量關係概念

(12)

等量關係是指時間單位量，日和時、時和分、分和秒二階單位關係的初步化聚，例如:「1 日=24 小時」、「1 小時=60 分」。 (三)時間化聚概念時間單位是複雜的進位，本研究所提之時間化聚為時間量加、減計算，例如: 「1 時 15 分+30 分=1 時 45 分」「6 時 20 分-2 時 30 分=3 時 50 分」。

三、多媒體

隨著科技的進步，人們體會到結合多種媒體的應用，對於訊息的傳遞有更大的助益，例如電視節目除了文字和圖片外，還結合了音訊、視訊等媒體，像這樣整合多媒體的傳播方式，便稱為多媒體(Multi-Media)。

四、學習能力

意指受試者在電腦化動態評量學習階段中的解題表現，其能力估計值係以受試者在該評量中所需要的提示量來表示。提示量愈多代表受試者的學習能力愈低。

五、遷移能力

意指受試者在遷移階段的解題表現，其能力估計值係以受試者在該評量中所需要的提示量來表示，提示量愈多代表受試者的遷移能力愈低。

第四節論文架構

本研究共分為五部份：第一部份為緒論，說明本研究的研究背景、動機、目的以及整體研究架構；第二部份為文獻探討與整理，介紹動態評量的理論與模式、電腦化動態評量在教育上的應用；第三部份為研究方法，首先介紹本研究之研究步驟、實驗設計、研究對象、研究工具、資料處理等；第四部份為結果與討論，學童學習與遷移效益分析，並了解不同能力的學童在學習成就上的表現，不同性別在不同的階段實驗介入狀態中學習，其學習成就是否有所不同? 學童對電腦化動態評量系統之態度分析;第五部份則為本研究之結論與相關建議。

(13)

第二章文獻探討

第一節動態評量的理論與模式

壹、動態評量的理論基礎

動態評量的發展主要是基於俄國心理學家 Vygotsky 的社會認知發展論，以社會中介(social Mediation)、內化(internalization)及近側發展區(Zone of Proximal Development, ZPD)、Feuerstein(1987)的學習潛能評量的論點有關，下以即分別敘述之:

一、社會中介及內化

Vygotsky 深受 Marx 歷史唯物論及 Engles 辨證方法論的影響，反對行為學派機械式的制約法則及用 S-R 來解釋高層次認知歷程的觀點，同時他也反對觀念學派在認知發展上過分依賴成熟因素及心靈的內省(introspective methods)，他認為高層次的認知功能，都是起源於社會互動的結果，個體的認知活動，起初需要透過中介者的協助，而後漸漸內化，成為自己認知結構的一部份，最後獨立不在需要外在的支持。往後經 Gallimore 和 Tharp(1990) ， Jensen 和 Feuerstein(1987)進一步的擴充詮釋如下：

1.高層次的認知活動是 S-H-O-H-R 的歷程，而非 S-R 機械性的連結。也就是說，個體認知能力的發展需要中介者(mediator)來加以促成。中介者(H)從環境中選擇刺激(S)，並依照特定目標，將此刺激傳達給學習者(O)，而後中介者(H) 再度篩選學習者的反應，塑造並轉換它，以發展學習者獨特的反應形式 (R)(Jensen & Feuerstein,1987)。

2.學習先於發展，個體認知能力的發展是依照「他人支援→自我支援→轉化為內化(自動化)→去自動化(進入下一個發展區)」在此循環歷程不斷的提升，而非發展先於學習(Gallimore & Tharp, 1990)。

(14)

二、近側發展區

以往對於能力的評估，常常著重在受試者「目前所能表現水準」上，而 Vygotsky 以更前瞻性的眼光去審視個體「未來可能發展的水準」。近側發展區是指個體「實際發展水準」(the actual development level)(指在不經協助下所能表現的水準)和潛在發展水準(the potential development level)(指在協助下所能表現的水準)之間的差距，而這種差距就代表一個人的學習潛力。根據 Vygotsky 的觀點啟發以後的學者投入這方面的研究，如 Campinoe 和 Brown(1987)；Embretson(1987b)等，分別從學習能力(learn abilies)、保留能力(preserve abilies)及遷移能力(transfer abilies)三方面來評估，施測者透過試探性的協助，去了解受試者這三方面的水準，並評估如果要提升這三方面的能力到某一水準，需要給予多少協助量，藉以作為區辨個別差異，提供診斷處方的依據。他們指出 ZPD 具兩項特性：(1)具領域特定性(同一個人，在不同的領域，可能會有不同的 ZPD)。(2)具發展性(ZPD 並非固定不變，它具有極短的衰退期，可經由外界訓練、引導，來促使其發展)( Campinoe & Brown,1987)。

莊明貞(1999)提出根據近側發展區的觀點，對評量、診斷提出以下的看法： 1. 學習者的潛能評估，應包含非輔助與輔助。 2. 傳統靜態評量，只能評估被動依賴的表現，而非學習潛能。 3. 經由成人指導或同儕合作，使學生能參與更高階、更困難的學習歷程。 4. 教學者引導學生朝向最大潛能發展，使學生心智更成熟與成長。三、Feuerstein 的學習潛能的論點 Feuerstein(1987)的學習潛能理論與 Vygotsky 的觀點很相近，他根據曾在以色列從事青少年的特殊教育經驗認為，大部分學生認知發展的問題是來自仲介學習經驗(Mediated Learning Experience, MLE)的不足。所謂「仲介學習」乃成人有計劃的介入，為學生建構適當的學習環境，並協助學生發展對環境的知覺及提供適當的問題以增進學生學習的效果，他認為只要有適當的仲介學習經驗，便可改變個體的認知結構。故學生的仲介學習經驗發生得愈早、次數愈頻繁，則

(15)

愈有利於其發展出認知地圖(cognitive maps)，以作為分析之依據，則個體認知發展的可能性越大。

Feuerstein(1987) 採用自己所發展的學習潛能評量測驗（ Learning Potential Assessment Device, LPAD）為研究工具，用「非標準化」的臨床介入，來鑑定個體在基本學習技能上「輸入」、「精緻化」、「輸出」三階段認知功能的缺陷。在 LPAD 的評量過程中，Feuerstein 提供能提升受試能力之「工具性充實」教學介入，並結合「認知缺陷的觀察記錄」，以評量受試認知功能的缺陷所在及計算能使受試直接由教學仲介階段獲益所需的提示類型及數量。在這個模式中，「工作分析」相當重要，Feuerstein 認為：受試的學習缺陷乃導因於「對作業內容不精熟」、「作業呈現的方式（如：語文、圖形、符號、數學等）不適當」、「不適當的認知功能」、「在訊息處理、輸入、精緻化、輸出三階段心智運作的缺陷」、「工作過於抽象、過於複雜」及「先備知識、技能的缺陷或尚未發展」。而工作分析乃依據認知地圖而得，主要用來釐清及鑑定學習者的學習障礙，期能改變學習者認知功能的缺陷。 Feuerstein 的動態評量模式，主要在探測學習的本質以獲得修正與增益教學的相關資料。它能使我們瞭解個體的表現，分以下四方面加以探討： 1. 測驗的結構:為測驗－教學－測驗歷程測驗的架構與傳統的成就測驗有所不同，在「測驗－教學－測驗」的形式下探知何種教學能造成學習最大潛能的改變。 2.測驗的情境:實施者與受試者之間的關係為互動關係測驗的情境與以往不同，施測者同時是教師也是觀察者，與受試者之間的互動過程確定學習經驗成功是由於接受施測者給予選擇性的回饋和問題解決的相關教學。 3.測驗的導向:屬歷程導向傳統的成就評量的重點在於結果，來區辨學童的學習能力，但在此我們重視歷程，從歷程中探討成功學習的類型以獲得改變及提供教學的訊息。

(16)

4.結果的解釋: 受試表現的高峰為個體認知潛能的指標－－例如其思考及行為固有歷程的改變。而透過工具性充實的教學訓練，主要在提供學習者下列六項重要的仲介學習經驗： 1.學習動機:是指評量者積極去引發受試者參與評量的意願，使他樂意接受中介訓練與互動。 2.意義性( meaning):評量者幫助受試者去了解情境及作業本身的意義性，同時協助他去區辨什麼資料是重要的，什麼資料是次要的。 3.超越(transcendence):評量者幫助受試者超越目前具體經驗，去連結過去、現在及未來事件，並發展其假設性及因果推理的思考能力。 4.兒童對自我能力的知覺(feeling competence):評量者透過讚美、鼓勵去建立受試者的自信心。

5.行為的自我規範及調整(regulation and behavior):評量者幫助受試者去自我規範及自我調整。 6.分享(sharing):主、受試共同分享經驗、知覺、責任的感覺…..等，以期能提升學習者的「學習技能」及「情意特質」。

貳、動態評量的發展背景

動態評量的提出為教學評量提供了一個新的思考方向，透過互動性質的評量，使得評量過程更有意義，評量結果更具價值。若欲深入瞭解動態評量，必須先瞭解其發展背景，以下分為兩部分來說明：一、促進動態評量研究的因素隨著人們對傳統評量的不滿及現代認知理論的快速發展，加上人文主義教育觀的興起，促進了動態評量的研究，下面就針對各影響因素詳加說明：

(17)

(一)對傳統評量的批判學者對傳統靜態評量標準化的施測過程與量化的評量結果提出質疑，認為忽略學習歷程的評量，將導致無法提供教學訊息的缺失，同時對於特殊兒童及文化不利兒童的學習潛能會有低估的現象。因此主張透過積極、協助的動態評量互動的歷程，降低對少數種族、文化不利或身心障礙兒童不利環境因素的影響，重新評估兒童認知學習潛能，改變兒童認知功能與結構。 (二)認知心理學的發展 1950 年 Piaget 提出「智力的可變性」，說明智力並非是固定不變的概念；而俄國心理學家 Vygotsky 亦提出「潛能發展區」的概念。這些觀點均說明個體智力的發展應視為學習的歷程，兒童是藉由認知學習促進其智力發展的。現行智力發展理論認為：智力的發展包含結構性和功能性，結構性的發展受到人類遺傳基因的限制；而功能性的發展則要透過經驗學習而進行的。所以從認知心理學觀點來看，「心智能力」是代表一連串認知歷程或認知成份的意識運作，並非只是一種靜態不變的心理特質。傳統靜態評量基本假設認為兒童心智慧力是固定不變的，所以評量的只是兒童目前的能力表現，而動態評量主張兒童的認知可透過與環境互動而提升，故動態評量所要評量的是兒童經由互動後，可能發展的學習潛能，並非只是目前獨立作業時的能力表現水準。 (三)人文取向的教育觀由於近年來人文主義的興起，使得人性化的要求成為教育的重心，強調在教育的過程中，應注重「人」的價值，除了避免因為種族、文化或身心因素，而影響其接受教育的權益外，也要注重在教學歷程中師生互動關係，故對於靜態評量在評量過程中標準化的情境以及禁止施測者與受試者間互動的要求，提出批判。強調評量時兩者間積極互動的重要性，此點促使學者應用動態評量的方式，評估兒童學習潛能；運用施測者仲介活動或回饋教學等積極性互動，促進兒童潛能的提昇。

(18)

二．動態評量的發展歷史源流就其歷史發展源流，可概分為三階段，分別是： (一)理論基礎啟蒙(1927-1961) 1920 到 1930 年代有些學者提出一些關於智力測驗評量的想法與動態評量很相近，此一時期主要在於說明「學習能力」與「智力」的關係，認為「智力」是以往習得知識能力，而「學習能力」則是隨著練習而增加的能力，兩者之間沒有關連性，透過學者對傳統智力的批判和維高斯基社會文化認知發展理論的提倡，建立了動態評量研究的理論基礎，1960 年代此一時期的特徵可以說是許多學者，因為對傳統評量方式的不滿，而致力於設計出可直接測量學習的方法，以期評估可教育性。 (二)研究模式建立階段(1964-1987) 由於研究取向的差異，諸多學習分別在此一階段提出不同的研究模式針對不同的對象進行有關動態評量的實徵研究並對傳統資料處理的缺失，提出「潛在特質理論」的現代心理計量方法，對評量後的資料進行較為嚴謹的分析。 (三)研究應用發展階段(1987 後) 此時期整個動態評量的發展己趨成熟，自 1980 年代之後漸將作業對象轉移至學科領域但數量不多，雖然動態評量被視為是一種過程性評鑑的認知評量程式，但由於缺乏動態評量的知識、明確的施測程式和時間的缺少，以致於沒有實施動態評量的學者還是占大部分，至 1990 年代蓬勃發展，很多實證研究都發現動態評量的施測程式優於傳統評量所提供的訊息，因而漸漸地很多學者相繼投入動態評量的研究。

參、動態評量的意義與特性

一、動態評量的意義傳統靜態評量以學童的學習成就測驗結果視為學童的整體學習成就，忽視學

(19)

童的學習歷程，認為智力是不可變的，因此成就測驗結果就可以用來預期未來的表現水準，相較於傳統的評量方式動態具有一些不同的特徵，動態評量是針對傳統「靜態評量的缺失，所提出的改良模式，這個名詞由 Feuerstein 於 1979 年正式使用，所謂的動態評量有兩層意義：(1)瞭解受試者動態認知歷程與確定認知能力的變化情形，著重評量學習歷程與認知改變的情形 (2)著重評量者與受試者的互動關係，強調評量與教學結合(Haywood & Brown,1990)。

Lidz(1987)認為主動性(activity)和可變性(modifiability)為動態評量的主要特色，即施測者應該作主動的介入以便去促進學習者的學習和誘導其主動的參與，注重個體後設認知歷程的評量而非產物，動態評量認為智力並非無法改變的可藉由與學童的互動，使學童產生學習遷移。動態評量指的是教師運用「測驗─介入─再測驗」的形式，對兒童的一般認知能力或特定學科領域進行持續性學習歷程的評量(陳進福，1997)。藉此瞭解教師介入與兒童認知之間的關係，以及兒童認知發展的可修正程度，確認兒童所能發展的最大學習潛能，並診斷學生學習發生錯誤原因，提供處方性訊息，以進行適當的補救教學措施(劉家成，2003)。邱上真(1996)指出動態評量又稱協助性評量，即在測驗進行中，允許給學生提供暗示、線索及協助，以便獲得學生「最大可能操作水準」的資訊。二、動態評量的特性綜合江文慈(1993)、邱上真(1996)、林麗容(1995)、莊麗娟(1996)、古明峰 (1997)、Feuerstein(1979)、Samuels(1989)、Campione 與 Brown (1990)的觀點動態評量主要特色可歸納如下: (一)強調認知能力的可變性傳統智力測驗以標準化的評量模式，進行標準化計分，並根據其得分來解釋，故智力測驗的結果是沒有變動的機會，研究動態評量的學者對智力持「增長論」的看法，認為智力是可改變、可增長的；認知或智力是透過個體與環境不斷地進行互動而持續發展的歷程(Vygotsky,1978)。

(20)

(二)重視學習成果與學習歷程

傳統評量為了求標準化、客觀化，其在實施過程中，並不給予受試者任可的幫助，當受試者遇到困難時，卻無法得到施測者任何幫助，因此我們無法得知他的問題出在那裡，而動態評量強調評量的重點在於學童對知覺、思考、學習和問題解決的歷程，而非過去學習的產物；亦即由結果導向的評量轉變為過程導向的評量(Claxton,2002;Haywood,Tzuriel & Vaught,1992)

(三)「前測─教學介入─後測」的評量過程，結合評量與教學先藉由前測建立其表現基準，再以教學介入方式使受試者產生改變，最後以後測評估受試者接受仲介後改變程度與性質(Lidz,1991)。動態評量結合教學與評量，在評量的過程中，進行教學(即針對個別需求、個別缺陷、給予適時的指導與協助)，也在教學的過程中，進行評量(意即經過協助，評估受試者的反應，進而瞭解他需要何種協助?需要多少協助?經由協助他可達到何種程度?)。 (四)比較不會低估文化不利或身心條件不利學生的認知潛能身心條件不利或文化不利的學生由於缺乏適當的學習經驗或接受測驗的先備知識，使傳統的靜態評量較容易低估學生認知潛能。Campione 與 Brown(1990) 綜合多項的研究後指出:身心條件愈不利的學生(例如:年幼學童、智能不足與學習障礙學生、文化不利學生等)，需在教學與測驗的過程中，給予詳細及明確的指導與回饋；且愈難的學習材料，愈需要測驗歷程的指導。 (五)評量者與被評量者是互動的關係在評量的程式中採取教學的介入，其內容可以是結構化，也可以是標準化，受試者是主動負責的學習者與表現者；施測者也不在是中立的旁觀者，而是扮演主動引導的角色，藉由不斷的互動過程中瞭解受試者的需求與不足之處，藉此充分掌握受試者認知歷程的障礙所在(古明鋒，1997；莊麗娟，1996)。 (六)兼重鑑定、診斷與處方動態評量除鑑定與診斷學生學習潛能與認知歷程外，更提出重要的教學訊

(21)

息，來協助學生學習，作為提供補救教學方案設計之參考，就研究對象而言，動態評量以具有不同學習困難的群體為主，研究目的則在於鑑定安置及受試者能力的塑造（林麗容，1995；張英傑，1994；Tzuriel & Feuerstein,1992）。

(七)以成功為導向的評量方式傳統的智力測驗的每一評量題項或分數測驗，幾乎在學生出了一項或一連串的錯誤結果即告中止，此種以失敗為導向的評量方式對於具有預期失敗的特殊學生而言，對其作答動機、學業自我認知，將造成不利的影響，而動態評量則針對學生的錯誤反應進行教學，直到學生學會為止。若教師能肯定教學對學生的重要性，並對學生的學習具有適當的期望，教師自然會設法因應學生的學習需求，不斷調整教學模式改善教學方法，以適合學生所需，提供學生學習成功的機會。

肆、動態評量模式

有關動態評量的模式，大致有下列六種模式：Budoff 的學習潛能評量 (Learning Potential Assessment, LPA)；Feuerstein 的學習潛能評量工具； Carlson 和 Wiedl 的極限評量模式(testing-the-limits assessment)；Campione 與 Brown 漸進提示的評量模式(graduated prompting assessment)；Embretson 心理計量取向的動態評量模式(Psychometric approach)；Burns 連續評量模式(a continum of assessment)。每一種評量模式因評量目的不同，所提供的教學型態、選擇的作業及評量的技術等亦皆有差異，在動態評量各個模式中，以 Campione 與 Brown(1987)所提出的漸進提示的評量模式在實施與應用方面應用最為廣泛，故本研究採用此模式進行研究，以下針對漸進提示評量模式加以敘述：一、漸進提示歷程的涵義傳統的智力測驗強調預測效度，預測學生學習的指標包括智商、原有的知識水準或準備度。但 Campione 與 Brown 認為預測學生的學習情形，最佳的指標應

(22)

是他們如何瞭解以及彈性運用新方法來解決新的問題。他們批評傳統的評量方法低估了那些沒有適當機會學習的兒童。因此他們進行了一連串動態評量的研究。漸進提示評量為 Campione 與 Browns 在 1987 年所提倡。本模式主要受到 Vygotsky 對於個體的學習、發展以及近側發展區理論的影響；主張透過漸進提示的方式來瞭解兒童能「獨立完成作業」及「需要他人協助才能完成」兩者間的差異程度。Gallimore 與 Tharp(1990)將此歷程分為他人支持階段、自我支持階段、自動化階段及去自動化階段等四階段，在此模式歷程中兒童被安排與成人(或電腦)互動，當兒童無法解決問題時，則需成人(或電腦)的支持與協助，兒童便能逐漸獨立解決問題能力，成人的協助支持便漸漸減少，直到兒童能夠內化所學為止。漸進提示評量的目的在於：1.在鑑定兒童在學業上失敗的責任 2.發展有效的學習能力量數來改進分類的方式。二、漸進提示評量模式漸進提示評量模式是基於「智能是可以自教學中獲益的能力」的假設而設計。強調評量過程中的協助與互動，期藉之評估受試者的 ZPD，並提升其認知能力，實施程序以「漸進提示」及採用「前測－學習－遷移－後測」的方式來評估兒童對學習的準備度及從教學中獲益的程度。在前測階段，評量受試對於學習活動的準備度及個體的一般心智功能。在學習和遷移階段，主試者依受試者的表現給予一系列「標準化」的協助，用以瞭解其學習能力及遷移效率。另外，在遷移階段，又依題型之難易，分為：（1）「維持」，（2）「近遷移」，（3）「遠遷移」，（4）「極遠遷移」四種層次，藉以評量受試者學習遷移量數，後測目的在測量兒童經教學實驗處理的能力發展情形。此模式的評量重點，在評量受試者欲達到某一特定標準時，所需要的教學「提示量」；藉以區辨個體學習潛能的個別差異，以預測個體未來的表現。在學習階段評量時，倘若兒童無法解答所給予的特定問題，主試者即按照事先設計好的一序列提示給予指導，這些提示會依「一般性」、「抽象逐漸變為具體」、「特定

(23)

而具體」的順序安排；在編製前，需經「作業分析」及「認知成份分析」來設計解題策略與步驟作為編製提示之參考。評量實施時，依事先固定的序階給予提示，在必要的情況下得以跳階。在計分方面，依「提示量」來計算：受試所需的提示量越多，表示其能力越低。並評估受試「遷移量數」－－用這二個數值做為個體之間能力差異的指標，以提供教學處方相關的訊息及預測未來的成就表現。本模式採用的研究工具，包括：邏輯推理作業，如：「字母序列完成」、類似瑞文式圖形推理測驗的矩陣推理測驗：除評估「一般心智慧力」的材料外，更擴展至「特定」的學科領域（如數學、閱讀）－－藉由探究學生於學科學習上的困難及計算解決問題所需要的教學協助量，以期使評量能與教學密切結合。典型的程式包括三至四個階段：（1）收集靜態的、表現水準的訊息；（2）初始的仲介學習；（3）靜態的、未仲介的保持和遷移評量；（4）仲介的保持和遷移的評量。 Campione 和 Brown 漸進提示模式是所有動態評量模式中，介入方式最系統化，同時也最強調遷移力及學科導向的評量模式，其優點有四：1.採用標準化的提示系統，可降低施測時評分者的主觀性，提高評分信度。2.強調遷移力的評估，而遷移力的高低，是區辦能力的差異、預測未來表現的重要指標，有助於未來的診斷與處方。3.提示系統事先分析擬定，因此施測時較為簡便，有利於普遍採用。 4.著重與學科領域結合，使評量與教學結為一體(莊麗娟，2001)。有關漸進提示教學的設計，吳國銘(1995)數學科文字題解題，提示系統依序分為:1.提供對錯之回饋 2.提供題意理解之協助：提供解題的策略 3.提供平行題目教學：提供數值較小的平行題目教學 4.提供與提示三對應連結的原題目教學：揭示完整的原題解題過程。莊麗娟(1997)自然科浮力的概念，提示系統依序分為:1.簡單回饋 2.題意說明 3.關鍵提示:提供一系列的解題步驟 4.直接教學。

(24)

伍、動態評量的實徵研究

動態評量的相關研究始於 1970 年代初期，以一般認知能力之研究為主，而 1980 年代部分學者漸將研究內容移轉至學科領域，將動態評量與學科相結合進行相關之研究，近年來，更有不少的研究是針對某一教學單元，採用電腦化的前、後測方式，進行動態評量的應用研究(林原宏，1995;Jacobs,2001)。研究者將相關研究的結果羅列如下: 一、動態評量在數學教育上的協助效益 Jitendra(1993b)以漸進示提示評量之方式，探討國小三年級學童數學解題能力，研究對象分為靜態組和動態評量組，而後者又分成一般策略教學、特定策略教學，結果顯示，接受動態評量在「數學應用問題能力測驗」的前、後測有顯著進步。 Jitendra 和 Kameenui(1993)以標準化漸進提示之方式，探討 34 名三年級學生數學文字題的解題能力，受試者分成一般策略組與動態評量組，每一組中又含專家及生手(以 75%答對率為分界限)。結果發現，在動態評量遷移階段中，生手比專家需要更多的提示；在近遷移階段，一般策略組和動態評量組中專家進步比生手多，在遠遷移階段，一般策略組中專家與生手明顯進步，而動態評量組中專家和生手進步量相當。就此看來，動態評量的助益力高於一般策略。吳國銘(1995)運用標準化漸進提示評量於 187 名數學低成就學童之診斷，結果發現動態評量對數學能力弱者，具有較高區辨力，而就學習和遷移效益而言，動態評量組高於未接受動態評量組。古明峰(1998)以 Campione 與 Brown(1987)的「支持性學習和遷移動態評量」模式，進行動態評量的研究，比較語意結構圖示策略進行漸進教學之動態評量的實驗組，與說明題意及示範解題進行一般教學的控制組，比較兩種不同的教學評量介入策略的影響效果，及不同能力的學童在解各類型遷移題所需的教學題提示量比較，研究結果顯示:1 接受語意結構圖示策略課程的實驗組受試者在學習階段的中測及遷移階段後的後測，在應用題能力測驗中的各類型問題的得分表現並未

(25)

高於一般教學的控制組學童。2.接受教學提示不同能力的實驗組學童，在近遷移、中遷移及遠遷移所需的教學提示量並無顯著差異。3.中、高能力的實驗組學童在中遷移所需的教學提示次數最多，其次為遠遷移題，而低能力組的學童，則以遠遷移題最多，其次為中遷移題。二、標準化漸進示提示模式之運用 Campione 與 Brown(1985)，針對 25 名輕度智慧不足和 25 名普通兒童，研究工具是利用瑞文氏圖形補充測驗，結果發現，兩組在學習階段所需的協助量無顯著差異，但在遷移階段卻是難度愈高，差異越大。經過漸進提示訓練後，兩組皆有進步且普通兒童的獲益較大，學習及遷移數量可作為預測未來表現的參考。 Brown 與 Campione(1987)，針對 32 名高普通能力和中普通能力的三、五年級學生，以字母系列完成測驗及補充圖形測驗，結果發現，五年級所需提示量較少，在遷移階段更是顯著。不同 IQ 及不同年齡者在學習及遷移所需的提示量有顯著差異。江文慈(1993)以 72 名國小四年級學童(分為高、中、低能力組)為研究對象，運用標準化漸進提示模式進行動態評量之研究，研究工具為槓桿解題能力。結果顯示接受動態評量提示的學童，在槓桿平衡概念與解題能力方面均優於未接受提示之學童。莊麗娟、邱上真、江新合(1996)以標準化漸進提示方式，對高雄市六年級學童依自然科成就測驗得分區分為高、中、低成就學童各 30 名，研究結果發現動態評量比靜態評量更具區辨力，能有效區辨不同程度受試者在學習能力及遷移能力之差異。實驗組經各階段動態評量其後測成績高於前測成績，也高於控制組之後測成績。此外，實驗組經各階段動態評量後，受試者間的差異減少。江淑卿(1998)將動態評量應用於類比推理上，採用 Campione 與 Brown(1987) 的漸進教學支援評量模式，結合 Sternberg 的成份訓練探討動態評量對促進類比推理解能力的效果，並分析其學習與遷移歷程之個別差異。研究發現接受動態評量後的學童，其類比推理能力有顯著的增進，且高於接受傳統教學與評量後的學

(26)

童；在動態評量中低、中能力學童，在學習與近遷移階段，所需的教學支援量，皆分別多於高能力學童；在遠遷移階段，不同能力的學童，所需的教學支援量則沒有差異。顯示動態評量中、低認知能力的學童有正向的助益。莊麗娟(2001)以自然科學「浮力概念」為題，發展「多媒體動態評量模式」，研究結果支援此評量模式可同步獲致區辦個別差異、提昇解題能力與學習情意，以及預測未來表現等三項效益。並進一步的追蹤第一階段研究中的解題能力未明顯提昇之受試者 4 人，採用個別晤談診斷的方式，進行重測藉以分析低獲益受試者的認知缺陷與解題障礙，並試探有效的協助方式，以作為進階評量診斷與教學設計的參考。

陸、動態評量對本研究的啓示

動態評量是基於 Vygotsky 近側發展區的概念而來，強調以中介方式介入學童概念建構的歷程，使學童發展其近側發展區，達成有意義的學習，因而本研究有下列的啓示：一、須重視學童概念建構的歷程學習是概念發生重組或新建符合概念的歷程，因此學童在概念重組或新建時也有可能徧向迷思概念，此時動態評量的介入，可以適時的診斷出學童學習問題所在，並給予適切的引導，使其導向正確的概念；強化學童的概念架構。因而本研究旨在將動態評量與學科領域結合，藉由動態評量的介入能重組或新建學童在學習時的迷失概念，使學童的學習有所成效。二、以漸進提示的評量模式進行實驗動態評量研究基本實施程序是以「前測─訓練或中介─後測」的方式進行，而 Campione 與 Brown 提出了漸進提示的評量模式，以「前測─學習─遷移─後測」程序進行，本研究在學習與遷移的中間，加入了中測以了解學童在學習階段時的學習能力，是否能以此能力保留到遷移的階段，前、中、後測以傳統的靜態評量，學習階段除了一般教學外，尚融入漸進提示動態評量，依據學童的個別差

(27)

異給予不同程度的提示，使學童能重整概念，產生遷移效益。

第二節電腦化動態評量在教育測驗上的應用

何榮桂(1997)認為測驗受電腦的影響是不可避免的，測驗的發展必須配合電腦科技的發展。以下將針對電腦化測驗的沿革、電腦化測驗的優缺點、電腦化測驗的類型與電腦化動態評量的相關研究四個向度來加以探討電腦化動態評量在教育測驗上的應用:

一、電腦化測驗的沿革

電腦化測驗發展可分為四代，第一代電腦化測驗(computerized testing)、第二代電腦化適性測驗(computerized adaptive testing)、第三代連續性測量 (continuous measurement):以電腦化適性測驗，根據學生前一個測驗題目來決定下一個教學內容。第四代智慧型測量(intelligent measurement)具有人工智慧的能力，辨認與解讀各種輸入資料以及友善的使用者介面。近年來測驗專家們積極發展電腦化測驗，此種測驗可分為傳統的電腦化測驗及電腦化適性測驗；前者係指將傳統的紙筆式測驗或考試用電腦來施測，也可以稱為紙張式測驗的電腦化，後者依考生的能力水準依序作答的測驗。

二、電腦化測驗的優缺點

電腦可應用在很多測驗有關的活動，如建立題庫、測驗編製、施測和評分、分析、印製成績報告和評鑑試題及測驗等方面，認為電腦來當做教學智力技能的媒體是非常適合的，電腦的特性和傳統紙筆施測的流程不同的是，電腦除了可以在過程中提供回饋之外，另外還可呈現一連串的實例與解釋，使得受試者可做額外的、不同的練習。電腦化測驗的優點包括效率的提高、立即性回饋的提供、額外的訊息的獲得、施測情境的有效控制、適性的測驗、錯誤的減少(陳志信，1993)。而林秀娟

(28)

(1993)亦主張，在試題呈現的方式上，電腦施測可能比人為主試者之紙筆式測驗更為標準化，且認為電腦施測具有以下二項優勢：可經由個別化測驗的實施增進評量品質，以對學生能力有正確的描述；並可減少編製測驗及結果評量、分析、解釋時所需的例行工作，並將之自動化。 (一)電腦測驗的優點 1.即刻給分，測驗結束後受試者可立即知道成績 2.施測時間較具彈性，受試者可安排任何時間施測 3.題庫較具安全性 4.施測後立刻給予回饋，並可施與補救教學 5.結合多媒體聲光效果，增強受試者學習能力 6.電腦化測驗可應用於證照考試上，例如：駕照筆試、技術人員檢定考試 7.容易紀錄受試者答題資料，方便分析 (二)電腦測驗的缺點 1.易受受試者資訊素養的影響，需經學習後才能使用電腦化評量 2.在電腦上選答容易因滑鼠或鍵盤操作不熟練而誤答 3.受限於電腦設備數量而限制同時上線施測的人數 4.受限於電腦的呈現模式而限制試題型態 (黃朝恭，2000)

三、電腦化測驗的類型

電腦使用在教育上的施測大約可以分為以下三大類：

(一)電腦管理測驗(computer Managed Testing):檢查學生的答案、計分並計算有關的統計數。

(二)電腦實施測驗(computer Administered Testing):電腦與學生直接對話以測驗學生所具備的知識；電腦不僅自動進行施測，並分析測驗的結果，且可根據學生的答題反應自行選擇試題，組織測驗的題目。

(29)

(三)組織測驗(test Synthesis):只要給予測驗的特徵(如水準、主題)，電腦就會自動從資料庫中提取所需要的試題，自行組織試題。測驗電腦化的程式／層次配合心理計量理論及電腦技術而分為三個層次，即計分電腦化、紙筆測驗電腦化及電腦化適性測驗: (一)計分電腦化:是技術問題，不需理論基礎，而 1935 年 IBM 己完成第一部電腦計分機(何榮桂，1997)。 (二)傳統式電腦化測驗：將以往的紙筆式測驗或考試以電腦來施測，直接搜集學生資料以統計分析，節省事後鍵入資料時間，再根據測驗結果分析學習者學習成效或心理反應，以作為學生學習、輔導的參考。此種測驗並未根據學生個別能力出題，雖與傳統測驗差別不大，但學生可於測驗後立即獲得回饋，亦可節省教師的負擔及資料鍵入的時間。具有較紙筆省時省力、快速資料處理的優點。 (三)電腦化適性測驗:電腦化適性測驗由電腦根據學習者前一題的作答情形，而挑選下一個題項，直到電腦己經正確判斷學習者的能力水準。出題中，題目並非是次序性的呈現，學習者所測驗的題數與題項未必一致。考生透過電腦進行適性選題施測的測驗方式，它是能為每一位考生量身打造與立即回饋的個別化測驗；除了可以適性選題施測外，也可以減少作答與計分時間，同時更可精確估計出考生能力(李茂能，2002)。然其限制是在題庫建構及內建題項的選題方式，而其事後的統計分析比較，也需要有專業化知能才能為之，非專業人員無法勝任，推廣上有其技術因素考量(何榮桂，1997)。因研究者初步嘗試多媒體的電腦化動態評量，傳統式電腦化測驗為研究者所較能掌握的方式，故本研究中的電腦化測驗型式不以適性為基礎，主要探討、記錄學生在傳統式電腦化測驗中的反應。

四、電腦化動態評量的相關研究

(30)

目前的研究成果如下:

Tzuriel, David, Shamir, A. (2002) 研究發現透過電腦化動態評量的實驗組比沒有透過電腦協助的控制組來的好，研究結果顯示,幼稚園的學生在電腦化動態評量的介入下能有效改變學生認知能力的表現。林秋榮(2002)研究發現電腦化動態評量數學解題系統可以提昇國小學習障礙學生整數四則問題解題能力；電腦化動態評量與人工化動態評量對國小學習障礙學生，在整數四則問題解題表現上沒有顯著差異，惟有電腦化動態評量較人工化動態評量在作答反應時間方面顯著減少。林秀娟(1993)提出用電腦來呈現試題可取代動態評量中主試者的許多功能；以電腦來施測亦可確使動態評量的程式保持精確。林素微(2002)結合了電腦網路測驗、適性化測驗及動態評量，發展出一套電腦化數感動態評量，其研究表示此系統對學童的數感表現與學習確具有協助與區辨的效益，且因為電腦呈現之訊息提供是相當標準化的，可使整個改變效益的釐清更加明晰，同時因為電腦化，亦可降低施測可能花費的資源。黃淑津(2003)為探討閱讀理解測驗電腦化動態評量之可行性與適切性，以 Campione 與 Brown(1987)漸進提示評量模式發展電腦化漸近提示動態評量系統，研究結果發現電腦化動態評量模式確能提昇國小五年級學童閱讀理解能力，且對中、低閱讀理解能力的學童之效能較大，而對於高閱讀理解能力的學童沒有效能。郭玉純(2005)提出用電腦化動態評量來提昇學童在梯形幾何思考層次，且學童在三個幾何思考層次試題中的通過率有顯著提昇，因此可知電腦化動態評量較人工化動態評量更能提昇學童的能力，因此，電腦化施測更顯其必要性。由上述文獻得知，電腦化動態評量在空間、數學解題、圖形歸類的方面的學習、評量是可行的，且電腦化動態評量在作答反應時間方面顯著減少，故研究者期望運用電腦化優勢，研究電腦化動態評量在國小數學時間的計算能力上的效益與可行性，企圖尋求較節省人力、時間與精確的評量方式，且較具有區辨力、助益力和預測力的評量結果。

(31)

第三章研究方法與步驟

本章旨在說明研究步驟、實驗設計、研究對象、研究工具及資料處理等共分五節，內容說明如下:

第一節研究步驟

動態評量的良窳，關鍵繫於中介系統的有效性，此中介系統由於須對受試者的先前經驗、學習動機、認知發展水準、解題策略等進行深入的考量，才能發揮引導思考、調整概念及激發學習功能，基於此本研究係採用動態評量中 Campione 與 Brown(1987)的「漸進提示」動態評量模式，以漸進提示設計中介系統，並將電腦科技融入其中，希望能有效降低教師人力及時間，使其中介系統更具其經濟性及實用性的提升，實施程序採用「前測－學習－中測─遷移－後測」的方式來評估兒童對學習的準備度及從教學中獲益的程度。動態評量的評量過程採學習與遷移二階段，實驗組與控制組採用不同的介入處理，在介入處理結束後分別以靜態評量了解學童在介入後的的學習成就表現，根據研究方法提出圖 3-1 的研究步驟所示：

(32)

圖 3-1 研究步驟

第二節實驗設計

本研究採準實驗設計研究中的「不等組前、中、後測實驗設計」，設計的模式如表 3-1。在實驗處理方面，實驗組採電腦化動態評量(X1、X3)，控制組採電時間計算學習與遷移試題 z 編製學習與遷移試題二份─進行預試及修改題目 z 編製時間計算標準化提示系統─進行預試及修改提示標準化後測 (實驗組、控制組) 標準化前測 (實驗組、控制組) 標準化中測 (實驗組、控制組) 學習階段實驗組進行電腦化動態評量控制組進行電腦化教學遷移階段實驗組進行電腦化動態評量控制組進行電腦化動態評量比較實驗組、控制組學生學習與遷移成效 1. 兩組學童在前、中測之學習與遷移效益。 2. 比較不同能力的學童學習成就表現是否有差異。 3. 不同性別在不同階段的學習成就發展差異 4. 電腦化動態評量在高、中、低學童所需提示量。 5. 學童對電腦化動態評量系統之態度分析

(33)

腦化教學與電腦化動態評量(X2、X4)。表 3-1 不等組前、中、後測實驗設計前測實驗中測實驗後測實驗組 O1 X1 O3 X3 O5 控制組 O2 X2 O4 X4 O6 本實驗的主要步驟及說明如下：一、以班級為單位，將受試班級分為實驗組與控制組。二、實驗處理前，實驗組和控制組分別進行「時間的計算單元測驗評量」複本甲之施測(O1、O2)，以瞭解受試者在未接受任何實驗處前之時間的計算學習的能力。三、第一次實驗介入處理：針對實驗組進行第一次「電腦化動態評量」(X1)，控制組實施第一次「電腦化教學」(X2)。電腦化動態評量的實施方式：採一人一機測驗模式，將標準化提示系統以電腦多媒體方式呈現，受試者隨系統進行評量。電腦化教學：採一人一機測驗模式，將教學方式以電腦多媒體方式呈現，受試者作答錯誤立刻提供教學。四、兩組於接受第一次實驗介入處理後，隔天進行「時間的計算單元測驗評量」複本乙之施測(O3、O4)。五、在複本乙施測後隔六週後，實驗組與控制組再分別進行第二次「漸進提示動態評量」(X3、X4)的實驗介入處理。六、兩組於接受第二次實驗介入處理隔日，再進「遷移題型測驗評量」之施測(O5、 O6)。本研究對象是以台中縣某國小五年級的學生，學生人數共為 64 人，以班級為單位隨機指派為實驗組和控制組，實驗組人數為 31 人，接受電腦化動態評量，控制組人數為 33 人，接受電腦化教學。

(34)

第三節研究工具

依本研究目的之需要，研究者自行編製試題及標準化漸進提示動態評量系統之工具，試題以日常生活與抽象的概念編製，配合學童的認知模式與學習關聯性。

一、時間概念測驗試題

(一)編擬試題試題編製係由研究者依據實驗內容，參考南一書局第七、八、九冊，康軒書局(94)第八、十冊教師手冊、課本、習作，編制過程先列出時間概念能力指標和各版本時間課程教學目標，接著依照學童的時間概念認知程度分為「知識」、「理解」、「應用」三個層次擬定雙向細目表，再依據細目表的每項概念進行試題編制共計 30 題，在每題概念予以編號如「A-1-1」，第一碼為概念項目：A 代表「認識時鐘」，B 代表「認識時刻」，C 代表「時間等量轉換」，D 代表「時間化聚計算」；第二碼為概念所屬層次：1 代表「知識層次」，2 代表「理解層次」，3 代表「應用層次」；第三題所屬試題概念的流水號。試題編排順序乃依照概念類型分類編排。最後將編製完成的試題請指導教授和國小教學經驗豐驗的教師，修改試題不合學童的語句和部分試題，成為預試題目。試題分為學習階段和遷移階段共二份試題，雙向細目表及概念對照表請參見附錄一、三，試題如附錄二、四。 (二)預試本測驗預試的樣本學習階段試題以台中市某國小四年級學童二班，共 57 份樣本，遷移階段試題以台中市某國小五年級學童二班，共 61 份樣本，刪除無效樣本後，共得有效樣本 58 份。 (三)試題分析 1.預試難易度、鑑別度本測驗以各題之得分與總分之積差相關表示本測驗的鑑別度，正相關愈高表示鑑別度愈高。本測驗分為學習階段與遷移階段兩份試題，學習階段試題測驗預試的難易度和鑑別度，其測驗的總難易度為 0.65，各題之難易度適當；且各題之 Pearson 積差相關均達顯著水準請參見附錄五。而遷移階段試題測驗預試的難易

(35)

度和鑑別度，其測驗的總難易度為 0.62，各題之難易度適當；且各題之 Pearson 積差相關均達顯著水準請參見附錄六。 2.預試信度本測驗的信度採用α係數，所得總量表的α值為 0.9，表示此測驗工具的信度可被接受。

二、電腦化動態評量系統

以電腦科技融入提示動態評量系統設計中，以電腦模擬教師與學生之間的互動關係，在提示過程中以文字、教具、解題策略等進行提示，本系統架構於網路系統中，使其實用性能提升且施測地點不限於電腦教室，教師可於一般教室中實行，同時也適用於個人或團測的施測方式，教師可登入系統中觀看受試者的學習歷程，可做為學習前的診斷，系統架構如圖 3-2 所示，茲分別說明如下：圖 3-2 系統架構試題建製 1.學習階段 2.遷移階段提示設計學生登入教師登入查看每位受試者學習歷程與進行學習診斷 SQL 資料庫測驗提示或教學測驗

(36)

一、提示編製依據提示編製的過程中研究者參考蕭蓉欣(2002)對時間的化聚與文字題解題的教學策略；朱振生(2002)國小五年級學生時間化聚學習表現與補救教學之研究中，探討學生解「時間化聚」題時，解題錯誤的原因有：高低階關係不清楚、受 10 進位的影響、時間化聚意義不了解，受鐘面結構的影響、24 與 60 進位制的混淆、不同時間單位造成的解題困擾、時間複名數的意義不了解七項，進行提示內容的編製。二、編製經過 (一)建置電腦化動態評量系統研究者就前測題目做為編製提示系統的依據，編製時並與三位國小中、高年級教師探討提示內容，初步完成時請四年級兩名學童操作之，進行初步研究，修改不適當之用詞與提示內容編製而成，即為「標準化提示系統」工具。再將此工具結合電腦化測驗原理，發展電腦化動態評量系統。 (二)軟體架構以 ASP 程式語言、FLASH、SQL 資料庫建立電腦化動態評量系統，並以網路架構為基礎，提示系統以多媒體的方式呈現，結合文字、圖片、教具的提示系統，受試者透過個人帳號進入學習，在作答過程中系統會自動記錄每位受試者之回答過程及反應時間均記錄在資料庫中，記錄並收集不同受試者的學習歷程，並給予學習診斷與建議。教師可以去查看每位同學的學習記錄與歷程，以瞭解學習者的學習歷程與阻礙，硬體需求 586 以上電腦含 Microsoft Window98 介面及多媒體等週邊設備。本系統架構分為學生考試與教師管理兩個層級，下列分述之: 1. 學生考試:學生以個人的帳號和密碼進入本系統進行測驗，本系統在施測時會對受試者告知本系統之操作方法及作答時的注意事項，受試者隨著電腦化動態評

(37)

量系統進行「出題─作答─提示─作答」，反覆進行，直到完成 19 題測驗。 2.教師管理:老師以管理者的身份進入觀看學生的學習歷程與診斷結果。 (三)提示系統設計漸進提示系統設計原則，依抽象逐漸具體依序進行提示及「評量─教學─評量─再教學」之循環歷程；研究者以此原則設計「標準化漸進提示動態評量系統」每題為四個提示步驟，下列以＂時鐘上有 12 大格，請問時針走一大格是經過多少時間?＂試題為例，說明提示系統的四個階段，並配合其所呈現的多媒體畫面茲將其作用說明如下： 1.簡單回饋:當受試者選答錯誤時，暗示其再檢查一遍，提示的目的在於規範受試者細心解題，並瞭解其解題錯誤是否由粗心造成(畫面如圖 3-3 所示)。圖 3-3 提示一畫面

(38)

2. 抽象提示：提供關鍵性的提示或題意說明(畫面如圖 3-4 所示)。圖 3-4 提示二畫面 3.具體提示:提供解題步驟或實體教具操弄(畫面如圖 3-5 所示)。教具功能如下:1. 可模擬手擬手動時鐘，分針與時針均可透過滑鼠拖曳 2.數字鐘可同步連結刻度鐘 3.指針特殊位置(含垂直、一直線、整合等按鈕)。圖 3-5 提示三畫面

(39)

4.直接教學：當受試者在一系列提示後仍無法成功解題，則給予直接教學(畫面如圖 3-6 所示)。圖 3-6 提示四畫面

第四節資料處理

配合研究目的，本研究利用 SPSS 軟體進行統計分析，資料的分析說明如下：一、學童學習與遷移效益分析。二、不同能力的學童學習成效差異情形。三、性別在不同階段的學習成就發展影響。四、不同能力的學童在學習與遷移階段所需的提示量是否會有差異性。五、學童對電腦化動態評量系統之態度分析。

(40)

第四章結果與討論

本章主要根據研究目的，進行資料分析之結果與討論，茲將分析結果分述如下：

第一節學童學習與遷移效益分析

本節分別就實驗組與控制組在接受第一次介入處理後，二組學童的學習成效；第二次介入處理後，二組學童的遷移效益分析。

一、電腦化動態評量與電腦化教學的學習成效

以相依樣本 t 檢定來檢定實驗組與控制組在前、中測之學習差異情形，表 4-1 顯示在實驗組第一次實驗處理介入後，學童在前、中測之學習有顯著的差異 (t=-2.61,p<.05)；表 4-2 顯示控制組在第一次實驗處理介入後，學童在前、中測之學習無顯著的差異(t=-1.59,p>.05)。因此，在學習階段電腦化動態評量較電腦化教學，更能提昇學生的學習成效。表 4-1 實驗組在前、中測學童學習效益 t 檢定平均數標準差自由度 t值 p-value 前測 15.06 4.59 30 -2.61 .014* 中測 16.93 5.30 *p<.05 表 4-2 控制組在前、中測學童學習效益 t 檢定平均數標準差自由度 t值 p-value 前測 16.66 4.44 32 -1.59 .120 中測 17.42 4.52

(41)

二、實驗組與控制組學生在後測成績之比較

本研究在第二次實驗介入，控制組與實驗組皆採用電腦化動態評量進行介入，以下即以獨立樣本單因子共變數分析，對於學生的遷移能力是否有差異。以中測為共變數，後測為依變數，由表 4-3、4-4 可知在排除共變數之影響後，實驗組與控制組在後測的遷移能力無明顯的差異(F=.69,p>.05)。在遷移能力方面，二組並未達到顯著的成效，經研究者分析可能是受限於在遷移階段系統給的提示階段太少，而導到學童無法自行完成解題。表 4-3 實驗組與控制組描述性統計組別平均數標準差實驗組 13.44 1.20 控制組 14.89 1.24 表 4-4 後測成績共變數分析摘要表變異來源 SS df MS F 組間 33.37 1 33.37 .69 組內 2924.63 61 47.94 全體 16316.81 64

三、實驗組與控制組學生遷移能力之比較

比較實驗組與控制組在遷移階段所需解題的提示量，以下即以獨立樣本 t 檢定，表 4-5 可知實驗組與控制組在學童遷移能力有顯著的差異(t=4.37,p<.05)，控制組所需的提示量較實驗組高，顯示控制組在遷移能力低於實驗組。表 4-5 實驗組與控制組學童遷移能力 t 檢定組別平均數標準差 df t 實驗組 3.20 3.14 62 4.37* 控制組 3.62 2.58 *p<.05

(42)

第二節不同能力的學童在實驗組與控制組之前、

中、後測的影響

一、實驗組在高、中、低成就學童在前、中、後測的表現差異性

將實驗組和控制組依前測所測得的學生能力，將學生分成三組，分別觀察三組的變化，表 4-6 是實驗組學童在前、中、後測測驗成績之平均成績，由表中我們可得知高、中、低成就學童在前、中測平均分數都有提昇，其中以低成就組的平均進步提昇最多，平均進步分數為 2.58 分。表 4-6 實驗組高、中、低成就學童在前、中、後測描述性統計受試者程度高成就中成就低成就平均數平均數平均數前測 20.86 16.33 10.42 中測 21.29 18.33 13.00 後測 17.68 15.63 8.44 進一步以相依樣本 t 檢定來分析實驗組學童在前、中測的測驗成績是否有差異，由下表 4-7 顯示：表 4-7 實驗組高、中、低成就學童在前、中測測驗成績之 t 檢定受試者程度高成就中成就低成就前測─中測 -0.2 -1.69 -3.34* *p<.05 實驗組的學童在第一次實驗處理介入後，於三個組別中，以低成就組有顯著

(43)

的差異(t=-3.34,P<.05),且中測的成績優於前測。

二、控制組在高、中、低成就學童，前、中、後測的表現差異性

下表是控制組學童在前、中、後測時測驗成績之平均成績，由表 4-8 中我們可得知高、中、低成就學童在前、中測平均分數都有提昇。表 4-8 控制組高、中、低成就學童在前、中、後測描述性統計受試者程度高成就中成就低成就平均數平均數平均數前測 22.13 17.62 12.42 中測 22.63 18.08 13.25 後測 17.13 16.92 10.94 進一步以相依樣本 t 檢定來分析控制組學童在前、中、後測的測驗成績是否有差異，由下表 4-9 顯示：表 4-9 控制組高、中、低成就學童在前、中測驗成績之 t 檢定受試者程度高成就中成就低成就前測─中測 -1.18 -0.38 -1.71 控制組的學童在第一次實驗處理介入後，於三個組別中並無任何一組達顯著的差異。

(44)

第三節性別在不同階段的學習成就發展影響

本節主要在分析不同性別的學童在不同階段的學習成就發展影響,以下即以二因子混合設計變異數分析，以依變項為學習成就，自變項有二個，一為學生性別(A 因子)內有二個變數，屬獨立樣本，另一為測驗階段(B 因子)，分為三個階段，全部受試者要接受二次的實驗介入，屬相依樣本。實驗組男生共 15 人，女生共 16 人，控制組男生共 14 人，女生共 19 人，進行二因子混合設計變異數分析的結果。

一、實驗組中性別在不同階段的學習成就發展影響

由表 4-10 可知性別與測驗階段二個自變項主要效果因子交互不顯著，性別單純因子效果效果不顯著，但測驗階段因子效果顯著，因此本研究進一步進行事後分析比較，以了解測驗階段因子間的差異性。表 4-10 實驗組二因子混合設計變異數分析表變異來源 SS df Ms F 性別 124.83 1 124.83 1.78 測驗階段 211.05 2 152.51 4.88* 性別*測驗階段 60.53 2 43.74 1.40 組內(誤差) 2034.10 29 70.14 殘差 1252.59 40 31.21 全體 74 *p<.05 由表 4-11 ， 4-12 中顯示，就測驗階段因子而言，主要效果顯著 (F=4.66,p<.05)，即表示在三個階段中，學生解題能力有顯著的不同，須進一步進行事後比較，以了解階段間的差異情形，在中測階段，學生的解題能力大於前、後測。

(45)

表 4-11 描述性統計測驗階段平均數標準差前測 15.06 4.59 中測 16.93 5.30 後測 13.30 8.14 表 4-12 相依樣本單因子變異數分析 *p<.05

二、控制組中性別在不同階段的學習成就發展影響

由表 4-13 可知性別與測驗階段二個自變項主要效果因子交互不顯著，但在性別與測驗階段因子單純因子效果顯著，因此本研究進一步進行事後分析比較，以了解測驗階段因子與性別因子之間的差異性。表 4-13 二因子混合設計變異數分析表變異來源 SS df Ms F 性別 419.74 1 419.74 7.37* 測驗階段 306.16 2 153.08 8.44* 性別*測驗階段 37.82 2 18.91 1.04 組內(誤差) 3531.15 62 56.95 殘差 2248.74 84 全體 151 變異來源 SS df Ms F 事後比較組間 2158.94 30 71.96 組內處理效果 288.97 2 102.99 4.66* 殘差 1313.13 60 21.88 全體 1313.13 92 b>a,b>c 註:a:前測 b:中測 c:後測

(46)

*p<.05 由二因子混合樣本變異數分析，可得知性別(A 因子)和測驗階段(B 因子) 主要效果顯著，我們進一步檢驗這兩個因子。表 4-14 描述統計量 B 因子測驗階段自變項二自變項一前測中測後測邊緣平均數男生 (N=29) 14.24 (5.01) 16.17 (5.27) 11.98 (7.44) 42.39 (17.72) A 因子學生性別女生 (N=35) 17.25 (3.66) 18.02 (4.43) 16.02 (6.89) 51.29 (14.98) 邊緣平均數 (N=29) 31.49 (8.67) 34.19 (9.7) 28 (14.33) 93.68 (32.7) 表 4-15 描述性統計表 4-16 相依樣本單因子變異數分析 *p<.05 測驗階段平均數標準差前測 16.66 4.44 中測 17.42 4.52 後測 15.02 6.58 變異來源 SS df Ms F 事後比較組間 1714.71 32 53.58 組內處理效果 99.48 2 49.74 3.32* 殘差 958.72 64 14.98 全體 6526.41 98 b>c 註:a:前測 b:中測 c:後測