• 沒有找到結果。

第二章 文獻探討

第二節 潛藏式評量

用(Rupp et al., 2010; Shute, 2011)。

從前一節的文獻探討可以看出,整合遊戲的心流狀態和學習理論,對於提升

學習和學習者屬性皆能在遊戲過程中被核對與評估;(三)學習者的優點或缺點,

能分別被提出或支持;(四)形成性的回饋能被用於進一步支持學生學習(Shute, 2011; Valerie J. Shute, Hansen, & Almond, 2008)。

二、形成性評量

當老師或電腦輔助教學系統知道學生正如何進展,以及哪裡有了問題,他們 就能使用此資訊在教學上做即時性的調整,像是再教一次、嘗試替代的教學方法、

修改任務或問題的困難度級別,或提供更多練習的機會。廣泛地說,這就是一種 形成性評量,它也已經被證明能改善學生成就(Paul Black & Wiliam, 1998; P.

Black & Wiliam, 2006; Valerie J. Shute et al., 2008)。

Clarke 曾提及「如果我們的孩子像是植物…對植物的總結性評量只是簡化測 量的一種過程。此測量可能使人有興趣去比較和分析,但對於測量本身而言,它 們並未影響植物的成長。另一方面,形成性評量就像是能給植物肥料和水源的花 園,直接地影響他們的成長。」(Clarke, 2001)。

Dylan(1998)認為形成性評量的意涵可從豐富的提問、回饋和學習者的角 色三方面來探討:

(一)提問(Rich questioning):能找出學生錯誤觀念的問題,就是一個好的問 題。學生在內化老師所教導的知識時,常會產生某些迷思概念,因此希望藉由問

由此可知,給予學生們意見與鼓勵,比起其他方式更能使學生產生正向的學習目 的。

(三)學習者的角色(learner’s role):提問和回饋都是著重在教師的角色,Dylan 認為學習者不應該只是被教師評量,也應該要自我評量,如:學生針對自己完成 (Shute, 2011)。

從教學者的角度來說,藉由形成性評量,一種較不直接協助學生學習的方式

過去亦不乏有形成性評量能成功促進學習成效的研究。Hudson 和 Bristow 在 2006 年的研究顯示,問答遊戲式形成性評量活動,能提供學習者一個有趣的、

無威脅的、並且能獲得更多回饋的學習環境。課堂中利用電子輸入設備(如按按 按系統)進行形成性評量,將能促進問題回答狀況的分析,並且使得所有學習者 都能涉入活動之中,進而使學習和評量的效果獲得最大程度的改善(Hudson &

Bristow, 2006)。

不直接給予正確答案(適時地回饋)、質問分數、詢問問題、全部過關就給予獎賞、

監控答題歷程和詢問提示(Ask-Hint)等。結合上述策略所設計出的問答遊戲式 (quiz-game like)形成性評量系統,較傳統線上評量系統更能激發學生的動機,學 生能自動自發地參與自我評量活動,並且監控自己的學習狀況和改善學習的成效 (Wang, 2008)。

三、遊戲與形成性評量的連結

玩遊戲(經過良好設計的)確實有強化學習的潛力,並且每年有越來越多的研 究者宣稱有許多重要的學習和發展正在這樣的虛擬環境中被進行著。但是什麼確 實正被學習著?玩家想在遊戲中學習些什麼?這些技能是否具有教育價值,特別 是能否符合未來工作的需求?並且,我們如何能證實宣稱它具有這樣的效果?

當玩家在進行遊戲時,許多遊戲變項的數值會隨之改變,例如:戰鬥中受傷 會減少生命值、找到寶物或其他東西會增加於物品清單,以及解決遊戲中主要的 任務能使玩家提升等級等。那麼這些數值具有教育意義嗎?當遊戲與評量加以結 合後,便賦予了有價值的意義。此時,玩家除了確定生命狀態,還會關注他們在 目標能力上的表現,並且假若這些變項的數值太低,玩家將會想要採取行動以提 升它們。蒐集遊戲中豐富的數位資料串流不成問題,問題在於如何使這些可能如 洪水般襲來的資料變得有意義。另一個主要的問題是,如何簡單地呈現學生的學

的知識片段。正確地回答問題代表知道某些事實的證據;即一個問題等於一個事 實。然而若藉由分析學生對所有問題的反應,每一題皆是證據,提供關於學生對 特定事實或概念的了解,教師或教學環境能得到一個圖像,即什麼是學生可能知 道或從頭至尾不知的。Shute 提出了一個解決方案,即延伸和應用「證據中心設 計」(ECD)取向的評量設計,這提供(一)關於評量設計的發展方式和(二)無論在遊 戲或其它學習環境中學生成就的推論方式。它是一個能解決上述問題,並且使設 計一個可靠且有效的遊戲式學習系統成為可能的方法(Shute, 2011; Valerie J.

Shute et al., 2008; Shute et al., 2009)。

貳、潛藏式評量的方法

一、證據中心設計(Evidence-centered design)

證據中心設計(ECD)的基本概念源於 Messcik(1994),而稍後由 Mislevy 和其 同僚正式提出。一個包含潛藏式評量的遊戲必須引出具有關於目標技能和知識的 證據行為,並且必須額外提供對證據的原則性且符合評量目的的詮釋。圖 3 描繪 一個證據中心設計取向的基本架構(Messick, 1994; Robert J. Mislevy, Steinberg, &

Almond, 2003; Shute et al., 2009)。

圖 3 證據中心設計的主要模式。取自 Shute et al.,2009。

在此所發展的這些變項和模型以及它們之間的關係能回答 Messick(1994)對

(一)什麼知識、技能或其它屬性的複合物應該被評量?

一個施行的測驗意味著為了某些目的的推論做為證據,正如:許可的決定、

診斷回饋的證明、近一部教學的導引或上述的整合。能力模型 (Competency Model,CM)中的變項描述做為推論基礎的知識、技能和能力。學生模型(Student Model)經常代表學生在能力模型上的真實狀況。學生模型中的數值即表示專家目 前認為學生在能力模型中各變項的學習狀況。

(二)什麼行為能揭露這些構念?

證據模型(Evidence Model)展現對應於能力模型變項的行為特徵,學生在遊 戲中所有的行為序列便能組成推論目標能力學習狀況的證據。也就是說我們需要 為遊戲中的特定行為預先定義其對應於能力模型變項的意涵,並加以描述。

(三)什麼任務或情境能引出這些行為?

任務模型(Task Model)描述用來引出行為的具體情境特徵。任務模型為特徵 化和結構化的情境提供一個框架,學生會與這樣的情境進行互動,以提供關於目 標能力學習狀況的證據。

遊戲的潛藏式評量之中,能力模型(學生模型)能呈現目標能力的整體架構,

並以其各變項的機率分布來呈現。證據模型能辨認學生做了哪些行為,並且表現 這些行為證據與能力模型變項的關聯程度。任務模型能表現得以蒐集各項行為證 據的任務或情境(Robert J. Mislevy et al., 2003)。

則意味著評量是高複雜度且耗費更多專用資源的。(二)在遊戲環境中當學生是以 合作的方式完成任務時,發展證據模式會更加困難。例如;如何能追蹤每個學生 的行動,以及對於整合的任務成果各有什麼樣的看法?(三)另一個挑戰來自於質 性作品的評分,如論述文、學生反思和線上討論,這些可能都是高度主觀的,即 使提供認知性的標題給教師。因此,詳盡且有力的編碼方案是必需的,它能用於 辨別學生在任務中的情境和語義上的差異。(四)任務模型的議題仍在於被指定的 任務是否應該結構化。評估特定的行為序列能促進更可信的資料蒐集,但卻可能 因而限制學生探索環境或採行替代路徑的能力,這些都是讓學習者覺得有趣和能 促進自我學習的地方。所以,當遊戲設計者在遊戲中建立評量,他們需要在學生 探索和結構化資料蒐集的矛盾之間尋求最理想的平衡點(Rupp et al., 2010)。

参、潛藏式評量的相關理論

一、貝氏網路

貝氏網路(Bayesian network, BN)是一種非循環有向圖形(Directed Acylic Graph),能呈現 N 維度機率分布間因果關係的網路模型。它結合機率與圖形理論,

適用於描述與推論不確定的事物(Pearl, 1988)。

圖 4 貝氏網路模型

圖 4 中的節點即為變數,連接線代表變數間的相依關係,相依關係的強度則

布,從可觀察到的證據訊息來推論未觀察到的變數狀態。其公式如下:

貝氏網路結合事前機率(專家的判斷)與樣本機率(由預試學生的答題反應資料得 知),有效地利用有限的樣本,導入專家的判斷數值來推論目標變數可能的狀態。

適用的領域包含醫學診斷、決策支援、資訊萃取和診斷評量等(Heckerman, Mamdani, & Wellman, 1995;林垣圻,2005;陳金葉,2009)。

貝氏網路能在教學中監控學生的行為,整合玩家實際行為的證據,來更新能 力模型,成為真實的學生模型。貝氏網路也能被用來協助產生學習狀況報告給不 同的教育相關人士(如:教師、學生和父母)。貝氏網路教適用於教育測驗中的認 知診斷評量,其優點有:(一)以機率裡論為基礎的貝氏網路能有效描述和推論各 變項間的不確定性關係。(二)能有效地利用先前的經驗提升診斷的精確度。(三) 圖形化的表徵能清楚展現變項間條件獨立或依賴的關係。(四)有發展成熟的理論 基礎,藉由模型中可觀測變項的機率作為證據,推論目標變項的機率。(五)能隨 時依據證據的變動,動態地更新模型架構(R.J. Mislevy, Almond, & Lukas, 2004;

Robert J. Mislevy & Haertel, 2006; Robert J. Mislevy et al., 2003; Shute et al., 2009)。

本研究參考國內外文獻所發展的貝氏網路模型中,其節點分別代表技能,錯 誤類型和題型,節點間的連結代表其間的關聯程度。基於證據中心設計取向,將

相關文件