• 沒有找到結果。

第一節 研究背景與動機

教育目的在於引發學生行為改變,然而教師則經常利用測驗來評量學 生學習後的行為改變,因此測驗在各學科中均扮演著重要的角色(林璟 豐,2001),而試題是測驗的核心部份,不同的題型根據不同的功能及需 求,可以達到不同的測驗的目的(郭生玉,2004)。

在測驗題目的題型設計,Gronlund (1993)依據測驗題型的表現方式,

將所有的題型歸納成選擇反應 (selected response)、供應反應 (supply response)、限制性實作 (restricted performance)及延伸性實作 (extended performance)等四大類。其中選擇反應型的題目主要包括是非題、選擇題 及配合題等;供應反應型的題目主要包括了名詞解釋、填充題、問答題、

論述題等。

論述題有別於其它題型,這類題型可以測量受試者的記憶能力、組織 能力或想法的啟發(葉連祺,2000),因此比選擇、是非和配合題等其它 題型,不但能測量到學生較雜,較高層次的學習結果,還能測量到綜合、

評鑑和創造等能力(李坤崇,1999)。依其作答條件的限制可以分為限制 反應題 (restricted response type)和擴展反應題 (extended response type),

前者是作答者需從提供的答案項中選出較適當者,評分者可以預先準備一 份標準答案來評分,後者為需根據題幹說明,自行提出適當答案,作答者 可以根據自己最佳的判斷組織答案,整合和評鑑自己認為適常的想法或觀 念,因此在評分上很難去預先準備一份模擬答案 (Gronlund, 1993)。

本研究中的電機電子技術創造力測驗,針對國中三年級自然科技領域 學生及高中職電機 (子)科,測驗其擴散思考能力的表現,擴散思考能力

是指一種自由產生的新觀念的思考方式,擴散性思考與創造力被視為雙胞

詹彥杰(2005)和陳俊宏(2004)提出使用CKIP 和資訊檢索技術,

建立中文環境簡答題型的評分模式。資訊檢索的模式,根據Baeza-Yates 和 Ribeiro-Neto (1999)提出,有三種資料的比對模式,包括布林模式 (Boolean model)、向量模式 (vector space model)、機率模式 (probabilistic model)。

其中布林模式是利用邏輯運算AND、OR、NOT 的運算子來比對資料 的內容。其相似度只有1 和0,1 代表符合,0 代表不符合。簡單的說,

比對的文件內容,要完全符合檢索詞才能取出,不符合則捨去。這樣的優

點:簡單,清楚,速度快,對於答案符合標準答案的部份能快速的比對。

但是缺口為答案與標準答案只要略有不符就會評為錯。

現今電腦處理速度已足以應付大量與複雜的計算,而且愈來愈容易使 用(洪新原、孫敏育、洪萬富,2002),如何利用人工智慧使用電腦能自 動判斷如何去測驗及進行評量是值得研究的方向 (Mark, 1997),何榮桂

(1997)就指出配合電腦來發展與運用測驗是不可抗拒也是不同避免的趨 勢。

而應用人工智慧於批改論述題測驗的相關研究中,寫作自動評閱 (automated essay scoring, AES)為著名且成功的例子,但是在中文環境下,

使用自動評分系統批閱論述及填充題的測驗題型並不容易(林明達,

1998),其發展因難的主因在於中文缺少缺英文效能良好的文法自動剖析 工具,以及中文有英文有沒有的斷詞問題與中文句子定義模糊等難處(張 道行、李嘉晃、譚克平,2006)。

雖然要發展一個中文環境下的擴展反應型論述題的自動評分系統是 相當困難的,但本研究的批改對象其答案比起作文要簡短許多,也不具作 文中才有的段落連接及修辭技巧等評分的項目。因此嘗試以專家系統為理 論基礎,並建立特徵關鍵詞庫來比對應試者答案,建構「電機電子技術創 造力測驗」電腦化輔助評分工具,閱卷人員能以此一工具做為輔助評分工 具,以減低人工閱卷可能產生的誤差及人力與時間的浪費,並提高評分結 果的正確性及效率。

相關文件