研究背景與動機

第一節研究背景與動機

教育目的在於引發學生行為改變，然而教師則經常利用測驗來評量學生學習後的行為改變，因此測驗在各學科中均扮演著重要的角色（林璟豐，2001），而試題是測驗的核心部份，不同的題型根據不同的功能及需求，可以達到不同的測驗的目的（郭生玉，2004）。

在測驗題目的題型設計，Gronlund (1993）依據測驗題型的表現方式，

將所有的題型歸納成選擇反應 (selected response）、供應反應 (supply response）、限制性實作 (restricted performance）及延伸性實作 (extended performance）等四大類。其中選擇反應型的題目主要包括是非題、選擇題及配合題等；供應反應型的題目主要包括了名詞解釋、填充題、問答題、

論述題等。

論述題有別於其它題型，這類題型可以測量受試者的記憶能力、組織能力或想法的啟發（葉連祺，2000），因此比選擇、是非和配合題等其它題型，不但能測量到學生較雜，較高層次的學習結果，還能測量到綜合、

評鑑和創造等能力（李坤崇，1999）。依其作答條件的限制可以分為限制反應題 (restricted response type）和擴展反應題 (extended response type），

前者是作答者需從提供的答案項中選出較適當者，評分者可以預先準備一份標準答案來評分，後者為需根據題幹說明，自行提出適當答案，作答者可以根據自己最佳的判斷組織答案，整合和評鑑自己認為適常的想法或觀念，因此在評分上很難去預先準備一份模擬答案 (Gronlund, 1993）。

本研究中的電機電子技術創造力測驗，針對國中三年級自然科技領域學生及高中職電機 (子）科，測驗其擴散思考能力的表現，擴散思考能力

是指一種自由產生的新觀念的思考方式，擴散性思考與創造力被視為雙胞

詹彥杰（2005）和陳俊宏（2004）提出使用CKIP 和資訊檢索技術，

建立中文環境簡答題型的評分模式。資訊檢索的模式，根據Baeza-Yates 和 Ribeiro-Neto (1999）提出，有三種資料的比對模式，包括布林模式 (Boolean model）、向量模式 (vector space model）、機率模式 (probabilistic model）。

其中布林模式是利用邏輯運算AND、OR、NOT 的運算子來比對資料的內容。其相似度只有1 和0，1 代表符合，0 代表不符合。簡單的說，

比對的文件內容，要完全符合檢索詞才能取出，不符合則捨去。這樣的優

點：簡單，清楚，速度快，對於答案符合標準答案的部份能快速的比對。

但是缺口為答案與標準答案只要略有不符就會評為錯。

現今電腦處理速度已足以應付大量與複雜的計算，而且愈來愈容易使用（洪新原、孫敏育、洪萬富，2002），如何利用人工智慧使用電腦能自動判斷如何去測驗及進行評量是值得研究的方向 (Mark, 1997)，何榮桂

（1997）就指出配合電腦來發展與運用測驗是不可抗拒也是不同避免的趨勢。

而應用人工智慧於批改論述題測驗的相關研究中，寫作自動評閱 (automated essay scoring, AES）為著名且成功的例子，但是在中文環境下，

使用自動評分系統批閱論述及填充題的測驗題型並不容易（林明達，

1998），其發展因難的主因在於中文缺少缺英文效能良好的文法自動剖析工具，以及中文有英文有沒有的斷詞問題與中文句子定義模糊等難處（張道行、李嘉晃、譚克平，2006）。

雖然要發展一個中文環境下的擴展反應型論述題的自動評分系統是相當困難的，但本研究的批改對象其答案比起作文要簡短許多，也不具作文中才有的段落連接及修辭技巧等評分的項目。因此嘗試以專家系統為理論基礎，並建立特徵關鍵詞庫來比對應試者答案，建構「電機電子技術創造力測驗」電腦化輔助評分工具，閱卷人員能以此一工具做為輔助評分工具，以減低人工閱卷可能產生的誤差及人力與時間的浪費，並提高評分結果的正確性及效率。

在文檔中電機電子技術創造力測驗電腦輔助評分工具之建構與應用 (頁 9-12)

第一節 研究背景與動機

第一節研究背景與動機