電子化學習環境下智慧型線上測驗系統架構之研究

(1)

行政院國家科學委員會專題研究計畫成果報告

電子化學習環境下智慧型線上測驗系統架構之研究

計畫類別：個別型計畫計畫編號： NSC93-2416-H-004-013- 執行期間： 93 年 08 月 01 日至 94 年 07 月 31 日執行單位：國立政治大學資訊管理學系計畫主持人：楊亨利計畫參與人員：應鳴雄報告類型：精簡報告處理方式：本計畫涉及專利或其他智慧財產權，2 年後可公開查詢

中華民國 94 年 9 月 26 日

(2)

行政院國家科學委員會補助專題研究計畫成果進度報告

※※※※※※※※※※※※※※※※※※※※※※※※

※ ※

※

電子化學習環境下智慧型線上測驗系統架構之研究

※

※ ※

※※※※※※※※※※※※※※※※※※※※※※※※

計畫類別：個別型計畫

計畫編號：NSC 93-2416-H-004-013

執行期間：

93 年 8 月 1 日至 94 年 7 月 31 日

計畫主持人：楊亨利教授

計畫參與人員：應鳴雄

成果報告類型：精簡報告

處理方式：二年後可公開查詢

執行單位：國立政治大學資訊管理學系

中華民國

94 年 8 月 1 日

(3)

行政院國家科學委員會專題研究計畫計畫成果報告

電子化學習環境下智慧型線上測驗系統架構之研究

計畫編號：NSC 93-2416-H-004-013

執行期限：93 年 8 月 1 日至 94 年 7 月 31 日

主持人：楊亨利教授國立政治大學資訊管理學系

計畫參與人員：應鳴雄

一、中文摘要線上測驗已成為電子化教育學習的重要議題，少數系統雖可支援填充題及其他非選擇題型測驗，但卻以非對即錯的二元樣形比對進行評分，而影響測驗系統的評分效力。目前系統缺乏提供教師設定個人化評分風格及相似語意詞庫，對於多位教師共用測驗系統平台環境時所產生的評分規則認知衝突，系統並未提供支援與解決，本研究使用模糊理論、相似語意詞庫及人工智慧概念等，發展具備模糊評分機制的線上測驗系統。此外，本研究結合不同回饋類型，使測驗系統不再只是評量答案對錯及計算總分而已，還能更進一步告知受測者答案的原因，並提供該題目相關的教材內容幫助學習。本研究經由實驗程序發現，本系統的模糊機制的確能提高一般線上測驗系統的評量效力。關鍵詞：線上測驗、電子化學習、填充題、 模糊評分機制、回饋訊息 Abstract

The computer-based or online testing has been one of important topics of information education. Currently, most of on-line testing systems only had selection-type items (single or multiple answers). Though some systems provide short-answer items (completion-type items), they can only recognize the answers either all right or all wrong by simple computer binary pattern matching. In addition, they cannot provide customized grading and thesaurus semantic environments for teachers. In order to solve these problems and have the same evaluation effects as the traditional paper-and-pencil testing, this research has adopted the concepts of fuzzy

theory, thesaurus, set concept, and artificial intelligence to develop the fuzzy scoring mechanism. The proposed on-line testing system has true-false, multiple-choice, and fill-in-blank items. The latter will be graded through fuzzy judgment that is naturally endowed by the human teachers. In addition, the prototype system would not only grade the test items, but also explain the answers and provide related materials to the testers. Through experiments, we also proved that the prototype could have the same evaluation effects as the paper-and-pencil testing.

Key Words: Computer On-Line Testing, Fill-in-Blank Type Items, Fuzzy Scoring Mechanism, Feedback Message, E-Learning. 二、計畫緣由與目的 測驗是利用試題來評量學生成就的一種工具，也是評量學習成果的有效方法。傳統紙筆測驗，無論是出題、考試、閱卷、成績計算等作業，皆由人工進行處理，而受測者通常也被指定在同一時間及同一地點進行考試。如此一來，不但測驗效率不高，且人工作業出錯的機會亦相對較大。此外，若受測者眾多，且分佈於不同的地理位置，則受測時間勢必難以配合，所需付出的成本亦相對增加(何榮桂,民 79;周文正,民 87)。近年來電腦輔助測驗(Computer-Based Testing, CBT)越來越被廣泛採用，其原因在於能提高測驗效率、減少測驗時間、降低測量誤差、提供多元豐富的試題呈現方式、獲得測驗相關的其他資訊(何榮桂,民

(4)

88)。因此目前美國 GRE 測驗及托福考試皆已採用電腦輔助測驗方式進行，考選部也正積極規劃國家考試採行電腦化測驗作業，並期望能達成考試技術的重大突破(考試院,民 92; 周倩、簡榮宏,民 86)。

Mark(1997)及 Bennett et al.(1999)也認為利用人工智慧使電腦自動判斷如何去測驗及進行評量將對電腦測驗及網路測驗的未來有明顯的影響。因此，近年來已有一些研究結合了人工智慧及模糊理論等技術，以期望測驗系統能更具效能， (Sun,1999;Moundridou,2003;Hwang,2003)。美國心理學會(American Psychologi- cal Associate, APA)在 1986 年，發表了以電腦為基礎的測驗在發展、使用以及解釋上的指導原則，以使電腦測驗能夠與傳統紙筆測驗具有同樣的效力(Bugbee,1996)。國內一些研究者也指出，現今實施線上電腦輔助測驗在教學活動中的確有其必要，而且使用電腦進行測驗時，其測驗效果應該與傳統紙筆測驗結果相同(何榮桂,民 89;簡茂發,民 88)。目前大部分的網路測驗系統，在設計上往往受到傳統紙筆測驗觀念的影響，因此考試題目的類型普遍仍以單選題、複選題及文字測驗為主。雖然目前亦有少數系統提供填充題及其他類型的測驗，但卻都只能做到答案的樣式(Pattern)比對，而卻未對答案語意進行分析比對；因此在現有提供填充題型測驗的系統中，若作答者填答之答案與題目設定之標準答案不同，系統便判定為「答錯」；然而，這樣的電腦測驗結果將會產生嚴重的評量效度問題，Tsai, et al.(2001)與 Han, et al.(1997)便指出電腦測驗之評量也應該與傳統測驗評量有著相同的評量效度，因此本研究針對此部分進行測驗系統的改進研究。林明達(民 87)也認為使用電腦批閱申論題及填充題的測驗題型並不容易，其中填充題的答案常有不同的寫法或有許多相同意義的詞彙，使得無法明確的指定標準答案。以計算機概論課程的填充題測驗為例，在傳統的紙筆測驗環境中，當受測者填寫答案「RAM」與題目的標準答案「隨機存取記憶體」在語意上相似或同義時，批閱者(教師)通常會根據受測者答案及標準答案間的語意相似程度斟酌給分，並非以電腦二元邏輯的樣形(Pattern)比對方式進行「非對即錯」的批閱給分。由於上述原因，也造成目前提供填充提及申論題等開放式題型的電腦測驗系統，其評分結果與老師實際的評分結果並不相等，因此測驗及評分效力因而受到質疑。為了能實踐Bugbee(1996)所提出「電腦測驗需能夠達到與傳統紙筆測驗具有同樣的效力」的觀念要求，本研究除了發展具備一般是非題、單選題、複選題的測驗系統外，另外還包括填充題考題。在填充題題型上，本研究並採用模糊函數、相似語詞庫、集合、樣式比對、規則推論等觀念及技術來使測驗系統能模擬與教師相同的專業批閱能力。此外，測驗的目的在於評量學生的學習成效，而教學的目的則在使學生能有效的獲取及吸收知識，因此若能將測驗及教學目的相互結合，將是教育工作者必須努力的方向。過去研究指出測驗的功能不僅是評量學生學習成果，如果能在教學或測驗過程中加入適當的訊息回饋，將有助於學生在電腦環境中學習(Devedzic,2003)。本研究針對模糊機制的各種情境，結合知識結果回饋(KR)、正確回應知識回饋(KCR) 及詳盡式回饋(Elaborated Feedback)等三種不同回饋類型(Dempsey et al.,1993)，適時給予適當的回饋訊息。藉由這種方式，將使得測驗系統不再只是評量答案對錯及計算總分而已，而更進一步能在測驗評量的同時，告知受測者為什麼他的答案是錯的，並提供該題目相關的正確知識給予受測者參考。綜合而言，本研究的具體目的如下： (一) 探討各種不同的測驗題型在線上測驗系統上進行施測時，影響具備傳統紙筆測驗相同效力的因素為何，並探討其解決方法。 (二) 除了線上測驗系統常見的是非、單選、複選等認識型(Recognition-Type) 測驗題型外，進一步發展屬於建構型回應(Constructed-Response)類型的填充題，以增加教師出題的彈性與多元性，並測驗學生在認知領域的背誦及

(5)

思考能力。 (三) 利用模糊函數、相似語意詞庫、集合、樣式比對、規則推論等觀念及技術，設計一個智慧型的線上測驗系統，以使其系統評分能與教師評分有相同的效力。 (四) 發展多位教師可共享相似語詞庫的測驗系統共用平台環境，並藉由模糊理論技術整合系統中的所有教師專家評分認知及共識，提供高品質的相似語意詞庫及評分環境參數建議，降低教師建立語意詞彙及環境參數的負擔，並使系統提供之相似語意詞庫內容能與大多數教師的認知相近。 (五) 提供教師系統內建評分風格及相似語詞庫，但也容許個人化，以解決不同教師對於相似詞彙認知差異的衝突問題。 (六) 透過評分申訴機制，讓學生能協助擴充系統現有之相似語意詞庫，使系統能透過詞彙的擴充與修正，而增加測驗評分效力。 (七) 為使測驗系統能協助受測者在測驗中獲得知識學習的機會，將回饋理論應用於智慧型模糊評分之各種情境，以提供多元的訊息回饋，促進學習者進行知識學習。 三、研究架構與系統建置 (一) 設計具有測驗效力的線上測驗系統 重要概念探討 本研究針對國內知名的線上測驗系統，從功能、測驗內容領域、測驗題型方面進行比較，並做為本研究系統發展之參考。由表1 可知，大多數的線上測驗系統都會提供選擇題的測驗題型，而少部分系統則提供是非題及填充題等題型。值得注意的是，這些支援填充題型的測驗系統，僅能設計一個填充格題目，不能支援一個以上格子的題目，本研究之系統則能支援最多20 個格子的題目。此外，在答案的分析辨識上，現有系統大多採用二元評量的字元樣式比對，只有輸入的答案與標準答案完全相同才判定為「答對」，如果標準答案是「雙十節」，受測者輸入「國慶日」、「雙十國慶」則都算「答錯」。在表1 中只有「國中生活科技線上測驗系統」提供了相似詞的答案分析功能，該系統允許老師預先將可以接受的答案一併輸入在同一個答案欄位中(所有答案間用半形逗號分開)，例如老師在標準答案的欄位中輸入「國慶日,雙十國慶,雙十節」，則當學生輸入「國慶日」、「雙十國慶」或「雙十節」時，則可判定為「答對」。但這些詞彙由於未採用相似語意詞庫來設計，無法被其他題目或試題重複採用，而且無法解決相同語意答案之擴充、相似語意之智慧模糊辨識等問題。本研究之系統則透過相似語意詞庫，將特定知識領域中具有相似語意的詞彙知識，建立到相似語意詞庫中，以支援教師們在同一個測驗系統環境中使用，並能讓不同的試題重複利用。而在回饋部分，大多數的現有系統只針對測驗結果給予成績結果的查詢，並未保留當初測驗之電子試卷及回饋內容，本研究將針對這些問題進行加強。此外，本研究之測驗系統，尚提供其他測驗系統未提供之功能，諸如線上申訴、相似語意詞彙管理、同音異字管理、語意排除管理、教師個人化評分風格設定管理、11 種回饋時機方式、系統自動產生具有高品質及共識的相似語意詞彙內容，以及同音異字、漏字、相似語意、全半形、英文大小寫、集合順序等智慧評分機制。為了瞭解一般線上測驗與紙筆測驗間的評量等化差異來源，本研究參考 K-bar 考試網及陽明國中官老師課程教學網之測驗系統功能，發展一個一般性線上評分雛形系統，此系統包括是非、單選、複選及填充題等題型，而填充題的題目最多可包含20 個填充格。此雛形系統如同一般測驗系統，亦可線上編輯題庫及線上評分，但填充題之評分方式則採用一般測驗系統之二元邏輯評分方式進行(需與標準答案完全相符才評量為「正確」)。雛形系統完成後，本研究針對中部某技術學院資訊管理科系修習電子商務課程之87 位學生，利用平時學習評量時間先進行紙筆測驗，測驗題型包括是非題、單選題、複選題及填充題各5 題，當所有學生皆完成測驗後，教師請每位同學連至線上之雛形測驗系統，開啟完全相同題目之電子測驗卷，並將紙

(6)

筆測驗卷上所寫的答案，抄寫複製到線上電子測驗卷中。經過事後教師對紙筆測驗卷的評分及測驗系統的評分比較，發現學生回答相同的答案在不同的測驗工具上卻出現明顯的分數差異，而且線上測驗系統之分數明顯低於紙筆測驗的分數，顯示出目前的許多測驗系統可能與老師實際的評分效力不同。經過進一步的分析比對，在紙筆測驗及線上測驗兩種測量工具在是非題、單選題、複選題之學生得分並無顯著差異，而填充題部分之得分在紙筆測驗及線上測驗上則有顯著的分數差異，經過每一份試卷的分析比對，本研究發現填充題型在線上測驗無法擁有紙筆測驗同樣的評分效力，其主要形成的原因歸納如下： 1. 電腦環境：由於在中文電腦環境中，文字有全半形及大小寫之分，因此電腦環境造成的評量效力差異便可能形成。例如答案是半形大寫的「B2B」，但學生卻輸入小寫「b2b」、全形的「Ｂ２Ｂ」答案，在線上測驗中則經常被誤評為「答錯」。 2. 可替換之相似詞彙：由於答案可能有其他相似語意字彙可替代，因此不同的學生可能寫出其他與標準答案相似的詞彙答案，例如標準答案為「B2B」，但學生可能寫出「B to B」、「Business to Business」、「企業對企業」等相似詞彙，教師在紙筆測驗中一般會判定為「答對」，而線上測驗卻因為無法辨識語意詞彙，而判定為「答錯」。 3. 填充格的集合順序：例如某一題目為「電子商務中常見三種的經營模式分別是_______、_______、_______。」此題標準答案若為「B2B、B2C、C2C」，但受測者填寫成「B2C、C2C、B2B」，在紙筆測驗中教師知道本題答案屬於同一集合，因此順序可互換，故會給予「答對」的評分，而一般線上測驗因為只能逐一比對，因此發現三格的內容均不相同，故三格填充都會給予「答錯」的評分。 4. 學生中文程度低落：隨著網路通訊環境的發展，人們手寫書信的機會相對減少，因而學生中文程度普遍下降。在紙筆測驗環境中某些學生因為某個字不會寫而有錯別字、同音異字或用注音取代的情形。而在線上測驗環境中，學生可透過輸入法選出原本不會寫的中文字，但若因為疏忽而誤選了同音異字的錯字，則二元邏輯判斷的測驗系統都會判定為「答錯」，而沒有真實教師「斟酌」給分的模糊機制。 5. 隨機性漏字疏忽：某些學生在測驗中因為不經意的疏忽而漏寫部分答案，例如答案是「企業經營模式」，學生卻漏填了「模」字，而寫成「企業經營式」，在紙筆測驗中，教師會考量學生的漏字情形而斟酌給予部分分數，但線上測驗系統則因答案未完全相同，因而評為「答錯」。本研究針對這些可能發生在傳統紙張測驗的填充題問題進行研究，並將老師的閱卷決策機制建立於系統中，以期線上測驗能有相同於紙筆測驗時的效力。因此本研究將發展一個具備題庫編輯、測驗、評分、成績查詢、出題的智慧型線上測驗系統，其題型可包含是非題、單擇題、複選題及支援一個以上空格的填充題測驗題型，不過本研究的重心則著重於填充題的智慧評分處理機制及相似語意詞庫的模糊 推論。 (二) 系統架構 為了模擬真實的網路測驗環境，本研究架設一個三層式主從遠距測驗系統，後端資料庫伺服器採用 Microsoft 公司之 SQL Server 2000，用以執行觸發程序及存放本系統之題庫、成績、語意、申訴記錄等資料。Web 伺服器則使用 Windows 2000 作業系統中的 Internet Information Server 5.0 伺服器軟體，以執行伺服器端的 ASP(Active Server Pages)程式，並藉由 ASP 程式與資料庫進行連結，測驗系統主要使用 ASP 程式語言來發展各項模組功能。本研究所規劃之智慧型線上測驗系統架構如圖1 所示，各元件簡述如下： 1. 題庫編修介面：此介面提供試卷及題庫發展者(教師)能於線上新增、修改、刪除及查詢試卷及題庫內容。 2. 測驗題庫及答案資料庫：用以儲存測

(7)

驗系統的考題編號、語幹、選項、答案、題目配分、題目類型、學生資料、考試時間資料、班級資料等。 3. 出題模組：產生線上測驗試題內容及試題順序，每位受測學生所回答之試題內容都是相同的，但試題題號順序及答案選項順序則由電腦亂數產生。 4. 知識擷取介面：提供增修知識庫內容之介面，以持續擴充系統智慧，進而提升線上評分能力，以使系統具有老師的評分判斷特徵與能力。 5. 使用者介面：提供線上測驗、題目解釋、成績查詢及答案申訴之介面。 6. 評分參數資料庫：存放教師個人化評分參數及系統內建評分參數資料。 7. 模糊推論及系統內建資料運算器：模糊推論運算器內含詞彙語意模糊歸屬函數轉換公式及模糊規則，用以進行模糊推論過程中的計算，並動態調整系統內建之相似詞彙語意關係值及系統評分環境參數值，以提供聚合教師共識的系統內建資料。 8. 相似語意/同音異字資料庫：存放評分機制所需要參考比較的相關資料，諸如語意詞彙資料、詞彙間關係值、同音詞庫、全半形對應資料等。 9. 測驗結果資料庫：存放學生的電子試卷結果資料，包括參與考試的時間、機器位置、考試歷程、填寫之答案、測驗成績、各題回饋資訊等。 10. 申訴處理模組與申訴處理記錄：處理並記錄學生對系統評分及答案質疑的申訴工作。通常教師無法將每個答案的相似語意詞彙全部都事先建立至系統中，因此有可能發生受測者認為自己填答的答案語意是正確的，但系統卻無法辨識的狀況，此模組協助受測者進行申訴。而教師可利用知識擷取介面來處理學生的申訴，若某些相似語意詞彙確實無法被系統正確辨識，教師可立即進行語意詞彙擴充，以促使系統之評分效力可不斷提升。 11. 智慧型線上評分機制：此機制包含各種分析及計算填充題測驗分數之相關模組，其中包括字元比對、語意分析、集合順序分析、英文大小寫分析、文數字全半形分析、同音異字分析、漏字分析、訊息回饋等模組等，本研究將藉由這些模組以提升線上測驗系統的評量效力。 (三) 系統建置 1. 智慧型線上評分機制模組 智慧型線上評分機制為本研究之核心，此機制包含各種分析及計算填充題測驗分數之相關模組。每一個填充格的分數 S(ti)是由填答者答案之正確率歸屬函數 P(ti)與該填充格之配分 SI(ti)決定，即 S(ti)= P(ti)*SI(ti)。以下針對各模組功能設計依照運作順序簡單描述(下文中之變數 ti是指測驗題目編號，AS(ti)表示受測者所填答之答案，AT(ti)表示標準答案)： (1) 字元比對模組：此模組將 AS(ti)與 AT(ti) 進行字元比對，當所有字元均完全吻合，則受測者所填答案的正確率歸屬函數P(ti)=1。 (2) 語意分析模組：此模組最主要在比較 AS(ti)與 AT(ti)詞彙間是否存語意關係，若存在關係則語意關係相似係數 RS(ti)來決定正確率歸屬函數 P(ti)。 (3) 集合順序模組：用以比較 AS(ti)與 AT(ti) 詞彙間是否存在集合順序關係。例如某填充題的題幹為「電子商務最主要的三種經營模式是_____、_____、_____」，假設使用者輸入次序為 B2C、C2C、 B2B，而測驗的標準答案次序為 B2B、 B2C、C2C，則本模組開始呼叫「集合比對副程式 SCM()」以進行集合順序分析，若填答者的答案存在於標準答案集合中，則該填充格之正確率歸屬函數 P(ti)=1。 (4) 英文大小寫模組：此模組最主要在比較 AS(ti)與 AT(ti)詞彙間是否為英文大小寫的關係，若此關係成立，則正確率歸屬函數P(ti)=1。 (5) 文數字全半形模組：此模組最主要在比較 AS(ti)與 AT(ti)詞彙間是否為文數字全半形關係，若此關係成立，則正確率歸屬函數P(ti)=1。 1 , RS(ti)=1 P(ti)= RS(ti) , 0<RS(ti)<1

(8)

(6) 同音異字模組：當 AS(ti)≠AT(ti)，且不存在語意、大小寫及全半形關係，兩個詞彙間只有1 個字不同時，此模組便會啟動。此模組檢查唯一不同的字，是否是受測者使用注音輸入法時，因選字錯誤而造成同音異字情形。若 AS(ti)與 AT(ti)存在此種關係，則正確率歸屬函數P(ti)=1-PW。文中的 PW 是系統預設或是教師自訂的同音異字錯誤扣分比例參數，若PW=0.3，則表示同音異字需扣該題 30%的分數，因此正確率歸屬函數P(ti)=0.7。 (7) 漏字模組：此模組用於 AS(ti)≠AT(ti)，且不存在相似語意、大小寫及全半形關係，而因為受測者填答的答案中少輸入一個字而造成答案輸入遺漏的狀況時。若 AS(ti)與 AT(ti)確實存在此種關係，則需檢查由系統預設或教師依照自己的教學原則及習慣自訂漏字扣分比率參數 PL，以確認在此部分的評分規則。當漏字比例低於 25%時，正確率歸屬函數 P(ti)=1-PL。若系統之 PL 參數設為0.6，表示漏字比例低於某一門檻（如25%）時需扣該題 60%的分數，因此正確率歸屬函數P(ti)=0.4。至於漏字比例的門檻是否為 25%，教師可於參數設定管理畫面中自行修改。 (8) 訊息回饋模組：此模組提供受測者正確答案之回饋，有別於目前線上系統大多僅使用KR 回饋（知識結果回饋）的方式，本系統同時採用 KCR（正確知識回應回饋）及KR 之回饋方式。因此，本系統受測者完成測驗後，系統會根據受測所填寫之答案內容，給予適當且具有知識傳遞的知識回饋。本模組之回饋包括成績結果、答案正確性、語意關係、英文大小寫關係、文數字全半形關係、同音異字關係、漏字關係等。 2. 智慧型評分機制運作流程本系統智慧型評分機制，藉由上述系統架構各模組之解釋，其運作流程可使用圖 2 表示之。四、系統功能展示與說明本系統主要區分為學生功能、教師及管理者功能三部分，系統會依據登入者登入帳號密碼，自動判別使用者身份，而給予不同之系統功能。學生身份可使用之功能包括：公告瀏覽、會員註冊、學生資料維護、電子試卷調閱與成績查詢、查看公告答案、參加線上考試、課程資源、課程論壇討論。教師及管理者身份則除了學生具有的一般功能外，另外還包含學生資料管理、試題管理、智慧評分機制管理、成績申訴管理、新增公告等功能。教師與管理者功能大致相同，唯獨教師在評分參數及相似語意詞庫設定的是個人化的參數內容，管理者則是進行整體系統的參數及環境設定。系統畫面之主功能可參考圖 3，但由於篇幅限制，本文將僅針對智慧評分機制功能進行詳細介紹，其餘功能僅簡單敘述說明，讀者可連至 http://140.126.155.30/olt 網址參考。以下將藉由教師使用情境及學生使用情境來進行功能展示。 (一) 教師與管理者情境 此情境之操作方式及步驟說明如下: 1. 操作介面環境：本系統是以網路為基礎所發展的智慧型線上測驗系統，教師與管理者可在任何時間及地點，透過網際網路及瀏覽器進行測驗系統資料之維護，諸如維護試題、學生、成績、相似語意詞庫、考題申訴等。。 2. 資訊公告：教師若要公告測驗相關事宜，可透過此系統公告區張貼訊息。 3. 課程學習論壇：此功能主要是讓學生與教師進行課程討論，學生對於各種課程及測驗問題，均可在課程討論區內進行互動討論。 4. 課程教材資源區：主要提供教師存放線上課程教材，並提供學生經由帳號密碼登入後，進行相關講義下載及課程學習。 5. 學生資料建立及維護：提供教師針對修課學生進行資料修改及管理。 6. 試卷管理：教師可藉由管理功能之試題製作編輯管理功能進行題庫製作編輯管理、修改試題、考試時間、成績回饋時機、試卷評分方式設定。 (1) 題庫製作編輯管理：本系統提供教師在畫面上新增測驗，並給予這個新測驗一個測驗名稱，隨後在此電子試卷上依照

(9)

畫面功能指示逐題逐題建立題幹、選項、答案、配分、及回饋等資料。當教師逐題新增試題時，每一題的題目編號是由系統自動進行流水號累加，教師不需特別輸入。當教師進入題庫製作編輯管理之畫面後，教師可從畫面中之題型下拉選單中，選擇欲編輯的測驗題型，當教師選擇的題型改變時，畫面會依照各種題型的特性出現不同的選項或文字框物件供教師編撰。當教師輸入題目後，僅需要輸入正確解答及配分即可完成題目的編輯，如有特定回饋訊息亦可一併輸入。而單選題及複選題的輸入方式相當類似，當題目輸入完成後，需再輸入若干備選項目內容，接著再輸入配分及相關回饋。較為特殊的是填充題型的編輯，由於填充題的評分需藉由智慧機制處理，因此在編輯時需要設定較多的內容。在填充題類型中，教師最多可以在題幹內設計20 個空格，而題幹中如果要表示填充題的格子，則需以連續三個底線”_”表示，系統屆時會自動在畫面上轉換成文字框物件供學生填答。當老師輸入完填充題之題目後，則需輸入每個格子的標準答案，並決定這些填充題答案間是否屬於集合概念，其順序是否彼此可對調。由於畫面的寬度與大小限制，因此若是填充格子數超過 4 個，教師可透過超連結建立第 5 至第 20 個填充答案，最後再決定本題答案是否開啟語意評分機制，最後再決定此題是否開啟漏字模糊評分機制。如果本題決定開啟語意模糊機制，則會出現語意確認畫面，教師可以選擇其中任一個答案設定該答案相關之語意，接下來系統會進入語意資料庫中搜尋目前系統已建立與該答案相關的語意內容，教師可決定是否本題之答案要完全接受現有的語意詞彙，或移除本題不接受的詞彙。因此本系統除了能保有及建立整個系統共用的語意詞彙關係網路之外，也能設定單一題目可接受的專用語意詞彙組合。當教師將一個測驗題目建立完成後，如果教師還需要繼續進行下一題的測驗題目建立，則只要在畫面上選擇「建立下一題」之功能即可，若要完成整份測驗卷的設計，只要在畫面上選擇「結束題目建立」。 (2) 修改試題、考試時間、回饋時機及評分方式：在修改試題及考試時間的畫面，教師可以設定試卷開放考試的期間、考試對象、答案與成績回饋公告時機及評分使用之方法。如果是讓學生自我評量的練習測驗，則老師可以設定測驗後立即公告成績及答案，但如果是學習成就的正式測驗，由於每位學生上網測驗時間可能不同，最好能讓每位學生皆考試完畢後在公告成績及答案，以防止先考完之學生將答案及成績洩漏給其他尚未考試的同學。;4 在畫面中上方的下拉選單提供了11 種成績及答案公告回饋的時間供選擇，回饋的時機根據理論從立即回饋、延遲回饋及不給予回饋等概念，依照時間區分為11 種。評分方法選擇部分，則可由教師決定此份試卷要使用系統預設或教師個人化設定之評分參數，以及決定語意模糊評分時，要使用系統內建或教師個人化所建立的相似語意詞庫。除此之外，畫面中亦可維護已建立題庫之題目、答案、配分及回饋訊息，若是填充題型還可進行智慧評分機制的設定，填充題若超過第4 格之答案維護，則可至此畫面每一題之最右邊進行維護。 7. 成績查詢及管理：當學生完成教師所指定的測驗後，教師可從學生成績管理功能中查看學生回答的答案及系統自動評分後的成績，若教師需要變更任何學生的成績資料，亦可透過此功能進行。 8. 智慧評分機制管理：此部分可針對語意詞彙、同音異字及智慧評分機制參數進行管理。當教師初次管理智慧評分機制參數時，畫面中會顯示目前系統預設之參數值供教師參考，當教師點選「建立個人化評分風格參數」按鈕後，則進入評分環境參數設定畫面。在畫面中系統會先將預設參數提供給教師參考，教師也可直接選擇個人化的漏字比例門檻、同音異字的扣分比例、漏字扣分比例；若是教師建立或修改個人評分參數，則系統會依據所有教師的平均設定值，重新計算系統預設參數值，以確保系統能

(10)

提供合理且不至過份嚴苛或寬鬆的預設評分參數。在語意詞彙管理畫面中，教師可藉進行相似語意詞彙的新增與查詢。當教師進行相似語意詞彙新增與查詢後，系統會將教師尚未建立的相似詞彙資料顯示在畫面下方，教師若同意使用，可以直接進行整批匯入，此外，畫面上方則可針對教師設定的個人化詞彙語意相似值進行刪除及修改。一旦教師在畫面中建立新的個人化詞彙語意相似資料，或在畫面中匯入、修改或刪除個人化詞彙語意相似資料，系統都將啟動模糊推論機制，重新計算相關詞彙在系統中的內建詞彙語意相似值，因此本系統能隨時提供結合系統內教師共識的系統預設語意相關值。同音異字管理則可進行同音異字之中文字管理，本系統目前已收納教育部所公告之全部常用中文字於此資料庫中。 9. 學生成績申訴管理：當學生在查閱成績時，若對系統評分結果有所質疑，學生可直接在該題回饋的右邊直接提出線上申訴，然後在申訴畫面中選擇欲申訴之題目及撰寫申訴原因，此時系統會將此申訴記錄儲存於資料庫中，並透過本系統之自動發信元件發出 Email，以通知教師處理。當教師進入系統後，如果有申訴案件未處理完成，系統會在畫面左上方以紅色文字提醒教師。當教師透過申訴管理功能進行處理時，若是因為系統專業語意詞彙不足，導致系統評分不正確，教師可將新的詞彙擴充到系統中，未來再遇到學生輸入相同的答案，系統便能正確辨識及評分。此外，教師亦可針對每個申訴案件進行處理狀態設定，其狀態選項包括尚未處理、處理中、處理完成、其他等四個狀態。當教師處理完成後，申訴回覆內容將被儲存至資料庫中，系統也將自動寄發 Email 告知申訴人有關申訴的回覆內容及結果。 (二) 學生情境 此情境之操作方式及步驟說明如下： 1. 學生資料註冊及登入：學生初次使用系統時，需進行個人資料的登錄與註冊，當學生註冊資料獲得管理者認證後，便可參與線上測驗。 2. 參與線上測驗：學生可在畫面上查看其所屬班級目前是否有相關的課程測驗及每一項考試科目的測驗日期及時間。若有同學所屬班級必須參加的課程測驗，同學在登入學生學號、姓名及密碼，選擇欲參加考試的測驗名稱後，隨即開始進行線上測驗。此時，畫面會顯示此試題的所有題目，學生可以自由選擇答題次序；此外，每份電子試卷皆會記錄學生資料、考試時間及答題內容，當學生答完題目後，畫面最下方會有繳卷鈕，當學生按下後系統會請學生再次卻認識否真的要繳卷，以避免學生為完成答題便不小心送出試卷。當系統接收到學生繳卷的答案後，將立即進行線上評分，並立即在畫面上公告該學生之成績及答錯的題目。 3. 課程學習論壇：學生可於論壇繳交作業，並能與同儕及教師在論壇中進行雙向互動的非同步課程討論。 4. 課程教材資源區：學生經由帳號密碼登入後，可針對修課課程進行相關講義下載及課程學習。 5. 電子試卷調閱與成績查詢：學生可於考試後隨時調閱曾經參加過的測驗試卷，並可查閱每一個題目的標準答案、自己填寫的答案、成績結果及系統回饋等資訊。但若該測驗尚未達到老師設定的成績公告時間，則無法查看標準答案及成績，但仍可看到自己曾經回答的題目及答案內容。在調閱成績、答案及回饋之的畫面中，電子試卷不僅只給予對與錯的的回饋，還會針對模糊機制處理情形，給予適當的說明回饋，其中包括為何會被酌扣分數之原因、是否答案符合同音異字、漏字、全半形、語意相似等情形及此題相關的知識等。 6. 測驗申訴：當學生對系統評分結果有所質疑時，可在系統中直接進行申訴。學生只需要點選欲申訴之題目及描述該題申訴的原因。例如，當學生認為「B to B」與「企業對企業」是相同可接受的答案，但系統卻無法辨識，則學生可透過申訴功能進行申訴。當教師收到申訴訊息並處理完成後，系統會自動通知該學生更

(11)

正後的成績及申訴處理情形，學生也可以自己查詢申訴處理的結果。五、結論與建議本研究結合了模糊理論、相似語詞庫、集合、人工智慧概念、測驗效力概念及回饋理論，提出一個具有智慧型評分機制的線上測驗系統架構，並實作一個線上測驗系統。綜合而言，本研究之貢獻及未來發展方向說明如下： (一) 研究貢獻 為使線上測驗系統能有效應用在一般考試及各類國家考試中，本研究將藉由網際網路特性及電腦運算能力，使線上測驗系統能發揮最大效用，並能對國家考試發展及全球的線上測驗技術有所貢獻，本研究之貢獻歸納如下： 1. 藉由發展智慧型線上測驗系統，能有效的對非選擇題之題目進行評分處理，並藉由智慧評分機制的運作及知識擴充，使得線上測驗系統能夠具備與該領域教師相同的專業評分能力，進而協助政府及教育單位逐步採用線上測驗技術應用於各種國家考試、入學考試的領域。 2. 結合模糊邏輯、資料庫、人工智慧等技術，提供高品質的系統內建相似語意詞庫相似值及評分參數，以發展出具備專家教師相同批閱效力的線上測驗系統。過去使用模糊機制之測驗評量研究，主要在探究原始成績、題目難度、學習程度轉換為不同等級歸屬函數，並藉以發展相關之智慧系統。然而，本研究觀察到過去一般測驗系統在進行填充題題型評分時，僅能評定出「答對」或「答錯」的二元歸屬結果，而本研究則藉由模糊觀念將評分結果擴充至更彈性的範圍，評分之結果可能因為語意相似程度、同音異字、漏字等因素，而產生介於0 至 1 間的答案正確程度歸屬函數值。因此藉由模糊觀念的設計，本系統的確能如同教師人工評分時，視學生答題內容的正確程度或相似程度，「斟酌」給予分數。 3. 教師可設定多種測驗回饋時機，並能同時發展學生自我練習及學習評量等不同測驗目的之測驗試卷。 4. 本研究透過模糊理論技術，使系統能隨時依據系統內所有教師設定的個人化評分參數及相似語意詞庫相似值，自動啟動模糊推論運算，重新計算出符合多數教師共識的系統預設評分參數及內建語意詞庫相似值，並能提供教師直接匯入至個人化評分環境參數資料庫及相似語意詞庫，減少教師輸入資料的負擔。因此本研究不僅能藉由教師個人化的設計機制來保留教師個人評分風格及特性，使電腦評分結果能與教師評分結果一致。另一方面，系統也會根據系統內所有老師們所建立的個人化評分參數及個人化詞彙語意關係詞庫，結合模糊理論來自動產生多人共用環境的系統預設評分參數及詞彙語意關係詞庫。因此大多數的系統參數或詞彙關係資料，教師可以選擇使用系統預設的共用資料參數，也能設定個人化的資料參數。 5. 提供不同教師在共同的測驗平台環境中共享資源，又能擁有個人化的評分風格與相似語意詞庫。因此，既使不同教師在個人評分風格或個人化的相似語意詞庫上有不同的認知衝突，但是每個教師所設定的個人化資料並不會互相干擾，每個教師只能選擇選用自己設定的個人化資料或是系統內建資料兩種，因此並無法得知其他教師的個人化設定資料，所以也不會產生施測上的實際衝突。 (二) 研究限制與建議 由於能力、時間及開發環境上的因素，使得本研究之系統發展仍有一些限制，相關限制及改進建議之說明茲列如下： 1. 由於本系統主要在探究填充題型造成的測驗效力問題，因此並未將支援多媒體影音圖片的測驗題目建置於系統之內，此外，對於不同檔案格式的試題間批次匯入與轉換功能，本研究因考量研究目的，並未納入本研究中，未來系統可針對這些部分進行功能之擴充與研究。 2. 本研究因著重於電子化學習環境的學習過程測驗，並藉由測驗回饋來輔助學習，與近年試題反應理論及電腦適性測驗著重單一時間點的能力鑑定不同，未

(12)

來可再納入電腦適性測驗方法至測驗系統中進行研究。 3. 教師雖然可能專精於某個課程領域，但由於語意詞彙變化多元，管理者及教師無法在系統運作初期便建立完成專業領域中的所有相似語意詞彙。未來，除了透過本研究之申訴機制外，也可以採用機器學習技術來擴充相似語意詞庫之內容。 4. 本研究主要以認知領域為教學目標的智慧型線上測驗系統進行設計，因此僅探討在認知領域中的測驗題型，對於情意領域、技能領域的測驗則未進行探討，未來研究可朝此方向進行探討。 5. 由於目前國內輸入法廠牌眾多，本系統針對輸入法進行的模糊評分機制僅使用「注音輸入法」進行探究，其他輸入法造成的評分效力差異並未加以處理。未來系統可擴充加入不同輸入法，並將各種輸入法之編碼資料建置於系統中，將可持續提升線上測驗系統的評分效力。 6. 本研究目前採用模糊理論技術，產生系統內建之相似語意詞庫相似值，推論過程結合系統內所有教師所設定的個人化相似語意詞庫相似值，因此能聚合出高共識且高品質的系統內建相似語意詞庫相似值。而評分環境參數由於較不易產生語意上及認知上的模糊，因此本研究系統內建的評分環境參數，僅透過系統內所有教師的個人化評分參數進行加總平均而產生，未來在系統內建評分環境參數值時，可嘗試採用模糊理論技術來產生。 7. 本研究目前僅驗證智慧型評分機制的評分效力，尚未針對測驗系統對於學習成效的影響進行實證研究，未來可將此項工作列入後續研究項目中。 六、計畫成果自評 （一）與以前研究比較之自評本系統經過建置完成後，本研究將此系統之諸多功能特性與先前測驗系統進行比較，以期能凸顯本研究之成果。其比較分析內容如下： 1. 支援建構型題型之多格填充測驗：目前的測驗系統大多數都僅支援選擇反應型的測驗類型題目，諸如是非題、選擇題及複選題。縱使有少數系統提供填充題測驗，但也僅能提供1 個格子的測驗，且不具有智慧型的語意分析機制，本系統每一題填充題最多可建立20 個填充格。 2. 語意分析功能：本系統提供之填充題測驗，具有語意評分之功能。每個填充題的測驗題目，可共用系統已建立的語意詞彙或使用個人化的相似語意詞庫，此外，教師亦可針對特定試卷中特定題目，自訂該題專用的語意字彙；如果該題答案較為嚴謹，不接受任何相關語意的答案，亦可透過功能關閉該題的語意評分功能。因此本系統的語意評分機制，提供整體系統共用相似語意詞庫、教師個人化詞庫及單一題目專用詞彙組合等三種不同的語意分析層次。 3. 集合順序功能：由於現有測驗系統並未特別針對多格填充答案間的集合順序評分功能進行設計，本系統提供此功能，使得測驗者可如同紙筆測驗般，針對集合順序可互換的填充題目進行填答，而不需擔心順序填錯系統評分錯誤的問題。 4. 成績申訴管道及申訴處理即時通知：當學生對系統評分結果提出質疑或認為評分不合理時，本系統提供學生線上立即申訴的功能，當系統收到申訴案件時會立即透過本系統之電子郵件自動發送元件立即將申訴案件透過 Email 告知出題教師處理，當教師完成申訴處理案件後，系統也會立即將申訴結果透過 Email 告知申訴人。此外，申訴人在申訴期間也可於線上查看申訴案件的處理狀態與進度。 5. 藉由申訴功能達成語意詞彙擴充：由於系統很難將世界上所有詞彙的相似語意全部建立至語意庫中，因此學生若在申訴案件中認為系統評分時無法辨識的語意而造成評分錯誤，教師則可藉由此功能來改善評分效力，並不斷擴充語意詞彙內容。 6. 電子試卷的保存：現有諸多測驗系統通常僅將學生的測驗成績結果記錄下

(13)

來，並未將學生測驗的答題內容及測驗歷程資訊保存下來，若遭遇到學生對測驗結果的爭議，將產生查無當時試卷答題內容的窘況，本系統透過電子試卷的保存功能，允許教師及學生調閱歷史測驗試卷資料。 7. 消弭透過電腦媒介輸入時的誤差：由於某些測驗者在測驗過程中，不小心按到全形功能或按到字母大寫功能，造成評分錯誤，本系統則透過評分機制的改進，消弭類似的評分誤差。 8. 中文輸入環境的誤差改善：大部分的測驗在測驗學生的知識認知，但卻可能因學生中文能力逐漸降低，而學生卻透過輸入法選出原本不會寫的中文字或因為中文程度而誤選了同音異字的錯字，本系統可由老師自己設定「斟酌」給分的模糊機制，使學生在使用「注音輸入法」選到同音異字的錯字，且不影響整個答案表現時，不致於被評分為全錯。 9. 可接受之漏字評分功能：如同生活中人們也會不經意的漏寫字一般，如果漏寫的字本身不影響答案表現，則通常老師亦會斟酌給分，因此本系統亦將教師的此項特性加入於本系統中。 10. 成績公告時機：由於測驗有不同的實施動機，有些測驗系統只提供學生自我評量，學生測驗後便可獲得成績及答案回饋。但有些系統則是採用延遲回饋，測驗者必需於開放測驗時間截止後，才可查詢成績。本系統提供11 種測驗成績及答案回饋的時機供教師設定，回饋的時機根據理論從立即回饋、延遲回饋至不給予回饋。此機制也可避免先考完的學生知道分數及題庫的答案後，洩漏給其他同學，而產生測驗公平性的問題。 11. 教師個人評分特質參數設定：為使測驗系統能具有與出題教師相同的評分特質，因此本系統提供評分機制參數供教師設定，教師可依照自己平時對於漏字、同音異字及每個語意詞彙間的關係認知，自行設定相關參數，以期測驗系統能與教師的評分方式一致，以增加線上測驗的測驗評量效力。 12. 重視線上測驗的測驗效力：國內外大多數線上測驗系統被視為是一種網路上的測量工具，但並未考慮提供的線上測驗系統其測驗效力是否與紙筆測驗等化。本研究則從測驗的基本目的出發，並採用測驗效力觀點發展線上測驗系統，使測驗系統能回歸到測驗效力的本質。 13. 結合系統內所有教師共識，提供高品質的系統評分參數及相似語意詞庫：目前的測驗系統大多數未提供教師設定教師個人化的評分風格參數，而且也未使用模糊理論技術來分析與結合系統內所有教師的共識，產生高品質的系統內建評分參數及相似語意詞庫相似值，隨著系統內教師使用人數的增加，系統的評分參數值及相似語意詞庫相似值將更趨於穩定與合理。（二）研究發表本研究成果已改寫成三篇論文，分別已被資訊管理學報、International Journal of Innovation and Learning 接受，並即將刊出。另師大學報（科學教育類）則是修改後接受

七、參考文獻（因篇幅限制，僅列出部分文獻）

【1】 Alderson, J.C., “Technology in Testing: The Present and Future,” Elsevier Science Document

System (28), 2000, pp: 593-603.

【2】 Bennett, M.G., Hessinger, J. Kahn, H., Ligget, J. Marshall, G., and Zack, J., “Using Multimedia in Large-Scale Computer-Based Testing Programs,” Computers in Human

Behavior (15), 1999, pp: 283-294.

【3】 Bugbee, A.C., “The Equivalence of Paper-and-Pencil and Computer-Based Testing,” Journal of Research on Computing in

Education (28:3), 1996, pp:282-299.

【4】 Dempsey, J.V., Driscoll, M.P., and Swindell, L.K., Text-Based Feedback. Interactive

Instruction and Feedback, New Jersey:

Educational Technology Publications Englewwood Cliffs, 1993.

【5】 Devedzic, V.B., “Key Issues in Next-Generation Web-Based Education,” IEEE Transactions On

Systemsm, Man, And Cybernetics-PART C: Applications And Reviews (33:3), 2003, pp:

339-349.

【6】 Han, T., Kolen, M., and Poglmann, J., “A Comparison Among IRT True-and Observed-Score Equatings and Traditional Equipercentile Equating,” Applied

(14)

105-121.

【7】 Hwang, G-J, “A Conceptual Map Model for Developing Intelligent Tutoring Systems,”

Computers & Education (40), 2003, pp:

217-235.

【8】 Jang, J. S. R., Sun, C, T., & Mizutani, E., Neuro-Fuzzy and

Soft Computing – A Computational Approach to Learning and Machine Intelligence, Upper Saddle River, New

Jersey: Prentice-Hall, 1997.

【9】 Mark, D.R., “The Next Generation of Computerized Tests: Implications for Testing of Advances in Multimedia, Intelligent Tutoring Systems, and Language Processing,”

AEDS Journal (19:2), 1997, pp: 81-108.

【10】 Moundridou, M. and Virvou, M., “Analysis and Design of a Web-Based Authoring Tool Generating Intelligent Tutoring Systems,”

Computer & Education, 40, 2003, pp:

157-181.

【11】 Sun, K. T., “An Effective Item Selection Method by Using AI Approaches,” The

Meeting of the Advanced in Intelligent Computing and Multimedia System,

Baden-Baden, Germany, 1999.

【12】 Tsai, T. H., Hanson, B.A., Kolen, M.J., and Forsyth, R.A., “A Comparison of Bootstrap Standard Errors of IRT Equating MeTHODS FOR THE Common-Item Nonequivalent Groups Design,” Applied Measurement in

Education (14:1), 2001, pp: 17-30.

【13】 Van der Linden, W. J., and Glas, C.A.W.,

Computerized Adaptive Testing: Theory and Practice, Dordrecht; Boston: Kluwer

Academic, 2000.

【14】 Van Gorp, M.J., and Boysen, P., ”ClassNet: Managing the virtual classroom,”

International Journal of Educational Telecommunications (3:2), 1997, pp:

279-292.

【15】 Wainer, H. and Dorans, N.J., Computerized

Adaptive Testing: A Primer, Mahwah, N.

J.:Lawrence Erlbaum Association, 2nd_ed.,

2000. 【16】何榮桂，民 79，『電腦教學系統中的測驗設計』，中等教育，第41 卷．第 2 期：29~34 頁。【17】何榮桂，民 88，『量身訂製的測驗－適性測驗』，測驗與輔導，第157 期：3288~3293 頁。【18】何榮桂，民 89，『遠距測驗及相關問題之探討』，2000 網路學習理論與實務研討會論文集，國立交通大學主辦。【19】考試院，民 92 年 9 月 3 日，『考試院新聞稿－國家考試將規劃實施電腦化測驗』， http://w3.moex.gov.tw/examnews/exnews_2 .asp?pgn=1。【20】林明達，民 87，全球資訊網線上測驗系統之設計與製作，國立交通大學資訊科學研究所未出版碩士論文。【21】周文正，民 87，『WWW 上電腦輔助測驗系統之研製』，中華民國第七屆電腦輔助教學研討會。【22】周倩、簡榮宏，民 86，『網路評量系統之發展與研究』，遠距教育，第4 期：12~15 頁。【23】簡茂發，民 88，『多元化評量之理念與方法-教學評量命題專業之能研習會』，飛揚專刊，第2 期。【24】黃國禛，曾秋蓉，朱蕙君，蕭經武，民91，『智慧型線上測驗系統題型之分析與改進』，科學教育學刊，第10卷．第4期：423~439頁。【25】游寶達，民87，『ICL心智模式取向之智慧型電腦輔助診斷學習系統之研究』，民國87 年度國科會『電腦輔助學習』專題研究計畫。

(15)

表1 國內知名線上測驗系統功能比較表網站名稱功能測驗內容領域測驗類型其他說明 e-School 電子校園 http://eschool.com.tw 線上測驗、考題製作、線上評分、答案詳解、成績排名、時間計時兒童部、國中部、高中部、大學、社會大學等各級教育多元內容。單選題、複選題、填充題 1.填充題無語意辨識能力 2.填充題僅可設計一個空格的題目長春藤線上測驗中心 http://www.ivytest.com.t w 線上測驗、線上考卷製作、線上評分大學、四技二專、高中、五專、托福、高普考、證券業務、駕照考試等試題測驗單選題、複選題 K-bar 考試網 http://www.k-bar.com.tw 線上測驗、線上考卷製作、線上評分、時間計時升學模擬測驗(大學及高中)、語文能力測驗(中文、日文、托福、GEPT 全民英檢)、高普考、證照等單選題、複選題、填充題 1.填充題無語意辨識能力 2.填充題僅可設計一個空格的題目狀元考試資訊網站 http://elec.taivs.tp.edu.tw/ kitty 線上測驗、線上考卷製作、線上評分、記錄及評估題目答題難易度、隨機出題四技二專、二技、技能檢定、預官、高普考測驗選擇題線上測驗服務中心 http://www.onlinetest.org 線上測驗、線上評分、成績查詢、時間計時、題目支援圖形內容學科能力測驗(國文、英文、數學、社會、自然、歷史) 單選題、複選題國中生活科技線上測驗系統 http://home.kghs.kh.edu.t w/olt 線上測驗、線上考卷製作、線上評分、成績查詢、時間計時、題目支援圖形內容、試題轉換國中生活科技領域單選題、是非題、填充題 1.填充題僅可設計一個空格的題目 2.填充題提供相似詞答案處理( 需教師自行建立，系統未支援語意詞庫) 本研究之測驗系統 http://140.126.155.30/OLT 線上測驗、線上考卷製作、線上模糊評分、電子試卷作答內容保存、成績查詢、線上申訴、相似語意詞彙管理、同音異字管理、語意排除管理、教師個人化評分風格設定管理、11 種回饋時機方式、答案回饋…等學科能力測驗( 電子商務概論、管理資訊系統、商用程式語言、資料庫管理系統) 單選題、複選題、是非題、填充題 . 填充題可設計 20 個空格的題目 . 系統提供相似語意詞庫辨識填充題答案語意 . 填充題提供同音異字、漏字、相似語意、全半形、英文大小寫、集合順序等智慧評分分析使用者介面 ( 測驗、評分解答、答案申訴 ) 知識擷取介面線上測驗受測者 ( 學生 ) 試卷及題庫發展者 ( 教師與管理者 ) 題庫編修介面測驗題庫及答_案資料庫出題模組相似語意/同音異字資料庫申訴處理記錄申訴處理模組測驗結果資料庫智慧型評分機制 z 字元比對模組 z 語意分析模組 z 集合順序模組 z 英文大小寫模組 z 全半形模組 z 同音異字模組 z 漏字模組 z 訊息回饋模組評分參數資料庫模糊推論及系統內建資料運算器圖1 具知識庫概念之線上測驗系統架構圖

(16)

圖3 主功能選單及試題編輯管理-是非題畫面圖2 智慧型評分機制運作流程圖智慧評分ISM(ti) 字元比對完全相同? Yes No 字元相符 P(ti) =1 無關語意相關？ 100%相關部分相關語意相符 P(ti) =1 語意相關 P(ti)= RS(ti) Yes No 大小寫相關 P(ti) =1 屬於大小寫關係？ No Yes 屬於文數字全半型關係? 全半型相關 P(ti) =1 No Yes 詞彙間字元差異數? 標準答案與受測者答案之詞彙不等同 P(ti) = 0 屬於同音異字關係? 差 1 個字多於1 個 Yes No 同音異字相關 P(ti) = 1-PW 漏字比例比例≦0.25 比例>0.25 屬於集合題型? 讀取學生答案 AS(ti)及標準答案 AT(ti) 集合比對副程式 SCM() 漏字相關 P(ti) = 1-PL ★提供 4 種題型選單,當選擇之題型改變,下方內容會依題型特性動態改變 ★ 提供教師設定該題專屬之 KCR 回饋訊息

電子化學習環境下智慧型線上測驗系統架構之研究

行政院國家科學委員會專題研究計畫 成果報告

電子化學習環境下智慧型線上測驗系統架構之研究

中 華 民 國 94 年 9 月 26 日

行政院國家科學委員會補助專題研究計畫成果進度報告

※※※※※※※※※※※※※※※※※※※※※※※※

※ ※

※

電子化學習環境下智慧型線上測驗系統架構之研究

※

※ ※

※ ※

※※※※※※※※※※※※※※※※※※※※※※※※

計畫類別：個別型計畫

計畫編號：NSC 93-2416-H-004-013

執行期間：

93 年 8 月 1 日至 94 年 7 月 31 日

計畫主持人：楊亨利 教授

計畫參與人員：應鳴雄

成果報告類型：精簡報告

處理方式：二年後可公開查詢

執行單位：國立政治大學 資訊管理學系

中 華 民 國

94 年 8 月 1 日

行政院國家科學委員會專題研究計畫計畫成果報告

電子化學習環境下智慧型線上測驗系統架構之研究

計畫編號：NSC 93-2416-H-004-013

執行期限：93 年 8 月 1 日至 94 年 7 月 31 日

主持人：楊亨利 教授 國立政治大學 資訊管理學系

計畫參與人員：應鳴雄

行政院國家科學委員會專題研究計畫成果報告

中華民國 94 年 9 月 26 日

計畫主持人：楊亨利教授

執行單位：國立政治大學資訊管理學系

中華民國

主持人：楊亨利教授國立政治大學資訊管理學系