以本體論及語意分析發展具備自動產生教材及測驗題目之線上華文知識學習系統(II)

(1)

行政院國家科學委員會專題研究計畫成果報告

以本體論及語意分析發展具備自動產生教材及測驗題目之

線上華文知識學習系統(2/2)

研究成果報告(完整版)

計畫類別：個別型計畫編號： NSC 95-2416-H-004-005- 執行期間： 95 年 08 月 01 日至 96 年 07 月 31 日執行單位：國立政治大學資訊管理學系計畫主持人：楊亨利計畫參與人員：博士班研究生-兼任助理：應鳴雄、劉季綸、王貞淑、楊筱芳、鄭秀華、吳俊德、李震華、賴正育、蕭淑玲報告附件：出席國際會議研究心得報告及發表論文處理方式：本計畫涉及專利或其他智慧財產權，2 年後可公開查詢

中華民國 96 年 09 月 22 日

(2)

行政院國家科學委員會補助專題研究計畫成果進度報告

※※※※※※※※※※※※※※※※※※※※※※※※※

※ ※

※ 以本體論及語意分析發展具備自動產生教材及 ※

※ 測驗題目之線上華文知識學習系統

( 2 / 2 ) ※

※ ※

※※※※※※※※※※※※※※※※※※※※※※※※

計畫類別：個別型計畫

計畫編號：NSC 95-2416-H-004-005

執行期間：

95 年 8 月 1 日至 96 年 7 月 31 日

計畫主持人：楊亨利教授

計畫參與人員：應鳴雄

成果報告類型：精簡報告

處理方式：二年後可公開查詢

執行單位：國立政治大學資訊管理學系

中華民國

96 年 8 月 1 日

(3)

行政院國家科學委員會專題研究計畫計畫成果報告

以本體論及語意分析發展具備自動產生教材及測驗題目之線上華

文知識學習系統(2/2)

計畫編號：NSC 95-2416-H-004-005

執行期限：95 年 8 月 1 日至 96 年 7 月 31 日

主持人：楊亨利教授國立政治大學資訊管理學系

計畫參與人員：應鳴雄

一、中文摘要線上學習及線上測驗已成為資訊教育的重要議題，線上測驗不只是在測驗後給予受測者一個分數而已，而應該讓學習者了解自己在知識向度及認知向度的學習結果資訊，以使測驗活動能給予學習者更大的幫助。本研究以本體論、詞彙網路、 Bloom 分類理論、中文語意庫為基礎，提出一個能輔助教師自動產製試題的線上測驗系統架構，並藉以減輕教師編製測驗題庫的負擔，且能涵蓋新版Bloom 認知領域教育目標分類中的知識向度及認知向度概念。本研究的成果能減少教師人工出題的負擔，電腦輔助出題的平均試題品質也優於教師人工出題的試題品質，顯示透過本體論及語意分析技術，能在知識學習系統的教材及試題發展上有所助益。 關鍵詞：線上測驗、Bloom 教育目標分類、 本體論、詞彙網路、試題分析 Abstract

Since the rapid E-learning development, the online learning and testing have been important topics of information education. Currently teachers still need to spend much time on creating and maintaining test item banks. Some researches have applied the new Bloom's taxonomy to design meaningful learning assessments. This research has applied ontology, Chinese semantic database, artificial intelligence, Bloom's taxonomy, to propose an on-line testing system framework to assist teachers in creating test items. The results of study are as follows. (1) The computer would assist teachers to produce a large number of test items quickly. (2) After analyzing the question types, knowledge types,

dimensions of cognitive skills, average difficulty index, and average discrimination index of these test items, we concluded that the quality of items that produced by computer is better than those produced by teachers. (3) The experiment indicated that all teachers were willing to use these items.

Key Words: Online Test, Semantic Web, Ontology, Bloom’s Taxonomy, Item Analysis. 二、計畫緣由與目的 由於電子化學習環境技術的快速發展，線上學習與測驗已成為資訊教育的重要議題。而電腦輔助測驗(Computer-Based Testing, CBT)具有提高測驗效率、減少測驗時間、降低測量誤差等優勢，因此近年已被廣泛應用(何榮桂,民 79;周文正, 民 87)。測驗及評量並非只是用來產生一個試圖代表學習者學習成效的分數而已，而應重視試題與教育目標的配合，並讓測驗成為輔助學習的一部份。近年來Bloom 等人 (1956)的教育目標分類廣被國內外教育界採用，新版的Bloom 認知領域教育目標則已分成知識向度和認知歷程向度兩類。知識向度是專指知識的分類，並將知識分成事實(Factual) 、概念 (Conceptual) 、程序 (Procedural)及後設認知(Metacognitive)；而認知歷程向度則區分為記憶、瞭解、應用、分析、評鑑與創造(葉連祺與林淑萍，民 92)。然而在強調「自我學習」的線上學習環境中，學習者在知識向度及認知向度的學習成效，可藉由線上測驗來評量，若要達此目的，線上測驗系統中的試題便需包含每個試題所能評量的知識層次及認知層次資訊。

(4)

過去研究指出，建立與維護測驗題庫是一項耗費人力的工作，當測驗系統題庫不足時，也容易造成題目出現頻率過高及學生直接記憶答案的情形(蔡松齡，民 81; 林盈達、林義能，民 88)。因此，如何提供豐富完整的題庫及有效率的出題方式，已成為遠距教學中的重要課題(何榮桂等人，民 85)。有研究指出，若是採用多位學者共同合作產製試題的策略來提升題庫產製效率，將容易產生題目重複或偏重某概念的情形(黃國禎等人，民 91)。黃居仁(民 92)認為知識本體論能使電腦處理更多的內容細節和結構。因此，本研究使用知識本體概念來協助線上學習系統中的教材內容，可依據知識內文的特定結構或語意進行儲存，再進一步透過知識本體結構來達到系統可自動產生測驗題庫的目的。本研究假設線上教材知識若能先依照本體結構及知識語意關係存放，且電腦能夠辨識出教材內容中知識主題間的語意關係，則將能使電腦具備自動產製測驗題庫的能力。為了讓線上測驗系統能依據線上教材知識，輔助教師自動產製龐大多元且具有 Bloom 分類概念的測驗題庫。本研究整合楊亨利與應鳴雄(民 95 年)的研究，進一步以本體論、語意分析及Bloom 分類理論為基礎，期望能在具備是非題、單選題、複選題及填充題等題型的線上測驗系統中，發展輔助自動產製測驗題庫的功能。一個系統就算宣稱能夠輔助教師自動產製試題，然而這些試題的品質及可用性也仍需透過實際施測的過程來確認系統的效益。Ebel 與 Frisbie(1991)就認為試題可以透過難度、鑑別度與誘答力的統計特徵來檢視每個試題的品質與可用性。而本研究將針對透過電腦輔助而自動產製試題，經由學生實際施測來進行試題的難度及鑑別度檢驗，再從教師的認知角度來評量試題的可用性及品質。本研究計畫共分兩年，目前呈現的成果為第二年計畫，第一年的研究內容是以電腦輔助產製試題方法為主，第二年計畫則針對教材內容自動剖析及儲存、試卷編製及選題策略、電腦產製的試題品質實證進行研究。本計畫第二年之具體研究目的如下： (一) 針對教材內容的剖析辨識及儲存方法進行探討及系統實作。 (二) 從題型及 Bloom 教育目標分類，探討電腦輔助產製試題的品質及可用性。 (三) 從教師的認知角度，探討電腦輔助產製試題的試題可用性及效益。 (四) 以 Bloom 教育目標分類概念為基礎，提供能符合教師所設定之教育目標分類概念的試題，以使試卷題目所評量的知識能力目標能配合教師的教學目標。 三、研究架構與系統建置 (一) 線上華文知識學習系統建議架構 為了使電子化學習系統能透過現有線上教材內容，輔助教師自動產製測驗題庫，並使此機制能在線上知識學習系統環境中正常運作，本研究在第一年的計劃中提出了一個適合此機制運作的線上知識學習系統建議架構，如圖1 所示。由於第二年的計劃主要在延續第一年計劃，並將來自教師及其它來源文章的內容進行教材內容的剖析辨識及儲存的功能完成，以期望能與第一年計畫中的電腦輔助題庫產製子系統進行自動化的銜接。因此以下僅針對「文章與斷詞處理子系統」及「輔助線上教材自動產製與動態展現子系統」進行詳細的模組元件及運作方式說明。 (二) 文章與斷詞處理子系統之系統架構 文章與斷詞處理子系統之系統架構，如圖 2 所示，各元件之內容說明如下： 1. 原始文章管理模組：此模組中主要包括檔案匯入、線上知識直接編輯及原始文章知識內容管理三項功能，此模組的功能在於將各種原始文章及知識內容進行初步的儲存與管理。 (1) 檔案匯入功能：將教師在知識領域中所收集的知識文章匯入至原始知識文章資料庫中，再執行知識領域的定義及內容格式統一的工作。 (2) 線上知識直接編輯：教師可將知識內容由鍵盤輸入，或直接從其他視窗中將所需處理之知識內文直接貼入至線上知識編輯畫面中，並進行儲存。 (3) 原始知識文章管理：提供教師針對原

(5)

始知識文章資料庫的內容，進行修改、查詢及刪除等管理功能。 2. 原始知識文章資料庫：集中儲存原始知識文章內容，以便提供後續文句斷詞及知識萃取的處理。 3. CKIP 斷詞分析：本研究在斷詞分析部分，採用中央研究院資訊科學研究所詞庫小組的CKIP 中文自動斷詞系統，以進行原始知識文章資料庫中所有內容的斷詞工作，斷詞後的結果及語詞文法結構符號則存入通用斷詞準知識庫中。 4. 通用斷詞準知識庫：存放經過 CKIP 系統斷詞分析後的輸出結果。 5. 領域斷詞修補模組：由於 CKIP 斷詞系統對於特定專業領域的許多專業名詞無法精準的處理，因此本模組則結合領域詞彙主題資料庫與 CKIP 斷詞結果，進行斷詞結果修補作業，以提升斷詞結果在特定專業領域的正確性及可用性。 6. 領域詞彙主題資料庫：存放特定專業領域中的專業詞彙。 7. 專用斷詞準知識庫：存放經過領域斷詞修補模組程序處理後的斷詞結果，此資料內容已針對專業領域之專業詞彙進行處理，因此可提供知識萃取引擎進行知識內文之文句結構及詞義關係分析。 8. 領域詞彙管理模組：提供教師或管理者建立、刪除、修改及查詢特定專業領域詞彙之功能，此外，此模組亦可用以建立詞彙與詞彙間的關係。圖 1：線上華文知識學習系統建議架構教師與管理者學習者通用斷詞準知識庫領域詞彙主題資料原始知識文章資料教師管理操作介面專用斷詞準知識庫教材本體資料庫公式基模資料庫知識樣式資料庫線上教材知識庫學習者課程學習操作介面輔助線上教材產製與動態展現子系統測驗本體資料庫電腦輔助題庫產製子系統測驗樣式資料庫測驗題庫及答案資料庫線上測驗與智慧評分子系統測驗結果資料庫學習資源資料庫資料庫作業文章與斷詞處理子系統同音異字資料庫申訴記錄學習歷程資料庫知識討論及公告資料庫學習輔助工具管理子系統學習歷程資料庫評分參數資料庫相關語意詞彙資料庫

(6)

通用斷詞準知識庫領域詞彙主題資料庫原始知識文章資料庫 Internet 教師系統操作及管理介面

專用斷詞準知識庫 CKIP 斷詞分析領域斷詞修補模組領域詞彙管理模組原始文章管理模組教師與管理者圖 2:文章與斷詞處理子系統之系統架構圖 (三) 輔助線上教材產製與動態展現子系 統之系統架構 輔助線上教材產製與動態展現子系統之系統架構，如圖3 所示，圖中除了已於「文章與斷詞處理子系統」中說明之元件以外，其餘元件之內容說明如下： 1. 教材本體資料庫：儲存本研究所提出之教材講義結構知識本體。 2. 教材本體管理模組：提供教材講義知識本體結構的新增、刪除、修改及查詢等管理功能。 3. 公式基模樣式管理模組：此模組主要進行公式基模及知識樣式模型的新增、刪除、修改及查詢等工作。 (1) 公式基模管理：可針對領域知識內所有具有數學公式、邏輯運算，或其他可利用方程式推導之知識，進行運算規則及知識的儲存。此模組可讓線上講義教材中包含公式推導概念的計算範例或線上測驗中的運算題目，均可由此基模及亂數來自動產生內容變化，藉以活化講義教材的內容及提升彈性。 (2) 知識樣式管理：針對管理資訊系統及資訊管理導論相關書籍內文中，常被用來描述知識概念的語法結構規則、詞義關係規則進行管理與儲存，以提供知識萃取引擎使用。 4. 公式基模資料庫：儲存與數學公式、邏輯運算等具有推導概念的知識規則。 5. 知識樣式資料庫：儲存書籍內文中常用來描述知識概念的語法結構規則、詞義關係規則及所對應的中文語句詞彙及語法符號。 6. 知識萃取引擎：提供三個模組以處理知識萃取及知識獲得的工作。 (1) 內文主題分析模組：可將專用斷詞準知識庫內之文章內容、詞義符號，及領域詞彙主題資料庫內的所有詞彙進行載入並剖析文章內文，以瞭解文章內所談論的知識主題為何，並將內文中彼此相關的知識主題建立連結點，最後再將這些資料內容傳送給詞義關係分析模組處理。 (2) 詞義關係分析模組：此模組用來剖析知識內文中每一段敘述所符合知識樣式結構，以將知識的內文、語句結構拆解成符合教材本體規範的內容型態，並找出內文中符合詞義關係規則的內容。完成內文規則及樣式剖析工作後，知識萃取引擎會將這些初步被自動分解出的知識主題、內容及知識主題間關係，再傳送至知識獲得輔助模組進行處理。 (3) 知識獲得輔助模組：本研究在系統初期，難以將所有知識樣式規則包括進來，因此將提供教師人工輔助確認的功能，以確保所萃取知識的正確性及

(7)

可用性。當教師或管理者發現該發現的知識概念並未被萃取出來，那麼教師可以直接在此功能上新增知識，甚至去瞭解內文未被有效萃取的原因，並分析哪些知識文句結構尚未被包含在知識樣式資料庫中，再藉由這樣的回饋功能來使知識樣式規則更加完整。如果系統所萃取的知識是不重要的，那麼教師也可以直接在此功能上直接刪除知識，或進行知識樣式規則的調整。如果教師並不希望介入知識萃取的過程，則可透過知識萃取引擎的自動化參數進行設定，此參數分為「系統自動萃取，且自動儲存」、「系統自動萃取，但由教師審核後存入」及「由教師人工建立知識及儲存」三種情境選項，這三種情境也代表著知識獲取自動化程度為「全自動」、「半自動」或「全人工」。圖3: 輔助線上教材產製與動態展現子系統之系統架構圖 7. 線上教材知識庫：用以存放被萃取後的知識內容，而這些知識與知識的關係則透過關聯式資料庫的資料表來進行連結，而學習者未來所使用的講義教材知識來源，便是使用這個知識庫中的內容。 8. 知識關係連結模組：可將新增的知識與已存在於線上教材知識庫中的知識進行內容關係的連結。由於每一組新的知識從知識萃取引擎被萃取出來時，可能與過去已儲存的知識內容也會產生許多不同整類的知識關係；因此除了剛新增的知識要被儲存在線上教材知識庫中，每一個新的知識則需要透過此模組與已存在的知識進行知識主題詞義關係的分析與連結，之後再將這些重新建立關係的知識儲存至線上教材知識庫中。 9. 動態產生及展現線上教材講義模組：此模組的功能是當學習者在本研究的知學習網站上進行學習時，系統會依據教材知識本體結構、線上教材知識庫、學習者目前點選之課程主題、公式基模資料庫、知識樣式資料庫等內容，搭配動態伺服器網頁程式(ASP)來自動產生內含語意表頭(Semantic Heading)之線上教材內容。此模組所產生之教材文件都是動態產生出來的，所以如果同時間教師剛好針對學習者所欲學習的知識主題新建立了一個知識概念，那麼學習者在點選該主題知識後，畫面上便立即會顯示出包含該項知識內容的線上教材講義。在線上教材講義中，本系統將會針對所有被包含在領域詞彙主題資料庫中的知文章與斷詞處理子系統教師系統操作及管理介面教材本體資料庫公式基模資料庫知識樣式資料庫線上教材知識庫學習歷程資料庫知識萃取引擎詞義關係分析模組內文主題分析模組教材本體管理模組知識獲得輔助模組公式基模樣式管理模組動態產生及展現線上教材講義模組知識關係連結模組學習者課程學習操作介面專用斷詞準知識庫主題資料庫領域詞彙學習者教師與管理者

(8)

識主題，在網頁中提供超連結的功能，學習者便可透過這些超連結進行跨網頁間的非線性學習活動，也能有助於學習者依照自己的學習需求來學習知識。 10. 學習歷程資料庫：用以儲存學習者在教學系統中的所有學習歷程記錄。 (四) 教材知識內容斷詞標記與結構規則 本研究將經過「文章與斷詞處理子系統」斷詞過程，並完成「輔助線上教材產製與動態展現子系統」剖析知識的文章，依據第一年計畫所提出的教材知識本體結構，及剖析到的文章語意，而將知識內容自動儲存至線上教材知識庫中。因此，線上教材知識庫中實際儲存的知識內容均為經過斷詞後的知識，並將知識類型區分為解意、特性、理論模式、因果、次序、詞義、比較、時機條件、公式與範例等十類，除了公式知識是由教師依照公式基模的樣式建立之外，其餘各種知識類型都有其所屬的知識結構規則，且用以評量特定的知識概念。而任何一種知識類型所包含的規則甚多，因此在本精簡報告中無法一一說明。舉例而言，「…[導因(VK)於(P)|起因於 (Vi)|肇因於(Vt)]…」即為因果知識中的一個規則，凡屬該類知識皆儲存於教材知識 本體中的因果類型知識內。 四、系統成效評估 (一) 雛形系統功能說明 以下僅針對主要功能進行說明: 1. 線上教材知識內容管理：教師可透過教材管理區的「教材講義知識管理」功能，選擇輸入知識主題關鍵字，或是依照講義章節內容進行知識關係及內容的管理。圖4 為「決策支援系統」知識的一個詞義關係內容結構的維護畫面。儲存於系統內的教材知識內容，除了原始文字內容外，也包含每個詞彙斷詞後的詞性標記。 2. 電腦輔助產製試題：當線上教材知識庫 已儲存許多教材知識後，教師可透過線上測驗區的「題庫自動產製」功能，讓系統從「線上教材知識庫」中搜尋新進的教材內容，並依據教材內容結構來產生試題內容。教師可從題庫輔助產製的選擇畫面，選擇單一知識主題或全部知 識主題的試題產製。 3. 電腦輔助編製試卷的選題管理：教師可 透過線上測驗區的「試卷產生」功能，讓系統從已經產製完成的試題中協助教師選擇題目並編製成試卷。本系統提供教師二種電腦輔助挑選試題的編製試卷方法，第一種是從「題型」、「知識類型」或「知識認知能力」中，從中選擇一種概念出題；第二種是同時整合「題型」、「知識類型」及「知識認知能力」三類出題概念，進行電腦輔助選題的程序。圖5 為教師以第二種方式進行電腦輔助選題的畫面，圖中教師完成了10 個題目的試題類型需求設定，其需求涵蓋了不同題型、知識類型及認知層次，系統會依照教師的需求產生試卷內容。若教師對這組試題不滿意，教師可進行試題組合的修改，或從畫面中的功能按鈕，重新再由電腦亂數產生另一組試卷組合。而被選出的每個試題，螢幕中都會顯示出該題的題幹、備選答案、標準答案、知識概念編號，以及該試題所能評量的 知識層次及認知能力層次類型。 4. 學生教材知識學習：本系統提供主題式 及章節式等二種模式讓學生在系統上進行知識學習。主題式的知識學習類似專業領域的百科全書查詢，學習者只需輸入所欲學習的領域知識關鍵詞彙，系統將會直接從線上教材知識庫中將相關的知識呈現在畫面中，若知識內文中尚包含其他相關的知識主題，學習者可直接透過相關知識主題上的超連結進行深入學習，系統也會將學習者的學習路徑記錄下來，以避免學習者在知識學習中迷失路徑(如圖 6)。章節式的知識學習，則是經由教師透過章節管理功能，事先將已儲存在現上教材知識庫中的知識，依照教師的教學目標進行章節教材的內容及結構設定，學習者便可類似一般教科書的方式，依照章節順序學習。無論是上述何種學習方式，本系統在線上教材講義中將會針對所有被包含在領域詞彙主題資料庫中的知識主題，在網頁中提供超連結的功能，學習者便可透過這些超連結進行跨網頁間的非線性學習活動，每個知識主題亦可透過畫面的註解

(9)

按鈕查詢知識內容的出處。 圖4：維護儲存於知識結構中的知識內容畫面圖5:電腦輔助編製試卷的選題設定畫面 (二) 電腦輔助出題與教師人工出題的基本 能力比較 本研究在第二年計畫中持續改善「電腦輔助題庫產製子系統」的出題規則，以提升電腦輔助產製試題的品質，並與教師人工出題之試題品質進行比較。 1.教師人工出題實驗 本研究委託國內11 所大專院校 15 位曾授過管理資訊系統課程之教師針對本研究指定的管理資訊系統課程章節出題，題型限制為是非題、單選題、複選題及填充題等四類。實驗後15 位教師共產製了 440

(10)

個試題，扣除54 題完全相同的題目後，實際產製了386 題不同題目內容的試題，平均每位教師所花費的試題產製時間為 3.9 個小時，這些試題的題型分佈如表 1 所示。刪除重複試題後的題型分佈以是非題 143 題最多 ( 佔 37%) ，複選題最少 ( 佔 17.6%)。而這些試題的 Bloom 向度分佈如表2 所示，試題涵蓋了事實、概念及程序知識等三種知識層次，以及涵蓋了記憶、了解、分析及評鑑等四個認知層次。由於實驗的指定章節教材中，並未包含適合產製應用層次試題的內容，因此教師們並未產製應用層次的題目。事後與教師訪談，教師們普遍認為若有應用或演算類型知識，其應用層次試題並不難產生。除此之外，大多數教師則認為，屬於後設認知知識、評鑑或創造認知層次的試題，並不容易透過是非、單選、複選及填充題來發展。表1:教師人工產製試題之題型分佈結果知識向度是非題單選題複選題填充題小計刪除重複試題後 (143) 37% 27.5%(106) 17.6% (68) 17.9%(69) 100%(386) 表2:教師人工產製試題之 Bloom 向度分佈認知歷程向度知識向度記憶了解應用分析評鑑小計事實知識 49.7% (192) 6.5% (25) 0% (0) 14.5% (56) 0.78%(3) 71.5%(276) 概念知識 15.3% (59) 7.0% (27) 0% (0) 3.1% (12) 0% (0) 25.4%(98) 程序知識 2.3% (9) 0% (0) 0% (0) 0.8% (3) 0% (0) 3.1%(12) 小計 67.3% (260) 13.5% (52) 0% (0) 18.4% (73) 0.8%(3) 100%(386) 2.電腦輔助出題結果 本研究的「輔助題庫產製子系統」也針對相同的指定章節教材，進行知識內容的剖析與試題產製，電腦產製完成的試題若以不同題幹及選項為試題計算基礎，則合計產生18621 題(如表 3)，其中以複選題最多。但由於這些試題中有某些試題的答案選項或部分題幹內容是經由系統內建的相關語意詞彙進行排列組合的變化而產生另一試題，事實上這些試題因為具有相同的評量意義，所以應該歸類為「相同試題」，經過計算後系統實際產生「具有不同評量意義的試題」共有1624 題。而這 1624 個試題則源自於 279 個原始教材知識概念，而每一個試題則會透過語意關係、組合排列等方式，來產生題目實質意涵相同，但是選項內容不同的大量試題。因此，每一個被本系統視為「相同試題」的題目，平均會有11.466 個不同的題幹或選項題目可隨機替換，因此可部份抒解題庫不足與測驗題目重複導致學生直接記憶答案的問題。因此，在各題型的試題產製數量上，電腦產製出題能力較教師人工出題佳。表 3: 電腦輔助產製試題之題型分佈結果試題題型是非題單選題複選題填充題小計不同題幹及選項的試題 6.19% (1153) 35.51% (6612) 57.24% (10659) 1.06% (197) 100% (18621) 具有不同評量意義的試題 30.91% (502) 19.77% (321) 36.64% (595) 12.68% (206) 100% (1624) 若從Bloom 認知目標向度來分析，電腦輔助教師產製「具有不同評量意義的試題」之Bloom 分類向度分佈結果如表 4。電腦輔助產製的試題可評量之知識類型包括事實、概念及程序等三類知識；而電腦輔助產製的試題可評量之認知類型包括記憶、了解、分析及評鑑等四個層次，其中以分析類型試題較多。電腦輔助產製試題所涵蓋的Bloom 分類範圍，與先前教師人工出題的範圍相同，而在四種題型的產製限制下，認知歷程中的評鑑層次試題較難發展。而就認知歷程而言，無論是電腦產製或是教師產製的試題，「記憶」層次通常以「事實知識」為主，「了解」層次通常以「概念知識」為主，此結果與陳筱菁(2004) 的研究結論相同。此研究結果也揭露出本系統在「了解」向度的產製試題數量上比教師產製的數量低許多，分析導致此結果的原因，主要是因為試題產製規則對於屬於了解層次及事實知識類型的試題產製規則能力尚不夠健全，因此仍須透過後續研究建立產製此類試題的規則。此外，本研究因為試題產製規則中包括能進行對照詞彙型試題及相關整併型試題的產製規則，因此能產生大量的單選題及複選題，也能產生認知歷程中的分析層次辨別能力試題。本研究為了確認「應用」層次的產製能力，因此在實驗程序結束後，額外在線上學習系統中增加了數碼轉換的知識概念教材內容，而讓系統嘗試發展「應用」層次試題，最後電腦在應用試題出題演算法中控制了出題上限，而另外產生了50 題屬於應用層次的試題，這些試題均屬於「程序知識」的試題。此結果顯示本系統亦具備一定程度的應用層次試題發展能力。

(11)

圖6: 學習者使用主題式進行知識學習的畫面表4: 電腦輔助產製試題之 Bloom 分類向度分佈結果圖7:學生測驗後的認知目標學習成效能力指標圖當系統完成試題產製工作後，線上測驗系統便會將產製完成的試題儲存在測驗題庫中，教師可以透過圖5 的輔助選題編製試卷功能，來設定教師所欲產生的試卷組合。圖7 為某位學生在進行一份包含 15 題的試卷測驗後的學習成效能力指標分析圖。學習者可藉由測驗後的學習成效能力指標圖，來瞭解自己在不同知識層次或認知層次能力上的學習成效，並針對表現不好的類型試題，進行學習方法的修正。 3.教師對電腦輔助產製試題之採用意願 為了瞭解電腦產製完成的試題可用性、正確性、合理性、評量性，以及教師對於這些試題的採用意願，本研究在進行「教師對於電腦試題品質的認同及接受程度」評估前，先讓參與實驗的教師親自於線上審視經由電腦產製完成的18621 題試題。因此每位教師均可實際感受到電腦產製完成的試題品質。為了讓教師能更深入的評估試題品質，本研究則從18621 題試題中，隨機產生50 題知識概念不重複的試題(是非 10 題、單選 20 題、複選 10 題、填充 10 題)，並由所有參與實驗教師針對每一個試題的可用性、合理性、評量性及願意採用該試題的認同度，填寫 Likert 5 點區間尺度的試題品質量表，分數高低表

(12)

示教師對於該試題品質的認同及接受程度。本量表之Cronbach α 值為 0.975，量表中的每個題目皆透過教材知識及試題產製規則產生，並經過二位領域教師檢視，因此具有高度的信度與內容效度。經過資料分析後，參與實驗教師對於由電腦隨機選出的 10 題是非題之採用意願分數平均為4.06 分，20 題單選題之採用意願分數平均為4.12 分，10 題複選題之採用意願分數平均為4.14 分，10 題填充題之採用意願分數平均為4.14 分。顯示大多數教師對於電腦輔助產製是非、單選、複選及填充題的試題內容，普遍認同這些試題的可用性、正確性、合理性及評量性，而且也有高度意願採用這些試題。但有3 位教師對特定題型試題給予較差的評分，經過與個別教師訪談後發現，這3 位教師因為個人教學經驗及對於測驗題型的認知與喜好差異，對特定題型試題沒有使用意願，而非認為試題內容不恰當。綜合實驗結果發現：不同的教師對於特定題型及題目難易度會有特殊的認知偏好，因此會造成某些教師對於特定題型給予試題較差的認同分數；但整體而言，參與實驗教師對於電腦輔助產製的試題合適性與認同度方面，均給予正面的評價，顯示教師對本研究試題有高的接受度。 4.教師對系統成效評估 當參與實驗教師實際操作系統後，則開始填寫「電腦輔助產製試題子系統的系統成效問卷量表」，此量表有30 個問項，每個問項參考測驗系統及編製試題原則等相關文獻之指標，並經二位領域專家針對問卷內容及詞句給予意見，另外本量表的 Cronbach α 值為 0.973，因此量表具備相當高的內容效度及信度。參與教師普遍認為利用電腦能夠輔助產製出用以評量「事實」、「概念」及「程序」等知識類型的試題，但對於電腦輔助產製用以評量「概念知識」的成效上不如「事實知識」的效果好，此部分有待後續研究針對「概念知識」類型的試題產製，進行產製規則的研究。而利用電腦也能夠輔助產製出用以評量「記憶」、「了解」、「應用」、「分析」及「評鑑」等認知歷程的試題，其中電腦輔助產製用以評量較低層次認知的試題表現較佳，對於高層次的「分析」及「評鑑」試題，則表現的較不理想。此結果顯示，評量越高層次的認知類型試題，較不容易透過基本的結構來讓電腦輔助產製，因此高層次試題仍須由教師人工出題為宜。在產製試題的題型能力方面，教師普遍認為無論在是非、單選、複選及填充題，電腦均能進行有效的試題產製，特別在是非題的試題產製表現最佳，複選題的試題產製為此四種類型中表現較差者，但整體而言均能得到參與實驗教師的認同。此外，研究結果也顯示透過電腦輔助產製的試題，其效益包括試題具備Bloom 概念資訊、試題變化較人工出題佳、試題涵蓋教材中所有重要知識概念、試題與教師人工產製的重點類似、試卷選題功能使試卷內不會有評量相同知識概念的重複試題、試題符合試題編製理論的原則、每個試題都具有特定的意義及代表性。而在建立龐大題庫能力方面，電腦僅花 5 分鐘便從 279 種原始教材知識概念中，完成1624 種具有不同評量意義的試題(若將不同答案選項及題幹視為一題，則實際有18621 題)。因此大多數老師均認為此系統比人工出題更有效率，而且試題數量也較人工出題佳，所以電腦輔助產製的題庫試題足以提供線上學習系統使用。 (三) 電腦輔助出題與教師人工出題的試題 品質比較 為了考量教學評量的目的與價值，郭生玉(民 77)認為試題品質可透過試題分析(item analysis)的質化分析與量化分析過程來判斷，其中的量化分析主要包括了試題難度與鑑別力的評鑑。因此本研究將針對電腦輔助出題及教師人工出題的試題品質進行量化分析的難度（difficulty）、鑑別度（discrimination）檢驗，以探討本研究的系統出題品質。在探討難度與鑑別度時，從受測者的測驗分數取最高及最低各 27%的數據進行分析其可靠性最大,因此本研究將 27%的數據來區隔高分組與低分組學生。試題難度是指受測者答對試題的百分比，難度指數介於 0 與 1 間，愈接近 1 代

(13)

表答對人數愈多，試題愈簡單，愈接近 0 代表答對人數愈少，試題愈困難。因此本研究先分別計算高低分組在每個試題答對人數的百分比，計算公式如下：在難度的認定上，本實驗採用 Ebel 與 Frisbie（1991）、余民寧（民 86）、郭生玉（民 74）等人提出之試題評鑑原則，個別試題的難度指數應介於 0.4 至 0.8 間，整體試題的難度指數應在 0.5 左右。試題鑑別度是指試題可用以區別不同程度受測者的能力，鑑別度高的試題通常會讓高分組的受測者答對試題的比率較高，低分組的受測者答對試題的比率較低。鑑別度指數介於-1 到+1 之間，指數愈大，鑑別度愈高；指數愈小，則鑑別度愈低。當鑑別度為 0 時，便有可能是題目太難或太容易。因此，鑑別度的計算則是高分組答對試題的百分比減去低分組答對試題的百分比，其計算公式如下：在鑑別度的認定上，本實驗採用 Ebel 與 Frisbie（1991）、余民寧（民 86）、郭生玉（民 74）等人提出之試題評鑑原則，鑑別度指數 0.4 以上是屬於非常優良試題；0.3 至 0.39 屬於優良試題；0.2 至 0.29 屬於尚可試題；0.2 以下則屬於劣質試題。在試題品質比較實驗中，是由北部某大學資管系44 位修習「管理資訊系統」課程的學生參與。試題品質實驗的流程如圖 8，實驗初期是由計畫中所指定的管理資訊系統教材章節(共 2 章)，分別由之前描述的15 位教師人工出題，以及本研究的電腦系統輔助出題，所產製的試題則分別存放在題庫X 及題庫 Y。之後本研究再從電腦產製完成的題庫X 及教師人工出題的題庫 Y 中，分別採用分層隨機抽樣方式，各自從題庫中取出是非題10 題、單選題 10 題、複選題5 題及填充題 5 題，合計 30 題的題目。從電腦出題的題庫X 中所選出的題目，將被編製成試卷X，而從教師人工出題的題庫Y 中所選出的題目，則被編製成試卷Y。每位受測學生則同時要撰寫試卷 X 及試卷 Y 的試題，當學生完成這兩份試 題的撰寫後，則進行試題品質分析。 圖 8：試題品質實驗程序圖 表 5 不同組別受測者在試卷 X 及試卷 Y 的測驗成績平均數差異檢定及變異數同質檢定分析表平均數差異檢定 Levene變異數同質檢定自變數依變數組別樣本數平均數標準差自由度 t值 P值 F值 P值 A組 22 42.59 14.55 試卷X 測驗成績 B組 22 48.82 13.18 42 -1.488 0.144 0.005 0.946 A組 22 53.36 9.01 受測組別試卷Y 測驗成績 B組 22 52.64 10.93 42 0.241 0.811 0.771 0.385 為了避免受測學生同時測驗試卷 X 及試卷 Y 時，其中一份試卷的答案可能可以從另一份試卷的題目中獲得，而影響到試卷的試題品質分析結果，因此本研究在進行實驗時，X 卷與 Y 卷將分開進行施測，以確保每位受測學生不會在相同的時間，同時擁有試卷 X 及試卷 Y。為了達到此目的，本研究依照受測學生的期中考成績排名，將排名為奇數與偶數名次的學生分別區分成 A、B 二組，並於不同教室施測。A 組受測學生在進行測驗時，先考由電腦輔助產製出題的試卷 X，當 X 卷完成繳卷後，再拿取由教師人工出題的試卷 Y。B 組受測學生在進行測驗時，則先考由教師人工出書籍資料內容電腦輔助產製試題集體教師人工出題題庫 X 題庫 Y 試卷 X 試卷 Y 學生進行測驗試題品質分析 ● 高分組答對率 PH = RH/NH ………… (公式 1) ● 低分組答對率 PL = RL/NL ………… (公式 2) ● 難度 P= (PH/PL)/2 ………(公式 3) (註：R:答對人數;N:總人數;H:高分組;L:低分組) ●鑑別度 D = PH - PL ……… (公式 4)

(14)

題的試卷 Y，當 Y 卷完成繳卷後，再拿取由電腦輔助產製出題的試卷 Y。為了確認 A、B 二組受測學生在接受試卷 X 及試卷 Y 的測驗順序差異，是否會影響各試卷測驗的成績結果，本研究針對不同組別的受測學生在試卷 X 及試卷 Y 的測驗結果進行平均數差異的檢定，檢定結果如表 5 所示，不同組別的學生在試卷 X 及試卷 Y 的測驗成績結果上並無顯著差異，因此試卷 X 及試卷 Y 的測驗順序，對於測驗成績的結果並無顯著影響。 1. 電腦輔助與教師人工產製試題之試題 品質分析(以題型為基礎) 試卷 X 的試題，是從電腦自動產製試題的題庫 X 中，經過分層抽樣程序而隨機選出的題目；其中包含 10 題是非、10 題單選題、5 題複選題、5 題填充題(共包含 10 個空格)。試卷 Y 中的試題，則是從包含 386 題教師人工產製試題的題庫 Y 中，利用分層隨機抽樣程序而產生；其中共包含 10 題是非、10 題單選題、5 題複選題、 5 題填充題(共包含 10 個空格)。試卷 X 與試卷 Y 的施測時間均為 50 分鐘，亦由相同的 44 位受測者參與。電腦輔助與教師人工產製試題之試卷難度及鑑別度計算結果，彙整於表 6。從表 6 中發現在四種不同題型中，無論是電腦輔助出題或是教師人工出題的試題平均難度均介於「適中」的 0.24~0.73 間，符合試題難度應介於 0.2~0.8 的「適中」試題準則範圍，而各題型所產生試題難度為「適中」的比例相似。但在試題鑑別力方面，電腦輔助出題在四種不同題型的試題平均鑑別度均在表示為「優良」的 0.3 以上，而教師人工出題在四種不同題型的試題平均鑑別度則均落在表示為「尚可」的 0.2~0.3 之間，結果顯示電腦輔助出題的在各題型的試題平均鑑別度品質均優於教師人工出題。若從整體試題鑑別度為「優」或「極優」的試題比例分析，電腦輔助出題的試卷中佔有 46.7%的比例，人工出題的試卷中則佔有 36.7%的比例，因此電腦輔助出題方式的整體鑑別度也優於教師人工出題方式。表 6: 電腦輔助與教師人工產製試題之試題品質數量分佈(以題型為基礎) 試題品質-難度試題品質-鑑別力題型試題產製方式易適中難平均難度劣尚可優極優平均鑑別力電腦輔助 5 (50.0%) 5 (50.0%) 0 (0.0%) 0.7 (適中) 4 (40.0%) 1 (10.0%) 1 (10.0%) 4 (40.0%) 0.33 (優) 是非題 (10 題) 人工出題 5 (50.0%) 4 (40.0%) 1 (10.0%) 0.73 (適中) 7 (70.0%) 1 (10.0%) 0 (0.0%) 2 (20.0%) 0.17 (劣) 電腦輔助 1 (10.0%) 7 (70.0%) 2 (20.0%) 0.47 (適中) 1 (10.0%) 5 (50.0%) 1 (10.0%) 3 (30.0%) 0.31 (優) 單選題 (10 題) 人工出題 2 (20.0%) 8 (80.0%) 0 (0.0%) 0.70 (適中) 2 (20.0%) 3 (30.0%) 2 (20.0%) 3 (30.0%) 0.26 (尚可) 電腦輔助 0 (0.0%) 3 (60.0%) 2 (40.0%) 0.33 (適中) 2 (40.0%) 0 (0.0%) 0 (0.0%) 3 (60.0%) 0.45 (極優) 複選題 (5 題) 人工出題 0 (0.0%) 4 (80.0%) 1 (20.0%) 0.36 (適中) 2 (40.0%) 1 (20.0%) 0 (0.0%) 2 (40.0%) 0.24 (尚可) 電腦輔助 0 (0.0%) 4 (80.0%) 1 (20.0%) 0.29 (適中) 1 (10.0%) 2 (20.0%) 0 (0.0%) 2 (20.0%) 0.41 (極優) 填充題 (5 題) 人工出題 0 (0.0%) 2 (40.0%) 3 (60.0%) 0.24 (適中) 2 (20.0%) 1 (10.0%) 2 (20.0%) 0 (0.0%) 0.21 (尚可) 電腦輔助 6 (20.0%) 19 (63.3%) 5 (16.7%) 0.50 (適中) 8 (26.7%) 8 (26.7%) 2 (6.7%) 12 (40.0%) 0.35 (優) 合計 (30 題) 人工出題 7 (23.3%) 18 (60.0%) 5 (16.7%) 0.59 (適中) 13 (43.3%) 6 (20.0%) 4 (13.3%) 7 (23.3%) 0.24 (尚可) 2. 電腦輔助與教師人工產製試題之試題 品質分析(以知識類型為基礎) 電腦輔助及教師人工出題方式所產生的試題在認知領域教育目標的知識向度試題品質表現結果彙整於表 7。從表 7 中發現，三種知識向度的試題，除了教師人工

(15)

出題的試卷未抽樣出屬於程序知識的試題外，電腦輔助出題或是教師人工出題的各類試題平均難度均介於「適中」的 0.36~0.59 間，符合試題難度應介於 0.2~0.8 的「適中」試題準則範圍；然而，若從屬於事實知識及概念知識試題的平均難度來分析，電腦輔助出題的試卷試題其平均難度則比人工出題的試卷更接近 0.5，因此電腦輔助出題的試卷試題的難度品質較佳也較為適中。在試題鑑別力方面，電腦輔助出題在事實知識、概念知識等二種知識向度的試題平均鑑別度均在表示為「優良」的 0.3 門檻以上，程序之事項度的試題平均鑑別度則為 0.28 屬於「尚可」；而教師人工出題在三種知識向度的試題平均鑑別度均落在表示為「尚可」的 0.2~0.3 間，結果顯示電腦輔助出題的在知識向度的試題平均鑑別度品質也優於教師人工出題。表 7: 電腦輔助與教師人工產製試題之試題品質數量分佈(以知識向度為基礎) 試題品質-難度試題品質-鑑別力知識向度試題產製方式易適中難平均難度劣尚可優極優平均鑑別力電腦輔助 4 (26.7%) 9 (60.0%) 2 (13.3%) 0.54 (適中) 4 (26.7%) 4 (26.7%) 1 (6.7%) 6 (40.0%) 0.38 (優) 事實知識人工出題 6 (28.6%) 11 (52.4%) 4 (19.0%) 0.59 (適中) 9 (42.9%) 5 (23.8%) 2 (9.5%) 5 (23.8%) 0.25 (尚可) 電腦輔助 1 (11.1%) 7 (77.8%) 1 (11.1%) 0.49 (適中) 1 (11.1%) 3 (33.3%) 1 (11.1%) 4 (44.4%) 0.35 (優) 概念知識人工出題 1 (11.1%) 7 (77.8%) 1 (11.1%) 0.56 (適中) 4 (44.4%) 1 (11.1%) 2 (22.2%) 2 (22.2%) 0.22 (尚可) 電腦輔助 1 (16.7%) 3 (50.0%) 2 (33.3) 0.36 (適中) 3 (50.0%) 1 (16.7%) 0 (0.0%) 2 (33.3%) 0.28 (尚可) 程序知識人工出題 0 (0.0%) 0 (0.0%) 0 (0.0%) NA 0 (0.0%) 0 (0.0%) 0 (0.0%) 0 (0.0%) NA 表 8: 電腦輔助與教師人工產製試題之試題品質數量分佈(以認知領域為基礎) 試題品質-難度試題品質-鑑別力認知領域試題產製方式易適中難平均難度劣尚可優極優平均鑑別力電腦輔助 4 (23.5%) 11 (64.7%) 2 (11.8%) 0.51 (適中) 4 (23.5%) 5 (29.4%) 1 (5.9%) 7 (41.2%) 0.38 (優) 記憶人工出題 5 (27.8%) 10 (55.6%) 3 (16.7%) 0.61 (適中) 8 (44.4%) 3 (16.7%) 4 (22.2%) 3 (16.7%) 0.23 (尚可) 電腦輔助 0 (0.0%) 3 (100%) 0 (0.0%) 0.58 (適中) 0 (0.0%) 0 (0.0%) 1 (33.3%) 2 (66.7%) 0.50 (極優) 了解人工出題 1 (25.0%) 3 (75.0%) 0 (0.0%) 0.66 (適中) 1 (25.0%) 1 (25.0%) 0 (0.0%) 2 (50.0%) 0.32 (優) 電腦輔助 1 (14.3%) 3 (42.9%) 3 (42.9%) 0.38 (適中) 3 (42.9%) 3 (42.9%) 0 (0.0%) 1 (14.3%) 0.23 (尚可) 分析人工出題 1 (12.5%) 5 (62.5%) 2 (25.0%) 0.47 (適中) 4 (50.0%) 2 (25.0%) 0 (0.0%) 2 (25.0%) 0.21 (尚可) 電腦輔助 1 (33.3%) 2 (66.7%) 0 (0.0%) 0.56 (適中) 1 (33.3%) 0 (0.0%) 0 (0.0%) 2 (66.7%) 0.39 (優) 評鑑人工出題 0 (0.0%) 0 (0.0%) 0 (0.0%) NA 0 (0.0%) 0 (0.0%) 0 (0.0%) 0 (0.0%) NA 電腦輔助及教師人工出題方式所產生的試題在認知領域教育目標的認知向度試題品質表現結果彙整於表 8。從表 8 中發現，電腦輔助出題或是教師人工出題的試題中，無論是記憶、了解、分析或評鑑向度的試題，除了教師人工出題的試卷未抽樣出屬於評鑑向度的試題外，其餘各類試題的平均難度均介於「適中」的 0.38~0.58 間，符合試題難度應介於 0.2~0.8 的「適

(16)

中」試題準則範圍；然而，若從屬於「記憶」及「了解」向度試題的平均難度來分析，電腦輔助出題的試卷試題其平均難度則比人工出題的試卷更接近 0.5，顯示出以「記憶」及「了解」向度的試題難度而言，電腦輔助出題的試題平均品質優於教師人工出題；但在「分析」向度的難度上，教師人工出題的平均試題難度則較電腦輔助出題的接近 0.5，因此電腦輔助出題在「分析」向度的試題難度表現上並未達到教師人工出題的水準，因此未來電腦輔助產製試題的子系統，有必要針對能產製「分析」向度試題的出題規則進行修正，以使平均難度能更接近 0.5。在試題鑑別力方面，電腦輔助出題在「記憶」、「了解」、「評鑑」等三種認知向度的試題平均鑑別度分別是 0.38、0.50、 0.39 均落在表示為「優良」與「極優良」的 0.3 及 0.4 門檻以上；屬於「分析」向度的試題平均鑑別度則是 0.23，落在表示為「尚可」的 0.2~0.3 間。而教師人工出題在「記憶」與「分析」二種認知向度的試題平均鑑別度均落在表示為「尚可」的 0.2~0.3 間，只有「了解」向度的試題平均鑑別度是 0.32，落在表示為「尚可」的範圍。因此，從認知向度的試題鑑別力而言，電腦輔助出題的試卷品質則優於教師人工出題的試卷。若以試題品質的刪題準則來分析，凡是試題太難(難度<0.2)、試題太簡單(難度 >0.8)、試題鑑別度太差(鑑別度<0.2)都刪除後，電腦輔助出題的試卷將被刪除 12 題，剩餘可用的試題為 18 題，符合試題品質的可用試題比率為 60%；而教師人工出題的試卷將被刪除 15 題，剩餘可用的試題為 15 題，符合試題品質的可用試題比率為 50%。因此電腦輔助產製的試題，也具有較高的試題品質及試題可用率。五、結論與建議本研究在第二年計畫中，針對教材內容的自動剖析辨識及儲存方法，以及編製試卷擇選方法研究，並與第一年計畫的系統功能，進行了更完整的自動化整合，此外本研究也針對電腦產製的試題品質與教師人工出題的試題品質，以實驗方法來進行檢驗。本研究在電腦輔助產製試題的試題品質與可行性的研究上，透過電腦輔助產製試題與教師人工出題兩種方式編制的試卷，透過受測學生實際測驗後的結果，進行試題品質的評估。研究成果顯示，15 位教師平均每人花費 4.3 小時，共產製 386 個不同的試題，而本研究根據相同的教材內容，由電腦花費約 5 分鐘產製了 18621 題試題，扣除答案選項及題幹變化的相似題目後，實際具有不同評量意義的試題共有 1624 題。這些試題所能評量的知識類型包含了事實知識 809 題，概念知識 273 題，程序知識 542 題，另外所能評量的認知層次包括記憶層次 718 題，了解層次 28 題，分析層次 810 題，評鑑層次 18 題，創造層次試題則無法透過是非、單選、複選及填充題題型來發展，應用層次試題則在系統具備相關教材知識後，亦能藉由本系統進行產製。而在試題品質方面，電腦輔助產製試題之採用意願分析結果顯示，不同的教師對於特定題型及題目難易度會有特殊的認知偏好及效用認知差異，因此會造成某些教師對於特定題型給予試題較差的主觀評價，若排除教師對於特定題型的排斥因素後，參與實驗的教師對於電腦輔助產製的試題合適性與認同度方面，均給予正面的評價，顯示本研究的試題能被一般教師所接受及使用。但是，如果要對於試題品質進行客觀的評估，則需要另外針對大量的試題進行額外的實證研究，以取得每個試題的難易度與鑑別度結果。此外，電腦輔助產製試題子系統的系統成效評估分析結果顯示，利用電腦能夠輔助產製出用以評量「事實知識」、「概念知識」及「程序知識」等各種知識類型的試題，以及輔助產製出用以評量認知歷程的「記憶」、「了解」、「應用」、「分析」及「評鑑」等類型的試題，此結果與教師人工出題範圍一致，顯示本研究確實能輔助教師進行具備 Bloom 分類概念資訊的試題發展。而透過電腦輔助產製用以評量較低層次認知的試題表現較佳，若要產製評量更高層次的認知類型試題，電腦則較不容易透過固定的結構規則來達成。

(17)

實證結果也顯示，透過電腦輔助產製的試題能達到試題產製的時間及試題變化效益，所產製的試題也能具有試題均能符合試題編製原則要求、避免同一試卷中出現評量相同知識概念的重複試題、提供包含 Bloom 分類資訊試題、透過知識本體的知識連結可產生新概念試題等效益。此外，老師們也認為電腦輔助產製試題能協助教師發展一般常見的基本層次測驗試題，因此老師們有相當高的意願利用此系統來協助其產製大量題庫及選取試卷題目，而教師所節省的時間，則可進行更高層次的試題發展。而在試題難易度方面，無論是以題型、知識向度或認知向度來進行分析，電腦輔助出題與教師人工出題的平均試題難度，均無明顯的差異，並符合試題為「適中」的要求，顯示電腦輔助出題的試題難易度，能達到教師人工出題的能力。而在試題鑑別力方面，若以題型來進行分析，電腦輔助出題的平均試題鑑別力達到「優良」的水準，而教師人工出題的平均試題鑑別力僅達到「尚可」的水準，顯示電腦輔助出題方式的試題鑑別力優於教師人工出題方式；若以試題用以評量的知識向度來分析，電腦輔助出題在用以評量事實知識及概念知識向度的平均試題鑑別力均達到「優良」的水準，而教師人工出題在這二個向度的平均試題鑑別力僅達到「尚可」的水準，顯示電腦輔助出題方式在用以評量適時知識及概念知識的試題鑑別力上優於教師人工出題方式；若以試題用以評量的認知向度來分析，電腦輔助出題在用以評量記憶、了解、分析等認知向度的平均試題鑑別力均優於教師人工出題方式。綜合而言，本研究之貢獻及未來發展方向說明如下： (一) 研究貢獻 為使電腦能輔助教師自動產製試題，本研究將藉由網際網路特性及電腦運算能力，使線上測驗系統能發揮最大效用，並能對電子化學習系統及教育領域有所貢獻，本研究之貢獻歸納如下： 1. 本研究的雛形系統在初期研究成果中，已可獲得許多輔助人工出題的效益，除了降低教師人工出題的負擔外，也能輔助產製涵蓋評量事實、概念及程序等三種知識向度及記憶、了解、應用、分析及評鑑等五種認知向度的試題。從教育領域而言，本研究的貢獻主要在於結合了 Bloom 教育目標分類概念及試題出題原則，使電腦能提供具有實質教育意涵的測驗試題。 2. 本研究的研究結果顯示，透過電腦科技可以更有效率的產製出大量且變化的基本試題，實際減輕教師產製試題的負擔，而教師可將節省下來產製試題時間，用來設計及發展更高層次的試題。 3. 本研究的研究結果顯示，透過本研究的系統架構所產製的電腦輔助產製試題，其試題難易度能具備教師人工出題時的試題難易度水準；而在試題鑑別力方面，電腦輔助出題的試題平均而言優於教師人工產製的試題。 4. 本研究提出的「電腦輔助題庫產製系統」架構，結合 Bloom 分類及本體論概念，足以讓線上測驗系統的「電腦輔助選題編製試卷」功能，能快速依據教師所需要的試題知識向度、認知向度或測驗題型，分別編製成不同測驗目的之試卷，以增加教師進行各種評量的彈性。 5. 經由教材知識本體的設計，原本非連續的教材知識間可以依據其所屬之知識類型關係結構來相互連結，使得教材知識不再只能以原有的知識概念呈現，透過知識結構的連結，便有可能挖掘出新的知識概念。而透過試題產製規則的設計，系統也能依據教材知識本體結構及知識內容，產生新知識概念的試題。 6. 本研究的雛形系統架構設計，使得測驗試題能直接從線上教材中萃取，並與知識教材緊密結合，因此系統輔助產製的試題，便能與原始系統內的原始教材知識內容進行連結，當受測者在答錯測驗題目時，系統便能輕易的透過這樣的測驗回饋連結，直接讓受測學生連結至該題目相關的原始教材內容中進行知識補強的學習，如此將能帶給學習者更大的學習輔助。

(18)

(二) 研究限制與未來研究建議 由於時間及開發環境上的因素，本研究之系統仍有一些限制，茲條列如下，並討論其改進的方向。 1. 由於實例知識中的情境個案知識牽涉過多的情境及隱含，而多媒體附件知識不適用於語意分析技術，因此這些類型知識未列在輔助產製試題的教材來源中，在試題產製規則中也未分析這一類的知識教材內容。 2. 電腦輔助產製的試題，雖可涵蓋 Bloom 認知目標第一層分類概念，但尚無法完全產製出涵蓋 Bloom 知識向度及認知向度第二層子類別的試題。未來研究可針對 Bloom 分類第二層的內容，透過知識本體結構的修改，以及試題產製規則的設計來努力。 3. 由於中文語法結構變化多元，目前系統所設計的試題產製規則仍無法包含所有中文環境中的規則結構，因此本研究仍須不斷的進行試題產製規則的補強。 4. 本研究對於教材知識本體及試題產製規則的設計，是以華文課程知識學習環境為基礎，因此僅能以中文的語法結構進行知識內容的分析及試題產製的工作，尚無法對於英文文章內容進行內容分析及英文試題產製。未來研究可考慮結合英文文法規則及結構，來達成英文文章的分析及試題產製工作。 5. 受限於實驗執行的考量因素，本研究是以「管理資訊系統」的部分內容做為研究課程範例，因此可能在應用層次或更高層次的試題發展上會受到限制。後續研究將可從國小、國中、高中、大學等教育層級中，選擇更適合發展各種層次的課程領域進行研究。 6. 由於本研究著重系統架構之研究及初期成效評估，因此實證皆以課程領域教師為主。未來研究則可邀請教育專家檢視在有輔助系統的協助及沒有輔助系統的協助下，針對課程教師出題的正確性進行評估。六、計畫成果自評（一）電腦自動產製試題相較於人工出題的效益自評經過電腦輔助自動產製試題方法的設計及雛形實驗系統的建置後，相較於教師的人工出題，本研究的電腦自動產製試題的效益說明如下： 1. 本研究中電腦自動產製的試題涵蓋 Bloom 分類的向度資訊，促使試題評量具有教育意義。而教師人工出題通常未考慮試題可評量的向度，若要包含 Bloom 分類向度資訊，則需額外請教育專家協助分類。 2. 本研究中電腦自動產製的試題可評量的知識層次及包含事實、概念與程序知識，可評量的認知層次則包含記憶、了解、應用、分析、評鑑，這與教師人工出題的能夠達到的範圍相同，顯示電腦自動產製試題可以協助教師的工作，並能達到甚至優於教師人工出題的水準。 3. 針對先導實驗中的教材內容，15 位教師們平均花費 3.9 小時，僅發展 386 個試題，本研究的系統能在 3 分鐘內便自動產製 7963 題的試題內容，因此能減少教師建立測驗題庫所需付出之人力時間。 4. 本研究能達成電子化學習環境需求大量豐富試題題庫的目標。 5. 本研究能產生許多用以評量相同知識概念的不同試題，以降低學習者直接記憶試題答案的動機。 6. 本研究在加入新的知識教材後，系統可藉由知識本體結構，重新分析新知識與過去知識的關係，因此可將分屬在不同章節的知識進行連結，並進而產生跨章節概念的新試題。 7. 本研究的試題已在試題產製規則中，加入試題發展的原則及理論，因此試題能符合各類題型發展的原則。（二）研究發表本研究成果目前正陸續改寫成論文，目前已有一篇論文被電子商務學報接受，並預計於 2007 年 12 月刊登。七、參考文獻（因篇幅限制，僅列出部分文獻）

【1】 Alderson, J.C., “Technology in Testing: The Present and Future,” Elsevier Science Document System (28), 2000, pp: 593-603. 【2】 Anderson, W., & Krathwohl, D. R., A

Taxonomy for Learning, Teaching, and Assessing: A Revision of Blooms' Educational

(19)

Objectives, NY: Longman, 2001.

【3】 Bloom, B. S., Englehart, M. D., Furst, E. J., Hill, W. H., and Krathwohl, D. R., A Taxonomy of Educational Objectives: Handbook 1, The Cognitive Domain, N.Y.: David Mckay Co, 1956.

【4】 Bunge, M., Treatise on Basic Philosophy: Vol.3: Ontology I: The Furniyure of the World, Boston, MA: Reidel, 1977.

【5】 Desai, B. C., “Supporting Discovery in Virtual Libraries,” Journal of the American Society for Information Science, 48(3), March 1997, pp: 190-204.

【6】 Devedzic, V.B., “Key Issues in Next-Generation Web-Based Education,” IEEE Transactions On Systemsm, Man, And Cybernetics-PART C: Applications And Reviews (33:3), 2003, pp: 339-349.

【7】 Ebel, R. L. & Frisbie, D. A.. Essentials of educational measurement, 5th ed., Englewood Cliffs, NJ: Prentice-Hall, 1991.

【8】 Fensel, D., Harmelen, F., Horrocks, I., McGuinnesm D.L. and Patel-Schneider, P.F., “OIL: An Ontology Infranstructure For The Semantic Web,” IEEE Intelligent Systems, 16(2), 2001, pp: 38-45.

【9】 McCormack, D. and Jones, D., Building a Web-Based Education System, N.Y.: Wiley, 1997.

【10】 Rosenberg, M. J., E-Learning: Strategies for Delivering Knowledge in the Digital Age, AcGraw-Hill, 2001.

【11】 Russell, S.J. and Norvig, P., Artifical Intelligence: A Modern Approach, Prentice Hall, Upper Saddle River, New Jersey, 2nd

edition, 2003.

【12】 Uschold, M. and Gruninger, M., “Ontologies: Principles, Methods and Applications,” The Knowledge Engineering Review, 11(2), 1996, pp: 93-136. 【13】何榮桂，民 79，『電腦教學系統中的測驗設計』，中等教育，第 41 卷．第 2 期：29~34 頁。【14】何榮桂、蘇建誠、郭再興，民 85，『遠距適性測驗系統架構』，資訊與教育雜誌，第 42 期： 29~35 頁。【15】林盈達、林義能，民 88，『DIYExamer：題庫收集、測驗與鑑別系統及其效能』，TANET'99 論文集。【16】周文正，民 87，『WWW 上電腦輔助測驗系統之研製』，中華民國第七屆電腦輔助教學研討會。【17】郭生玉，民 77，『心理與教育測驗』，台北: 精華書局。【18】黃國禎，曾秋蓉，朱蕙君，蕭經武，民 91，『智慧型線上測驗系統題型之分析與改進』，科學教育學刊，第 10 卷．第 4 期：423~439 頁。【19】葉連祺、林淑萍，民 92 年 1 月，『布魯姆認知領域教育部標分類修訂版之探討』，教育研究月刊，第 105 期：94~106。【20】楊亨利、應鳴雄，民 95 年 1 月，『具備智慧型模糊評分機制之線上測驗系統架構』，資訊管理學報，第 13 卷，第 1 期： 41~74 頁。【21】蔡松齡，民 81，『電腦在題庫命題作業之運用 (下)』，師友月刊，第 298 期：54~58 頁。

(20)

行政院國家科學委員會補助國內專家學者出席國際學術會議報告

95 年 8 月 16 日報告人姓名楊亨利服務機構及職稱政治大學資管系教授時間會議地點 2006/8/6-2006/8/11 大陸桂林本會核定補助文號 NSC 95-2416-H-004 -005 - 會議名稱

PRICAI 2006 (Ninth Pacific Rim International Conference on Artificial Intelligence)包含 PRICAI Workshops (PRIMA 2006, PKAW 2006)

發表論文題目

(中文)

(英文) An Intelligent System for Supporting Personal Creativity based

on Genetic Algorithm

(21)

報告內容包括下列各項：一、參加會議經過

由於兩岸沒有直航，需要轉機。8/6 搭長榮飛機 BR0801 至澳門，通澳門海關，再進入珠海海關，轉南方航空 CZ3765 抵達桂林。8/7-8/8 至會場先參加 PRICAI 的前二天預備會 Workshop：PRIMA 2006, PKWA 的研討會，8/9-8/10 繼續參加其技術 Sessions，包含 8/9 發表本人 paper，8/10 參加完該日白天議程，搭晚上飛機南方航空 CZ3766 先抵達珠海住宿一夜，第二天出珠海關，再出澳門關，搭轉搭長榮飛機 BR0802 回國。

二、與會心得

此研討會為二年一次，今年是大陸廣西大學、廣西師範大學與澳洲 General Management System Organization 合辦。相較我之前參加的 KES 研討會，此 PRICAI 的規模並沒有那麼大。不過，其主要三天(8/9-8/11)的 Session 也有 596 篇文章投稿，接受 81 篇（錄取率 13.6%）為口頭發表，也是競爭激烈。本人的文章也在此 81 篇之列。但另取了 87 篇的文章，不需口頭發表，稱為 Poster，只要張貼文章，而大會也安排一個時段讓他們備詢，所收之報名費一樣，算是為了增加經費收入的手段。其論文集是收錄 LNAI 之 SCI 系列，也包含 Poster 的文章，只是稍短一些正常文章 10 頁內，而 Poster 文章 6 頁內，可是，由 LNAI 中只是將其歸為 Short Paper ，並未明顯區分其品質。並不十分公平。而或許是因 LNAI 的關係，其報名費收 US$450，算是很高，而且對作者不分學生與否，收費標準一致。另方面，其為了節省成本，竟然連光碟都不壓製，十分特別。另外，其在 8/7-8/8 的頭兩天，另辦了兩個 Workshop: PKAW(Pacific Rim Knowledge Acquisition Workshop) 、 PRIMA (Pacific Rim International Workshops on

Multi-Agents)，前者是針對「知識擷取」（收了約 24 篇正式文章）、後者是針對「多個

代理人」（收了約 40 篇正式文章及 50-60 篇 Poster），但這些並非 LNAI。而幾乎同一時間(8/5-8/8)甚至還有另一個研討會 KSEM2006(First International Conference on Knowledge Science, Engineering and Management)在舉行，也是 LNAI 系列，大會對同時參加此二研討會（PRICAI2006、KSEM2006）的作者，也祭出報名費打折來吸引，算是以一個以辦多年的亞太地區國際研討會 PRICAI2006 來拉台其自己舉辦 KSEM2006 的聲勢。

其主要三天的 technical sessions 主題包含 Intelligent Agents, Automated Reasoning, Machine Learning and Data Mining, Natural Language Processing and Speech Recognition, Computer Vision, Perception and Animation, Evolutionary Computing, Industrial Applications 等，而 Posters 也類似。議題豐富。

三、考察參觀活動(無是項活動者省略) 無四、建議 (1)國內乃至政大應可承辦此類與 LNCI、LNAI 掛勾之研討會。以提昇 SCI 之發表。 (2)由於兩岸沒有直航，轉機花費時間相當多，政府政策似可再檢討。五、攜回資料名稱及內容研討會論文集，此也為 LNAI 之系列。六、其他發表的論文如附。

(22)

主旨: [PRICAI2006] Your Paper #76 寄件者: [email protected]

日期: Fri, 5 May 2006 09:41:27 +0200 (CEST)

收件者: [email protected],[email protected], [email protected]

Dear Heng-Li Yang, Cheng-Hwa Lee,

On behalf of the PRICAI 2006 Program Committee, we are delighted to inform you that the following paper has been accepted for as a regular paper ORAL

PRESENTATION at the 9th Biennial Pacific Rim International Conference on Artificial Intelligence (PRICAI 2006):

#76:

Title: An Intelligent System for Supporting Personal Creativity based on Genetic Algorithm

The selection process was extremely competitive - 596 papers were submitted, of which we have been able to accept 84 (14.1%) as regular papers for ORAL Presentation and 100 (16.8%) as short papers for Poster Presentation.

As in the past, proceedings of the conference will be published as Lecture Notes in Artificial Intelligence (LNAI) by Springer. Manuscripts MUST conform to the requirements specified by Springer. The length of papers, excluding the title page, must be not more than 10 single-spaced, single-column pages including all figures, tables and bibliography. Fonts should not be smaller than 10pt. Further instructions regarding this can be found at http://www.springer.de/comp/lncs/authors.html.

Papers not conforming to the specified requirements will be rejected.

The reviews and comments are attached below. The Program Committee has worked hard to thoroughly review all papers submitted. Please repay their efforts by following the suggestions made when preparing the final version of your paper. The program committee reserves the right to reject your paper if you do not address the reviewer's comments satisfactorily.

To upload your final manuscript and source files please visit

http://pricai06.confmaster.net/pages/login.php?Conf=PRICAI06 and enter your login and password, and upload your compressed file in winzip format.

(23)

The final camera-ready version of your paper MUST be submitted by the 22nd May 2006 at the latest (and earlier is better).

The signed copyright form must also be RECEIVED by the 22nd May. The copyright form can be downloaded in PDF form from the Springer site on the “Information for LNCS Authors” page under “Downloads”. Alternatively, it is available via the PRICAI site at

http://www.csse.monash.edu.au/pricai06/PRICAI06/Springer%20Consent%20to%20P ublish.pdf

Once completed and signed the form may be faxed [Attention: Dr. Qiang Yang (00852) 2358-1477]. Scanned copies may be sent via email ([email protected]). *We

strongly recommend you email us the scanned form with your signature*.

Please note that it is a CONDITION OF PUBLICATION in the final proceedings that at least one author of the paper is registered, and has paid the registration fee for PRICAI 2006 by the 22nd May 2006. Note that one registration must be paid for each paper. That is, in cases where one author has more than one paper accepted by

PRICAI-06, one registration must be received for each paper. One author from each paper must attend the conference to deliver the presentation.

To register, visit http://www.csse.monash.edu.au/pricai06/PRICAI06/registration.htm and follow the links to the online registration site.

Congratulations again on your work. We look forward to meeting you in Guilin. In the meantime, if you have any questions please feel free to contact us at

[email protected]

Best regards,

Prof. Qiang Yang and Prof. Geoff Webb,

Joint Program Committee Chairs, PRICAI 2006 --- Review from Reviewer 1 ---

Originality : 7 Technical Correctness : 8 Impact : 7 Reference : 8 Presentation : 7 Relevance : 8

(24)

Overall Recommendation : 7

Confidence in Overall Recommendation : 8

-- Comments to the author(s): Some suggestions are: 1. Some abbreviations are used without being introduced, for example, MIS, EC and MBTI. 2. The introduction of chance discovery is not enough. How do social networks and small worlds relate to chance discovery? How many associations are possibly useful? These are considered essential for chance discovery and for stimulating creativity. 3. The evaluation criteria of PIEA is not clear. How is the distance function defined? What are the physical meaning and the properties of such a function and its possible values? How to define a threshold, which can stop the further execution of the genetic algorithm? 4. What is the human role in the whole process? -- Summary: The paper proposes an intelligent system for supporting personal creativity. The approach is systematic and novel. The expression is clear and logical. Remarks are pertinent. --- End of Review from Reviewer 1 --- Review from Reviewer 2 --- Originality : 8 Technical Correctness : 9 Impact : 8 Reference : 8 Presentation : 7 Relevance : 10 Overall Recommendation : 8

(25)

-- Comments to the author(s):

The acrynom IT and IGA should be spelled out first before it being refered to in acrynom (in the abstract).

Elaboration on the following "in which ways does creativity play a significant role in organizational success".

Section 2 on Related Works is disjointed among its sub-sections.

The diagram on ontology in Figure 2 need a lot more elaboration. -- Summary:

The authors are addressing a very difficult and yet upmost important research topic in Artificial Intelligence - CREATIVTY. The proposed IGA (using gene with specific meaning, and special rules) gives users stimulus during brainstorming which may inspire some different creative thinking.

--- End of Review from Reviewer 2 ---

//////////////////////////////////////////////////// Powered by ConfMaster.net

/////////////////////////////////////////////////// .

(26)

An Intelligent System for Supporting Personal Creativity

Based on Genetic Algorithm

Heng-Li Yang and Cheng-Hwa Lee

64, Sec. 2, Chihnan Rd., Mucha Dist, Taipei 116, Taiwan {yanh, 92356512}@nccu.edu.tw

Abstract. Creativity has long been recognized as vital to organizational

success. IT (Information Technology) may play a supporting role to help organizations and groups in support of creativity. However idea generation inside the personal creative process is still a black box. This motivates us to propose an intelligent system for supporting personal creativity. This study proposes a human-machine interactive mechanism based on IGA (interactive genetic algorithm) for evolution process to help individuals’ creativity. Chance discovery has been applied as the strategy in evolution process. It provides more efficient evolution. The intelligent system could bring individuals stimulus to improve personal creativity.

1 Introduction

Creativity is the implementation of a new or significantly improved idea, good, service, process or practice that is intended to be useful. Creativity has long been recognized as vital to organizational success [1,9,18]. The successful implementation of creativity is innovation. Product innovation is important to maintain a sufficient market share, similarly process innovation to produce low-cost product, and social innovation to maintain a flexible and durable organization. Amabile [1,2] provided a popular stage model of personal creative process based on previous works [21]. It includes four stages: problem identification, preparation, idea generation, and validation. At the third stage, idea generation, an individual would generate idea possibilities with a particular cognitive pathway. At this stage the creativity-relevant processes plays an important role [1,2]. IT (information technology) may play multiple supporting roles in the stage of the creative process. Proctor [17] suggested the use of a computer program in the production of creative thought. Machrone [11] indicated computer programs can provide “mind maps” or graphical representations for idea generation. Boden [3] explained computer software would facilitate the creativity of individuals by forcing the search for new ideas. Partridge and Rowe [16] indicated that computers could be enlisted to limit constraints on the work of creators to force the development of new ideas. Edwards [6] examined the impact of IT on creativity. The question arises as to how organizations can institutionalize its usage in support of creativity [5,12,19].

Expert systems and decision support systems have been applied commercially. Since we know the creativity is a most important factor for organization development,

以本體論及語意分析發展具備自動產生教材及測驗題目之線上華文知識學習系統(II)

行政院國家科學委員會專題研究計畫 成果報告

以本體論及語意分析發展具備自動產生教材及測驗題目之

線上華文知識學習系統(2/2)

研究成果報告(完整版)

中 華 民 國 96 年 09 月 22 日

行政院國家科學委員會補助專題研究計畫成果進度報告

※※※※※※※※※※※※※※※※※※※※※※※※※

※ ※

※ 以本體論及語意分析發展具備自動產生教材及 ※

※ 測 驗 題 目 之 線 上 華 文 知 識 學 習 系 統

( 2 / 2 ) ※

※ ※

※※※※※※※※※※※※※※※※※※※※※※※※

計畫類別：個別型計畫

計畫編號：NSC 95-2416-H-004-005

執行期間：

95 年 8 月 1 日至 96 年 7 月 31 日

計畫主持人：楊亨利 教授

計畫參與人員：應鳴雄

成果報告類型：精簡報告

處理方式：二年後可公開查詢

執行單位：國立政治大學 資訊管理學系

中 華 民 國

96 年 8 月 1 日

行政院國家科學委員會專題研究計畫計畫成果報告

以本體論及語意分析發展具備自動產生教材及測驗題目之線上華

文知識學習系統(2/2)

計畫編號：NSC 95-2416-H-004-005

執行期限：95 年 8 月 1 日至 96 年 7 月 31 日

主持人：楊亨利 教授 國立政治大學 資訊管理學系

計畫參與人員：應鳴雄



行政院國家科學委員會補助國內專家學者出席國際學術會議報告

An Intelligent System for Supporting Personal Creativity

Based on Genetic Algorithm

行政院國家科學委員會專題研究計畫成果報告

中華民國 96 年 09 月 22 日

※ 測驗題目之線上華文知識學習系統

計畫主持人：楊亨利教授

執行單位：國立政治大學資訊管理學系

中華民國

主持人：楊亨利教授國立政治大學資訊管理學系