• 沒有找到結果。

以QTI為標準引入IRT之試題編輯工具

N/A
N/A
Protected

Academic year: 2021

Share "以QTI為標準引入IRT之試題編輯工具"

Copied!
6
0
0

加載中.... (立即查看全文)

全文

(1)

以 QTI 為標準引入 IRT 之試題編輯工具

廖元偉 趙銘

逢甲大學資訊工程研究所

wway@mail.mmlab.iecs.fcu.edu.tw mingchao@fcu.edu.tw

摘要

本文旨在開發一套數位化適性題庫編輯模組 (Adaptive Itembank Editing Module, AIEM),AIEM 的設計主要是以模組化的概念建置於開放原始碼 的學習管理平台─MOODLE。AIEM 主要針對適性 化和試題互通性為主,發展成為一套支援 IMS QTI (Question and Test Interoperability)試題交換標準 格式的匯入的編輯模組,使題庫的開發方面更為便 利。AIEM 模組的架構主要分為五個功能元件、三 個樣版、及資料庫,分別為「題庫編輯元件」、「題 庫瀏覽元件」、「試題編輯元件」、「試題瀏覽元件」、 「分析轉換元件」、「題庫資訊樣版」、「試題資訊樣 版」、及「詮釋資料樣版」。 關鍵詞:題庫編輯、IMS QTI、IRT、MOODLE

Abstract

We implement an Adaptive Itembank Editing Module (AIEM), and integrate AIEM with open source Learning Management System MOODLE(Modular Object Oriented Dynamic Learning Environment). AIEM is focus on adaptive test and interchange item that is. based on IMS QTI. We try to develop itembank editing module, which is more convenient to develop itembank. The architecture of AIEM includes five functional components, three templates, and one database that are Itembank editing component, Itembank browsing component, Item editing component, Item browsing component, Analyses and transform component, Itembank template, Item template, and Metadata template.

Keywords: itembank, IMS QTI, IRT, MOODLE

1. 前言

適性化測驗將成為未來電腦化測驗的主流,然 而適性化測驗所仰賴的是需要龐大的題庫資源。本 文主要是建置一套能夠符合 QTI(Question and Test Interoperability)標準且引入試題反應理論(Item Response Theory, IRT)觀念的數位化適性題庫編輯 模組(Adaptive Itembank Editing Module, AIEM)。 AIEM 主要是要達到以下目標:

1. 與 MOODLE ( Modular Object-Oriented

Dynamic Learning Environment)學習管理平台 結合的 Web-base 的數位化適性試題編輯模 組。 2. 以 QTI 標準的詮釋資料做為基礎結合試題反 應理論來管理試題庫。 3. 轉換試題為符合 QTI 標準格式的 XML 檔案, 並使其匯出達到試題再利用。 測驗和評量一直是教學過程中不可或缺的一 環,透過測驗的結果不但可以反應出學生對學習內 容了解的程度,提供學生自行參考或者讓教師掌握 學生的學習狀況,更可以利用測驗的結果達到能力 的判定,例如:托福考試。 電腦化測驗和傳統紙筆測驗有著許多不同特 性,然而使用電腦化測驗就字面上來說符合環保的 意識便是其中之一的優點,然而不止於此,電腦化 測驗也可節省測驗投入的成本、提供立即回饋訊 息、及提升工作效率等。電腦化測驗可在教育測驗 的領域裡,改善許多傳統測驗較難完成的工作。 在電腦化測驗中,適性測驗也是令人關注的研 究,在傳統的測驗中,相同長度與相同試題的試 卷,給予不同能力的學生進行測試,不但浪費時 間,也容易使能力較差的學生感到挫折。適性化測 驗能改善傳統測驗所造成的不便,但由於適性化測 驗需要針對不同的個人給予不同的試題,在傳統的 紙筆測驗模式中,實施適性化測驗有一定的困難所 在,較難普遍的使用適性化測驗[3]。在網際網路與 個人電腦發達的現在,適性化測驗的發展逐漸明 朗,教學者可以建立題庫讓學習者透過網際網路進 行線上測驗;而系統將會針對不同學習者的能力進 行選題,最終達到能力值的判定。 隨著數位學習的發展,學習管理系統發展也漸 趨於成熟,因受限於版權問題,AIEM 主要使用開 放原始碼的學習管理平台─MOODLE,並參照 IMS QTI 標準和 IRT 觀念。

2. 文獻探討

此小節主要探討開發 AIEM 時所相關的文獻, 分為 IMS QTI、IRT、及題庫建置流程三個部分。 2.1 IMS QTI

IMS(Instructional Management System)全名 為 全 球 學 習 聯 合 機 構 ( IMS Global Learning Consortium)是一個非營利性的組織,主要在發展

(2)

和訂定教育與學習科技相關的各項規格,已有許多 制定的規格成為公認的標準,其所發表的 QTI,主 要描述考題、試卷、及評量結果之規格,目前最新 版本是 2.0 於 2005 年一月所發佈,它是以可延伸式 標籤語言(eXtensible Markup Language, XML)來 定義相關規格內容,此份 QTI 規格制定的主要目的 在於用以解決平台之間測驗資訊交換、管理、及搜 尋之問題,並達到不同平台間評量資源能彼此交流 和共享[11]。

QTI 規格主要分為下列兩個部分:

1. ASI Model ( Assessments Sections Items Model):定義試題的類型、試題組成方式、 選題的方式、及成績計算方式等。 2. Results Reporting:定義如何呈現學習者的測 驗結果。 QTI 規格書提供了高度的延伸性(extensible) 和客製化(customizable),所以一個特定的系統可 以容易快速地適應以及應用這種規格,相反地,也 可以根據自己的需求而增加所必需的相關資訊。 2.2 試題反應理論 測驗理論(test theory)是一種解釋測驗資料間 實證關係(empirical relationships)的有系統的理論 學說,其發展測驗理論學者通常把它劃分成二大學 派:一為古典測驗理論(classical test theory),主要 是以真實分數模式(true score model)為骨幹;另 一為現代測驗理論(modern test theory),主要是以 IRT 為架構,試題反應理論始於 1990 年 Lord 發表 第一本以「試題反應理論」為名的專書後於是正式 正名,測驗學者逐漸以試題反應理論為現代測驗理 論的代表。這兩派理論目前並行流通於測驗學界, 但試題反應理論卻有後來居上,逐漸凌駕古典測驗 理論之上,甚至進而取代之勢[1]。 反應模式是以數學模式來表示受試者和能力 之間的關係。模式的分類若依據試題特徵曲線的呈 現方式,可以分為參數型試題反應模式與無參數型 試題反應模式;若以測驗資料的性質而定,也就是 以測驗計分方法的不同來分類,可分為二元計分、 多元計分、及連續資料等模式。參數型試題反應模 式較常用的是對數模式,有單參數(公式 1)、雙參 數(公式 2)、及三參數(公式 3)模式,每一種模 式是依其採用的試題參數的數目多寡來命名,適用 於二元化的反應資料:

( )

( ( ) ) i i b D b D i

e

e

p

+

=

θ θ

θ

1

……….……(公式 1)

( )

( ( ) ) i i i i b Da b Da i

e

e

p

+

=

θ θ

θ

1

……….……(公式 2)

( )

(

)

( ( ) ) i i i i b Da b Da i i i

e

e

c

c

p

+

+

=

θ θ

θ

1

1

…….…(公式 3) 其中,i=1, 2,…, n,D=1.7

θ

:受試者能力值

( )

θ

i

p

:表示具能力

θ

的受試者答對第 i 個 試題的機率

a

:表示第 i 個試題之鑑別力參數

b

:表示第 i 個試題之難度參數

c

:表示第 i 個試題之猜測參數 常數 D 是為了讓試題反應模式接近於常態肩 形模式(normal ogive model)。單參數對數模式被 視為三參數對數模式的特例,因其假設猜測參數 c 等於 0 及鑑別力參數 a 等於 1 時,兩種模式便沒 有什麼差別了[2]。 2.3 題庫建置流程 數位化適性題庫編輯模組主要是提供一個適 性題庫的發展環境,並達到試題的共享性,在傳統 適性題庫的建置過程中,試題參數的收集主要以傳 統紙筆測驗的方式為主,在[9]的討論之中,證明也 可 以 藉 由 網際 網 路 的 方式 來 分 析 試題 的 各 項 參 數,因此本題庫編輯模組,捨棄傳統試題參數的收 集方法,在設計時使用網際網路為收集試題參數數 據為導向,重新規劃試題建置流程。圖 1 為數位化 適性題庫編輯模組題庫建置流程,由上而下,步驟 一到步驟四主要是在於建立題庫的資訊,描述題庫 的建置目的,且藉由雙向細目表的建置,預先規劃 題庫的內容。若以傳統的方式收集數據,在預試前 並不需要先行建置數位化的題庫,而是在預試之後 修正參數再建置數位化的題庫,因使在本系統將在 試題編製時提供參數的輸入,用以建立適性題庫, 並藉由網際網路的途徑來進行預試。 步驟一:決定測驗的目的 步驟二:確認所要測量的學習成果 步驟三:列出教材大綱 步驟四:列出雙向細目表 步驟五:命題、建置題庫 步驟六:試題參數分析 步驟七:預試 步驟八:審題、修題 圖 1 數位化適性題庫編輯模組題庫建置流程 在編輯題庫時首先要決定測驗目的,測驗的編 製計畫會因測驗目的的不同,而有不同的考量,因 此在進行測驗的規劃時,必需清楚測驗的目標為 何,一般來說測驗的類型可分為四類,如表 1[7]。

(3)

表 1 四類成就測驗的特徵[7] 接著必需確認所要測量的學習成果,一個測驗 所測量的學習結果,應能忠實地反應教學的目標。 基於此,編製測驗時首先要選定測驗所預測量的教 學目標,其次要使陳述目標的方式適合於測驗之編 製。在分析並陳述教學目標時,最適當的參考資料 是布魯姆等人所著的「教育目標的分類」。他將教 育目標分為認知的(cognitive)、情意的(affective)、 及動作技能(psychomotor)三大領域。其中認知領 域主要是關於智性的學習結果,情意領域是有關興 趣和態度的目標,動作技能顧名思義就是有關動作 技能的目標。在認知的領域當中又可分為六個主要 的範圍,分別是知識、理解、應用、分析、綜合、 及評鑑,由簡單趨向複雜。 雙向細目表的目的在於發現學習結果和課程 內容的關係,並訂出各不同領域之相對比重,以確 保測驗能測量到我們所預期之學習結果和教材的 代表性樣本,再依據雙向細目表來編製測驗試題, 配合特定的學習結果,並考慮到測驗的難度。

3. 適性題庫編輯模組分析

本模組藉由元件化的概念,試著設計一個數位 化適性題庫編輯模組,提供給需要建置適性題庫的 人員一個便利的工具,並結合試題的標準 IMS QTI 達到試題的再利用。 3.1 系統執行環境 圖 2 為 MOODLE 的系統模組[6],在 MOODLE 平台裡主要有三大功能:網站管理、學習管理、及 課程設計。然而每項功能都是由許多模組所組成, 例如:在課程設計當中具有作業模組、課程模組、 及測驗模組等,本模組主要是配合課程設計功能裡 的測驗模組進行設計。 圖 2MOODLE 系統模組[6] 圖 3 為系統環境示意圖,伺服器是指一般架設 網頁的電腦,MOODLE 是指架設在伺服器之上的 學習管理平台,透過伺服器發佈於網際網路。教師 根據教案的教學目標來設計試題,然後再透過網際 網路與 MOODLE 裡的課程設計功能裡的測驗模組 進行編輯試題的工作,編輯結束後再利用 MOODLE 和伺服器進行溝通將資料儲存在伺服器裡的資料 庫當中。管理員(系統維護員)透過網際網路登入 到 MOODLE 學習管理平台之中,對於系統或題庫 進行管理的動作。 圖 3 系統環境示意圖 根 據 一 些 關 於 題 庫 編 輯 系 統 的 文 獻 [4][5][8][10]。歸納題庫編輯系統的功能必需達到以 下三點功能: 1. 試題的編輯:透過題庫編輯系統或工具,以文 字、圖形、聲音、動畫、及影片等方式來編輯 試題,並提供試題參數的輸入。 2. 試題再利用:提供匯出匯入檔案的功能,轉換 試題格式,達到試題再利用。 3. 審題和修題:當完成預試,搜集到受試者的反 應之後,可以藉由系統進行試題數據的分析, 並修改試題題目或是試題參數。

(4)

3.2 模組架構 圖 4 為 AIEM 的模組架構圖,根據主要分為五 個功能元件、三個樣版、及資料庫,分別為「題庫 編輯元件」、「題庫瀏覽元件」、「試題編輯元件」、「試 題瀏覽元件」、「分析轉換元件」、「題庫資訊樣版」、 「試題資訊樣版」、及「詮釋資料樣版」。 以下針對各個模組與樣版做進一步的描述。 1. 題庫編輯元件:此元件主要負責題庫的新增、 修改、及刪除,包含了題庫的使用者介面,在 使用者點選選擇後針對所選進行動作,在新增 題庫時會先將題庫樣版匯入,提供使用者輸入 題庫的相關資訊,然後載入詮釋資料樣版,形 成介面供使用者輸入,接著再將資料匯入資料 庫儲存。在修改時會先呼叫題庫瀏覽元件進行 題庫的列表,然後根據使用者的選擇將題庫的 資訊從資料庫中提出再匯入題庫樣版,供使用 者修改,在修改完成後更動資料庫中的資料。 2. 題庫瀏覽元件:此元件主要的功能就是針對題 庫進行列表和基本的關鍵字搜尋題庫,在使用 者選擇瀏覽題庫後,可選擇列表或者是搜尋, 在選擇列表後,題庫瀏覽元件會將資料庫中的 資料提出並依照格式進行列表,若選擇搜尋, 則根據題庫樣版詮釋資料的資訊,提供關鍵字 的搜尋並回報搜尋的結果。 3. 試題編輯元件:此元件主要的功能為新增試 題、修改試題、及刪除試題並包含試題編輯的 介面,此模組一開始會載入試題樣版,形成介 面供使用者輸入試題,在輸入完試題後再載入 詮釋資料樣版,形成詮釋資料輸入的介面,然 後再匯入至資料庫儲存。若使用者選擇修改試 題,則會先行執行試題瀏覽元件,進行列表或 搜尋,在針對使用者的選擇,從資料庫中提取 資訊,與樣版結合形成介面提供給使用者修 改。 4. 試題瀏覽元件:此元件主要進行試題的列表和 搜尋,選擇列表後則直接從資料庫中提取資 料,根據試題樣版資訊將資料列出。若使用者 選擇搜尋,則會提供關鍵字的搜尋,並根據試 題樣版和詮釋資料的樣版的資訊進行資料庫 搜尋,在提供列表給使用者。 5. 分析轉換元件:此元件主要負責題庫的匯出與 匯入。在此模組中,將會先行執行題庫瀏覽元 件,在使用者選擇題庫再從資料庫中提取,並 根據 QTI 的格式進行轉換。若選擇匯入,則 會提供檔案上傳的介面,在檔案上傳後進行分 析,將資料轉換後匯入資料庫。 6. 題庫資訊樣版:此樣版主要是提供題庫的相關 資訊,例如:題庫編號、題庫名稱、及題庫描 述等。 7. 試題資訊樣版:此樣版主要具有兩個部份的資 料,分別為試題的類型和及其對應的試題資 訊,例如:選擇題、多選題、試題層次、試題 反應模式、難度參數、鑑別度參數、及猜測度 參數等。 8. 詮釋資料樣版:此樣版主要根據 QTI 的詮釋 資料規定製作。 圖 4 AIEM 模組架構圖

4. 系統實作

本節主要是描述題庫的相關實作,包括題庫建 置和試題產生兩個部分,在 UML 的圖形中,順序 圖主要是描述訊息的傳送、執行時間、及模組或元 件的關係,因此接下來的小節當中,將以順序圖和 系統實際執行畫面來描述數位化試題編輯模組。 題庫的操作主要是透過題庫編輯元件來進行 控制,在程式的部分,預先建立題庫的資訊樣版和 詮釋資料樣版,圖 5 為新增題庫的順序圖,藉由圖 5 可以看出,在題庫編輯元件開始進行時,首先呼 叫題庫資訊樣版之後再行載入,並形成介面提供輸 入相關的設定,接著會在進行呼叫,所呼叫的變數 已更改為詮釋資料的樣版,並載入詮釋資料的樣 版。 圖 5 新增題庫順序圖 圖 6 為試題資訊的輸入頁面,頁面中主要提供 題庫編號、題庫名稱、測驗目標、題庫簡介、及雙 向細目表的相關資訊。在題庫編號部分將由系統依 據資料庫的資料順序產生編號;題庫名稱提供一個

(5)

針對題庫簡單的命名,例如:作業系統期中考;測 驗目標提供對測驗的整體目標作一簡單的描述,例 如:此份試題為作業系統的種類和功能,藉由測驗 希望能使學生了解到自己對作業系統歷史的了解 程度;雙向細目表的欄位上,可以透過編輯工具中 的功能「表格」來達到繪製雙向細目表。 圖 6 題庫資訊輸入頁面 圖 7 為詮釋資料樣版載入後的執行結果,主要 提供八大項的標籤輸入,IMS QTI 的詮釋資料主要 是參照 IEEE LOM,取其中八大項的標籤。 圖 7 詮釋資料輸入頁面 試 題 的 產 生 主 要 是 利 用 試 題 編 輯 元 件 來 實 踐,如圖 8 所示,在新增試題時必需先行選擇試題 類型如圖 9,依據所選擇的試題類型動態的呼叫並 載入試題資訊樣版,如圖 10 為是非題樣版執行後 的畫面,然在再呼叫並載入詮釋資料樣版針對試題 填入相關的詮釋資料,詳細的詮釋資料樣版參照圖 7。 圖 8 新增試題順序圖 圖 9 選擇試題類型 圖 10 是非題試題資訊 表 2 為各類型試題所需項目,此表針對各種試 題作分析,將試題可能的項目均考慮進來,並輔以 試題參數用以適性測驗施測時預先填入試題參數。

(6)

表 2 各類型試題樣版所需項目

5. 結論

此章節將針對數位化題庫編輯模組的不足和 缺陷來規劃未來題庫編輯模組可以擴充的方向,詳 細內容如下: 1. 題庫系統試題的再利用:在題庫系統中,分析 時並未考慮題庫與題庫之間試題的再利用,若 要進行試題的再利用,需要先行將試題匯出, 然後在匯入題庫之中,相當的不便,未來可以 規劃試題的移動功能,也就是拖拉放(drag and drop)的功能,在新增或者是修改時能夠直接 將別的題庫裡的試題複製一份到正在編輯的 題庫。 2. 試題的重組:在目前題庫編輯模組中,並未考 量到試題的重組,在未來的發展方向可以考慮 增添此項機制,使用者只需要輸入測驗的目 標,然後可以藉由系統資料庫的搜尋和重組機 制,呈現新的試題給使用者,若要增加此項機 制,必需先行建立測驗領域的知識本體,並將 試題拆解存入各部分之下,若要重組試題,只 需要到各個分類內抽取試題的題目或者是選 項,就可以達到重組的功能。 3. 適性試卷的編製:在適性試卷編製時,需先制 定需要的目標函數,然後針對此目標函數選出 能夠最接近目標函數的試題,在試題的選擇 時,需要大量的試題訊息[3],現可以仰賴電 腦的輔助,達到適性試卷的編製。 4. 試題反應模式的編輯:就目前的試題反應理論 來說,存在著三種試題反應的模式,分別為單 參數、雙參數、及三參數,但是除了這三種的 試題反應模式之外,還是有一些與這三種不同 的反應參數,在未來可以針對此項發展,讓題 庫系統的使用者能進行反應模式的編輯,並且 能夠設定相關的參數值,增加題庫系統的靈活 度。

參考文獻

[1] 余民寧。1991。試題反應理論的介紹(一):測 驗理論的發展趨勢。研習資訊,8 卷 6 期,第 13-18 頁。 [2] 余民寧。1992。試題反應理論的介紹(三):試 題反應模式及其特性。研習資訊,9 卷 2 期,第 6-10 頁。 [3] 余民寧。1993。試題反應理論的介紹(十二): 電腦化適性測驗。研習資訊,10 卷 5 期,第 5-9 頁。 [4] 何榮桂。1991。電腦化題庫設計的基本架構。教 育研究雙月刊,20 輯,第 21-26 頁。 [5] 何榮桂。2005。數位化題庫之概念架構。國家菁 英季刊,1 卷 4 期,第 149-158 頁。 [6] 陳慶帆、許意苹、林敏慧。2005。MOODLE 教 學平台多媒體評量編輯系統之探討。台灣網際網 路研討會,台中。 [7] 鄒慧英。2002。測驗與評量─在教學上的應用。 洪葉文化事業有限公司,第 58 頁。

[8] Eduardo Guzmn and Ricardo Conejo, “A brief introduction to the new architecture of SIETTE,” Adaptive Hypermedia 2004 Conference, Berlin, 2004.

[9] Eduardo Guzmn and Ricardo Conejo, “Self-Assessment in a Feasible, Adaptive Web-Based Testing System,” IEEE Transctions on education, Vol. 48, NO. 4, 2005.

[10] H. Barbosa Len, H. Rego1, T. Moreira1, and F. Garca Pealvo1, “A model for online assessment in adaptive e-learning platform,” The 3rd International Conference on Multimedia and Information & Communication Technologies in Education, Badajoz, 2005.

[11] Smythe, Colin and Roberts, P., “An Overview of the IMS Question & Test Interoperability Specification,” The fourth international computer assisted assessment conference, Loughborough University, 2000.

數據

表 1 四類成就測驗的特徵[7]  接著必需確認所要測量的學習成果,一個測驗 所測量的學習結果,應能忠實地反應教學的目標。 基於此,編製測驗時首先要選定測驗所預測量的教 學目標,其次要使陳述目標的方式適合於測驗之編 製。在分析並陳述教學目標時,最適當的參考資料 是布魯姆等人所著的「教育目標的分類」。他將教 育目標分為認知的(cognitive) 、情意的(affective) 、 及動作技能(psychomotor)三大領域。其中認知領 域主要是關於智性的學習結果,情意領域是有關興 趣和態度的目標,動作技能
表 2 各類型試題樣版所需項目  5. 結論  此章節將針對數位化題庫編輯模組的不足和 缺陷來規劃未來題庫編輯模組可以擴充的方向,詳 細內容如下:  1.  題庫系統試題的再利用:在題庫系統中,分析 時並未考慮題庫與題庫之間試題的再利用,若 要進行試題的再利用,需要先行將試題匯出, 然後在匯入題庫之中,相當的不便,未來可以 規劃試題的移動功能,也就是拖拉放(drag and  drop)的功能,在新增或者是修改時能夠直接 將別的題庫裡的試題複製一份到正在編輯的 題庫。  2

參考文獻

相關文件

The short film “My Shoes” has been chosen to illustrate and highlight different areas of cinematography (e.g. the use of music, camera shots, angles and movements, editing

2   OLE, an essential component of the senior secondary curriculum, consists of five areas, i.e. Moral and Civic Education, Community Service, Career-related Experiences,

1 The five components of OLE are: Aesthetic Development, Physical Development, Moral and Civic Education, Community Services, and Career-related Experiences.. learning

 The TRG consists of two components: a basic component which is an annual recurrent cash grant provided to schools for the appointment of supply teachers to cover approved

Using a one-factor higher-order item response theory (HO-IRT) model formulation, it is pos- ited that an examinee’s performance in each domain is accounted for by a

The ES and component shortfall are calculated using the simulation from C-vine copula structure instead of that from multivariate distribution because the C-vine copula

 The TRG consists of two components: a basic component which is an annual recurrent cash grant provided to schools for the appointment of supply teachers to cover approved