• 沒有找到結果。

第一節 貝氏網路

一、簡介

本研究中,使用貝氏網路作為分類推論的工具,首先,介紹貝氏網路。貝氏 網路是機率圖形模式,可將教育測驗領域中不確定性,組合成模型(Vomlel, 2004)。使用圖形模式的優點是,它能很容易而且清楚的表達變數之間因果關係,

藉由機率來表達關係的強度,也可作為未來推論的工具。

貝氏網路是一個應用十分廣泛的工具,特別是人工智慧系統、電腦化科學、

決策學、工程學。因為貝氏網路是以非循環有向圖 (Directed Acyclic Graph, DAG) 為基礎,應用其變數之間的因果關係,與其相互影響的機率,所以,貝氏網路也 叫做貝氏信念網路(Bayesian Belief Networks)、信念網路(Belief Networks)、

因果關係網路(Casual Networks)、機率網路(Probabilistic Networks)或者為知 識地圖(Knowledge Map)(蘇俊和,民 91)。

貝氏網路將量化和質化的知識編成有意義的符號,量化的知識用條件機率表 (Condition Probability Table, CPT)表示,質化的使用有向性非循環圖編碼。

有向性非循環圖暗示變數(X )i iV之間某些條件獨立關係(Vomlel, 2004)。

貝氏網路結構圖是非循環有向圖(Directed Acyclic Graph)所構成。所謂非 循環就是無有向閉路、無有向迴路及自我迴路之圖形稱為「非循環圖(acyclic graph)」。有向圖形是由頂點(vertex)的集合。V ={v1,v2,...,vn}和有向邊(directed edge)的集合E={e1,e2,...,em}所組成,簡寫成G(V,E),令G =G(V,E)(劉湘川,民 93)。頂點是構成圖形的點,有向邊是連結節點之間具有方向性的線段。因此,一

個完整的貝氏網路結構圖,包含二個部分,分別是節點(Node)(就是頂點),及有 子代(children),後代(descendants pasts),祖先(ancestors),配偶(spouses)。

若 X→Y 則稱「X 為 Y 之親代」且稱「Y 為 X 之子代」。

=

三、建立貝氏網路模型的步驟

總結以上的觀念,要建立貝氏網路來作推論,必須取得研究資料樣本後,先 根據資料及學科專業知識的分析,建立一個完整的貝氏網路結構模型、再根據資 料來進行推論。建立模型的過程分成以下三個步驟:

(一) 設定模型中,節點的機率

對問題中,計算所有可觀測節點和未觀測節點的先驗機率及條件機率分 布。這模型中節點的連結,要符合該領域資料群體特性及專業知識。

(二) 以觀測到的資料當證據

以觀測的資料當證據,透過貝氏網路推論,獲得所感興趣的未觀測節點 後驗分布。

(三) 評估後驗機率的正確率

將模型填入這些資料適合嗎?這後驗機率對建立模型中所要知道的節 點推論是否正確?

根據以上三個步驟的檢視後,取得一個完整而且最合適的貝氏網路模型,將 可根據此貝氏網路模型來進行推論。

第二節 貝氏網路在教育測驗上的應用

教育評量專家常常能確認哪一個技能能解決什麼樣的試題,以及這些技能的 哪一個形式(pattern)產生較佳的期望效果。要將貝氏網路應用教育測驗上,必須 要事先定義,在模型中所使用的技能,錯誤類型,試題庫。例如:令Y ={Y1,....Yk} 代表受測的技能、能力、及迷思概念的集合。X =

{

X1,...,Xm

}

代表試題的集合。明 確的定義技能,以及哪些錯誤類型和試題之間,有哪些關聯。

根據許雅菱(民 94)文中提到 Mislevy, Almond & Lukas(2003)所提出的 (Evidence-Centered Design,ECD) (如圖 2-2-1)架構所定義的模型,將技能,錯 誤類型,試題關聯畫出有向性樹狀模型,模型中每個技能,錯誤類型,試題用獨 立的節點代表。

圖 2-2-1 概念評量架構的原則設計物件圖(引自 Mislevy, Almond & Lukas,2003)

以下對 ECD 架構做個簡介,以方便未來在應用上,觀念的釐清。ECD 架構從獨 立範圍和評量目的,初始分析為起始,綜述應用評量著重於二個部分。概念評量 架構(Conceptual Assessment Framework,CAF),以及評量傳送系統的

Four-Process 結構。在 CAF 模式中的物件,可以說滿足任何特別的評量,一般被

組合模式

證據模式 作業模式 呈現模式

學生模式

學生模

特徵值

證據

描述成為特定評量目的所設計。

茲將概念評量架構的四個模式(Mislevy,Almond & Lukas,2003)說明如下:

一、學生模式

定義一個或多個變數,包含的知識、技能以及我們想要測的能力。簡單的學 生模式,明確指出學生在那些領域的作業,能正確回答。較複雜的模式,則可以 說明,學生具有那幾種知識,或是不同作業結合的程度或種類。學生模式的變數,

將是圖形模式變數子集,在作業上所累積的證據。

圖2-2-2 測驗的學生模式圖(引自 Mislev et al.,2003) 左邊的圖為機率分布,單一能力變數用表示。

在受試者開始接受測驗時,學生的機率分佈狀態是不可知的。必須隨時根據 其行為來更新其狀態。當知道學生在試題的反應,然後,會視學生模式中有幾個 變數,每一個代表某些方面的知識、技能或能力。由這些變數知道,學生知識如 何明確被說明;雖不能直接觀察;但可以以所知的機率分佈來解釋;並從評量中,

藉由直接地更新機率分佈,進而更新知識。

二、證據模式

證據模式是從給定某個作業,從學生的作答反應抽取證據,進而更新學生模 式變數,以進行潛在變項的推論。證據模式包含二部分,分別為證據規則(Evidence Rules)及測量模式(Measurement Model)﹔在評量參數中,分別扮演不同的角色。

證據規則(Evidence Rules)說明,如何從受試者的作答反應中,來概述可觀 察變數。這些可觀察變數,都是工作的主要輸出成果,提供雙重資訊,可用來更

新學生模式,變數及資訊的工作信念,並可提供工作不同層次的回饋。在一可操 作的評量中,證據規則引導著反應分數的過程。重要的是證據規則為定義及概述 工作內可觀察變數中所蘊含的證據。在研究中,可觀察變數結合每一個試題,無 論其是否被正確作答。藉由這樣的規則,其值被用來比較學生的反應正確與否。

測量模式(Measurement Model),提供有關學生模式變數及可觀察變數的連結 資訊。在可操作的評量中,測量模式引導總結評分的程序。包含學生模式變數方 面,作業的累積及同化(synthesis)。

三、作業模式

描述各種試題的特徵、試題內容與每一項作業的關聯,也包含了受試者特徵 與作業間之連結(施淑娟,民93)。在證據模式中,需要的證據種類。其模式呈現 受試者本質的描述以及收集到對作業模式所反應的成果。作業模式變數包含描述 作業的特質,與呈現本質的特徵與作業成果有何關聯。

作業模式描述某個種類的試題。在作業模式和試題型態之間有一些一致處。

不同試題型式將要求不同的作業模式,因為不同變數集需要描述不同的刺激及呈 現的形式,在模組化試題參數或控制試題的選擇時,不同特徵也許是重要的。為 滿足證據模式的觀點,作業模式以CAT方式來呈現試題。

在貝氏網路的研究中,作業模式的決定是一件很重要的事情,包含要測的內 容、其內容的難易度等等,都必須先行定義出來,成為作業模式的變數。

四、組合模式

組合模式描述學生模式、證據模式及作業模式如何一起運作以構成心理計量 學為主的評量。目的在於描述如何準確地測出每個學生模式變數,及強制描述作 業如何恰當且穩定地反應出被測範圍的廣度及差異性。簡單的說,組合模式是將 所有已知的資料組成測驗,其形式可能為CAT,主要端視所要測得的能力,如CAT 所要求的是要達到某種程度的精準度﹔要測幾題?決定之後再組卷施測 (許雅

菱,民94)。

Vomlel(2003) 在學生模式下,用聯合機率分佈 P(YYYY)定義技能之間關係,使用 Almond & Mislevy(1999) 的方法,定義問題的所有機率模式為貝氏網路

( , ) ( ) ( | ) 測出的分數,可以用在已知D的條件下,模型P對數概似值(Conditional Logistic Likelihood,CLL)來呈現:

1

第三節 電腦化適性測驗理論

電腦化適性測驗是最近發展,一種應用電腦的測驗理論,何謂電腦化適性測 驗理論,Vomlel(2004)提出解釋,自動依循個別受測者的程度去測驗,稱為適性 測驗,在每次一個問題反應之後,電腦系統基於前一個問題的回答,選擇下一題,

因為這方法需要電腦作測驗管理,它常常被稱作電腦化適性測驗(Computerized Adaptive Testing,CAT)。當測驗試題的難易度能夠適合受試者能力程度時,這 種測驗試題所測量到的受試者能力最為精確。測驗的最理想的施測狀況是:能夠針 對每位受試者不同的能力程度,來提供適合個別情況的測驗方式(何明鏡,劉湘 川,郭伯臣,民 93)。

大部分 CAT 的理論基礎是試題反應理論(Item Response Theory, IRT;

Hildreth, 1989),從圖形模型(GM)的觀點來看。GM 提供有關知識與技能多方面推 論的方法,並且從複雜成績中萃取資料。簡單地合併變數對所有變化來源是很少 成功。因此,研究者必須仔細地分析這問題的結構和本質,建立更有效率的模型。

研究者有規律地使用複雜的策略去處理 IRT 模型以外,許多變化性的資源。有關 的變數可能扮演許多角色,沒有在操作上的 IRT 模型中出現。例如:在有效性研 究,組合測驗,以及建構和模型化工作。這些技術一部分由 GM 觀點描述,並且,

如何延伸到更複雜的估計情況。 (Almond & Mislevy,1999)

當工作是作學生的等第分類,其效果更有用。假如,需要測驗出有關學生更 多的資訊,在多維 IRT,數個變數被用來表示一個學生,就有問題了,因為有兩項 限制:假定,在無嚴重違反 IRT 條件機率下,工作使用,工作範圍有限;對處理 多樣的知識或技能方面的能力有限。(Almond & Mislevy,1999)

為了想仔細了解學生所犯的錯誤類型或所具有的技能,本研究採用貝氏網路 為電腦化適性測驗。貝氏網路被認為是多維 IRT 的一般化。它有兩個基本優點;

(一) 推論的過程更能反映出學生的能力,並且對已模型化的問題,提供更佳

的透視。

(二) 學生模式是能將技能之間的相依性模型化。因此,在保有原來精確度之 下,本質上,能縮短適性測驗時間。(Vomlel,2004)

Almond & Mislevy (1999) 提出在 CAT 使用圖形模式,基本觀點是將複雜貝 氏網路作為 CAT 的用途,分解成學生模式和較小的證據模式集合。每個技能Yi及 (information function ) 亂度(entropy)形成。

一個機率分布P(YYYY)的 Entropy H(P(YYYY)) 被定義成

最佳化測驗指組成測驗的每個試題,經由選擇的試題作答情形和給予的試題 過去的反應之後,是學生模式機率分布的 Entropy 最小期望值。(Vomlel, 2002)

相關文件