多重貝氏網路在教育測驗上的應用

全文

(1)國立台中教育大學數學教育學系碩士班碩士論文. 指導教授：郭伯臣博士. 多重貝氏網路在教育測驗上的應用. 研究生：謝典佑. 撰. 中華民國九十五年六月.

(2) 誌謝. 本論文能夠順利完成，真的要感謝許多人的幫忙，無論是在學業上、精神上與生活上，他們都給予我很多的指導與協助，讓我在兩年研究生活中，不但能夠在學業上取得碩士學位，更在生活態度上學得寶貴的經驗。首先是我的指導教授郭伯臣教授，在這段時間的由於他的悉心指導與協助，我才能如期完成論文順利畢業，十分感謝他的栽培與指導。另外也要感謝台灣師範大學林世華教授與亞洲大學劉湘川教授和台中教育大學許天維、陳桂霞、林原宏、胡豐榮等多位教授在各方面的協助與指導，讓我受益良多！還要感謝晉民助教在各方面的協助和指導，讓我在最後關頭能順利通過，並且心無旁鶩的準備口試以及相關準備事宜，真是非常感謝！此外，我還要謝謝研究室的學長群世勳、垣圻、俊儀等多位學長及數研二同學彥鈞、育政等多位同學一同陪我渡過這兩年的快樂時光，並且感謝他們這兩年來的陪伴與招待，希望我沒帶給他們麻煩。當然啦!我也要感謝一群可愛的學弟妹們雅媛、珮璇、育隆、鈺卿、智為，在過程中給予我的打氣與鼓勵，這些都是造就我成功的一個原因之一。我也在此祝福你們一定都可以完成自己的心願，加油囉！最後是感謝我的女朋友，雖然她也在唸碩士班，但卻全心全意支持我，給予我生活、事業與課業三方面的幫助外，更是在精神與其他層面上給予我相當大的助益。此外還要感謝我與我女朋友的家人，在這段期間對我的包容與鼓勵，讓我可以無後顧之憂的完成學業，也讓我在不如意的時候，總有一個溫暖的地方可以依靠，沒有他們在各方面的協助與支持，今天我不會這樣順利完成碩士論文。總而言之，謝謝大家的幫忙，使我能順利畢業！感謝各位！.

(3) 多重貝氏網路在教育測驗上的應用. 謝典佑國立台中教育大學數學教育研究所. 摘要本研究探討單一貝氏網路模組和多重貝氏網路模組在不同融合演算法下，對於學生錯誤類型及其技能分類之辨識率的比較，並經由實證驗證，來歸結多重貝式網路模組於不同融合演算法下其辨識率確實有大幅的提升，此一結果對於建構電腦化適性測驗系統時有實質上的幫助。本研究的結果發現，在多重貝氏網路融合的演算過程中，以結構融合法的效果最佳。. 關鍵詞：關鍵詞：單一貝氏網路結構、單一貝氏網路結構、多重貝氏網路結構、多重貝氏網路結構、融合演算法.

(4) Modeling Students' Learning Bugs and Skills Using Combining Multiple Bayesian Networks. Tien-Yu Hsieh Department of Mathematics Education National Taichung University. Abstract The goal of this paper is trying to develop fusion methods for combining multiple Bayesian networks and to obtain better classification results than single Bayesian networks. Six fusion methods, Maximum, Minimum, Average, Product, Majority Vote and Fusion Structure were proposed and evaluated based on educational test data. The results show that the proposed fusion methods, Structure Fusion, with dynamic cut-point selection can improve the classification accuracy.. Keywords: single Bayesian networks、、multiple Bayesian networks、、fusion method.

(5) 目次中文摘要 ………………………………………………………i 英文摘要 ……………………………………………………...ii 目次 …………………………………………………………..iii 表次 …………………………………………………………..vi 圖次 …………………………………………………………...x 第一章. 緒論 ………………………………………………...1. 第一節研究動機 ..…………………………………………………..1 第二節研究目的 ..…………………………………………………..2 第三節論文架構 ..…………………………………………………..3 第四節名詞解釋 ..…………………………………………………..3 第五節研究範圍與限制 ……………………………………………5. 第二章文獻探討 …………………………………...………6 第一節貝氏網路 ……………………………………………………6 第二節貝氏網路在教育測驗上的應用 …………...………….……9 第三節多重辨識器結合演算法 …………………...…..………….15 第四節辨識器融合策略 …………………………….…………….19 第五節辨識器選擇策略 ……………………………….………….24. 第三章研究方法 ……………………………...…………..26.

(6) 第一節資料分析 ……………………………………..……………26 第二節演算法實作 ……………………………………..…………36 第三節研究工具 ……………………………………………..……40 第四節評估方式 ……………………………………………..……40 第五節研究流程 ……………………………………………..……41. 第四章研究成果 ………………………………………….43 第一節單一貝氏網路的辨識結果 ………………………………..43 第二節多重貝氏網路融合方式的辨識結果 ……………………44 第三節綜合評估 …………………………………………………..48. 第五章結論與建議 ……………………………………….…50 參考文獻 ………………………………………………….…51 中文部分 …………………………………………………………....51 英文部分 ……………………………………………………………51. 附錄 …………………………………………………...……..54 附錄一數學測驗卷 ……………………………………………..…54 附錄二節點流水號與原始編號轉換表 …………………………..57 附錄三單一貝氏網路靜態決斷值下的各節點辨識效果 ………..58 附錄四單一貝氏網路最佳靜態決斷值下的各節點辨識效果 …..73 附錄五單一貝氏網路動態決斷值下的各節點辨識效果 ..………76.

(7) 附錄六多重貝式網路融合演算法的所有決斷值下的辨識效果 …………………………………………….……………....81 附錄七多重貝式網路融合演算法的最佳靜態決斷值下的辨識效果 ………………………………………………………..……99 附錄八多重貝式網路融合演算法的動態決斷值下的辨識效果…………………………………………………….………..102.

(8) 第一章緒論第一節研究動機九年一貫施行後，對於教師在教學上面衝擊最大的問題便是時間上面的不足！除各領域的教學時間上的考量外，若要再對學生考量其個別差異來給予不同教學進度甚至是不同補教教學，幾乎成了不可能的任務。然而在這樣的情況之下，身為教師並不應該因為時間的不足來放棄因材施教的教育理念！因此就目前現況的做法是，老師人工對學生進行所謂個別差異的認定，認定後再由老師自身找課餘時間甚至是下課時間一一作個別化的補救教學活動。在這樣的情況下，教師工作量大增，而導致教學品質不佳，甚至毫無將學品質的情況。所幸藉由資訊科技的進步，利用資訊科技來對學生作補教教學之分類，甚至對學生作一對一的補教教學成為一件可行的、有利的替代方案。而在這樣得技術演變過程中，最重要的步驟在於將傳統的學生錯誤類型分類方式轉變為電腦自動化診斷學生錯誤類型的方式。就前者而言，施測人員會先針對所要診斷的項目來設計題目，爾後讓受測人員參與測驗，並依受測人員所得的測驗結果一一進行人工方式的診斷。其診斷的流程不但包含診斷出受測人員有何基本能力外，更要診斷出其具有哪些錯誤類型，因此比起單純依施測結果打分數或是作等第的分類來得費時、費力！就後者而言，藉由電腦科技的幫助，將原先的測驗診斷之問題轉化為電腦自動化的診斷模式，並將原本需要人工的部分全部藉由該模式來進行自動化分析診斷、預測學生的基本能力及錯誤類型的系統，以方便進行適性化補救教學的參考！貝氏網路(Bayesian network)近年來相當熱門的應用在一些專業領域上，舉凡是資訊科學的人工智慧，醫學的疾病診斷，體育的足球得分預測，都能利用貝氏網路來達成。就其應用的領域的特性來看，和教育環境中學生錯誤類型的診斷，其有非常相似之處，兩者都有不確定性的因素成分，以及變項多的特性，所以應用貝氏網路於教育測驗上是有其潛在的可行性。而且，國外也有測驗機構，用此方式於教育測驗上。許 1.

(9) 多心理計量的先進亦以此統計方法應用於教育評量，這些文獻均顯示貝氏網路應用在教育評量有許多優勢(Mislevy, 1995, 1998; Almond, 2003)。然貝氏網路本身為一統計機率模型(probability model)，因此藉由該模式所建構出來的辨識系統，就有辨識率高低問題的考量！因此本研究將提出多個融合演算方法 (fusion method)來將多個可能成立的單一貝氏網路結構圖(single Bayesian network architecture)作融合，並比較在單一貝氏網路結構的情況下，和多重貝氏網路結構 (multiple Bayesian network architecture)融合的情況下辨識效能改善的狀況。並藉由實驗驗證來歸結出多重貝氏網路結構於不同融合演算法下其辨識率確實有大幅的提升，該方式將對於建構電腦化適性測驗系統時有實質上的幫助。. 第二節研究目的. 基於上述動機，本研究將探究多重貝氏網路結構於不同融合演算法下其辨識效能是否能改善單一貝氏網路結構下的辨識效能提升之瓶頸。為了要達成這樣的目標，本研究訂的研究目的如下所示：一、探討單一貝氏網路在動態決斷值效能提升的可行性。二、比較單一貝氏網路在動態決斷值和最大(maximum)融合演算法的效能。三、比較單一貝氏網路在動態決斷值和最小(minimum)融合演算法的效能。四、比較單一貝氏網路在動態決斷值和乘積(product)融合演算法的效能。五、比較單一貝氏網路在動態決斷值和平均(average)融合演算法的效能。六、比較單一貝氏網路在動態決斷值和投票(majority vote)融合演算法的效能。七、比較單一貝氏網路在動態決斷值下和結構融合(architecture fusion)演算法的效能。八、比較多重貝氏網路結構融合演算法對於單一貝氏網路辨識率效能。. 2.

(10) 第三節論文架構. 本篇論文分成五個章節，並藉由實際驗證的方式來找尋最佳的多重貝氏網路結構之融合演算法的應用，用以突破單一貝氏網路結構辨識率無法提升的瓶頸，而歸結出最佳的融合演算方式。第一章部分，說明本研究的動機、研究目的以及整篇論文的基本架構。第二章部分，就貝氏網路理論、貝氏網路如何應用在教育測驗上的應用、多重辨識器結合演算法的理論架構等，進行理論和技術的探討研究。第三章部分，說明研究的方法、進行研究的步驟、研究的硬體設備、軟體等。第四章部分，呈現經實際驗證之後的結果，提出探討、比較。第五章部分，就實際驗證後的結果，提出結論與發現，並對未來研究方向及改善做出建議。. 第四節名詞解釋. 針對本研究中常見的名詞，釋義如下﹕ 一、貝氏網路貝氏網路是一種機率圖形模式，模式中各個變項代表是一個事件，用有向箭頭連結各個變項，形成貝氏網路圖﹔在給定證據之後，利用貝氏定理的先驗機率和聯合機率，推論後驗機率(posterior probability)，用以了解事件發生的機率有多大。. 二、分類決斷值由於經貝氏網路推論所得的後驗機率，是分布在 0 和 1 之間的小數，所以我們選定一個純小數值做為決斷值，用來決定某種狀態的有無。在決斷值以上便認定該機率值足以使該事件具有某種的狀態；反之則認定該機率值不足以使該事件具有某種的狀 3.

(11) 態。由於本研究室以二元計分為導向，因此狀態只分成有和無！. 三、動態分類決斷值經貝氏網路推論所得的後驗機率，各節點分別選定各自的分類決斷值，用來決定各自狀態的有無。此分類決斷值形成的集合稱為動態分類決斷值。. 四、結合演算法(combination method) 將多個單一貝氏網路結構所得的電腦預測值視為另一種結構的輸入值。而該結構再利用特定的演算法將這多個輸入值經過不同的演算程序進行運算，並於最後輸出一個最終值。之後，我們便將這一個輸出值視為我們的最後的預測值，並於進行評估或辨識效能檢定。上述所用的演算程序即是結合演算法。而就其結合方式的不同有可以將其分為兩種主要策略(strategy)，其中最為常見的有：選擇演算法(selection method)、融合演算法(fusion method)。. 五、融合演算法(fusion method) 在多重貝氏網路結構結合的過程中，每一個單一貝氏網路結構都是為一位專家。因此就單一節點在進行辨識時，每一位專家均會對該節點產生決定性的影響；而不會將這一決定性影響全由一位專家來決定。經過這樣的結合方式，最終輸出結果即是多重貝氏網路結構所融合後的結果。. 4.

(12) 第五節研究範圍與限制. 本研究主要探究多重貝氏網路結構融合演算方式來突破單一貝氏網路結構於辨識效果提升之瓶頸。因此整篇論文以評估、發展演算法則並尋找最佳演算方式來作為本研究之主要目的。而在研究過程主要是以實證方式作為評估出最佳演算方式的方法。然因為研究者資源不足的考量僅收集自江存卿(2006)所建構的單一貝氏網路結構來加以實証及論証。換句話說，在這樣的情況下所推論出來的結果可能無法做廣義的推論。另外因為貝氏網路結構是依各知識領域所建構出來的。若要進行不同單元或是不同知識領域的推論，則必須對網路結構重新建構！在這樣的情況下，無法做廣大的推論！. 5.

(13) 第二章文獻探討第一節貝氏網路一、貝氏網路的概念本研究中，使用貝氏網路作為分類推論的工具，首先，介紹貝氏網路。貝氏網路是機率圖形模式，可將教育測驗領域中不確定性，組合成模型(Vomlel, 2004)。使用圖形模式的優點是，它能很容易而且清楚的表達變數之間因果關係，藉由機率來表達關係的強度，也可作為未來推論的工具。然依貝氏網路的應用及其性質在各文獻中其命名也有所差異，比方說：貝氏信念網路(Bayesian belief networks)、信念網路(Belief networks)、因果關係網路(casual networks)、機率網路(probabilistic networks)或者為知識地圖(knowledge map)(蘇俊和， 2002)等等。而這也突顯貝氏網路其應用在不確定性及其各知識領域的證據。貝氏網路結構中具備該知識領域的量化和質化的知識，並以有意義的符號來加以呈現。量化的知識藉由條件機率表(condition probability table, CPT)表示，而質化的知識是藉由有向性非循環圖的編碼。有向性非循環圖暗示變數 ( X i ) iÎV 之間某些條件獨立關係(Vomlel, 2004)。換句話說，貝氏網路結構圖是非循環有向圖(directed acyclic graph)所構成。所謂非循環就是無有向閉路、無有向迴路及自我迴路之圖形稱為「非循環圖(acyclic 。有向圖形是由頂點(vertex)的集合。 V = {v1 , v 2 ,..., v n } 和有向邊(directed edge) graph)」 ®. ®. ®. 的集合 E = {e1 , e2 ,..., em } 所組成，簡寫成 G (V , E ) ，令 G = G (V , E ) (劉湘川，2004)。換句話說，一個完整的貝氏網路結構圖，包含二個部分，分別是節點(node；頂點)、有向邊。在貝氏網路中，節點對應於有限範圍中的任意的變數，例如：本研究中，節點代 6.

(14) 表技能，錯誤類型，試題。在貝氏網路結構中，節點間的連結，用有向邊連結，而有向邊的有無即代表其節點之間的關係，是否為條件相依或條件獨立的情形﹔節點連結表示條件相依。此外可以藉由所謂的親屬關係―『父節點』、『子節點』來說明節點和節點之間的關係。我們以圖 2-1 來加以表示他們之間的關係。. 父節點. 子節點. 圖 2-1. 親屬關係結構. 二、貝氏定理貝氏網路根據貝氏定理建立的，在本節內對貝氏定理簡介。所謂貝氏定理如式子 (2.1)所示。 P(A|B) =. P(B|A)P(A) P(B). (2.1). 條件機率 P(B|A)表示給予 A 的條件之下，B 發生的機率。機率 P(A)和機率 P(B) 表示 A 和 B 各自發生的機率。為了明白說明其運作過程，我們以多節點的貝氏網路來做說明，首先令 U = ( X 1 , X 2 ,..., X n ) 為所有變數的範圍，其聯合機率 P( X 1 , X 2 ,..., X n ) 為 P(U ) ， P (U ) 可以從貝氏網路的條件機率中被明確的求出，只要在 U 中條件獨立依然成立，聯合機率分佈 P (U ) 即為所有的條件機率的乘積，其數學式子如下(Lee, 2003)：. 7.

(15) P(U ) = P( X 1 , X 2 ,..., X n ) n. = Õ P ( X i | X 1 , X 2 ,..., X i -1 ) i =1. n. = Õ P( X i | pa ( X i )) i =1. 因為 P( X i | X 1 , X 2 ,..., X i -1 ) = P( X i | pa ( X i )) 在此 pa ( X i ) 為 X i 的父節點。以圖 2-2 為多節點貝氏網路結構的例子。 X 1 、 X 2 是 X 3 的父節點，其條件機率為 P( X 3 | X 1 , X 2 ) 。貝氏網路全部節點的聯合機率如式子(2.2)所示。 P(X1, X2, X3) = P( X1)P( X2 )P(X3 | X1, X2). (2.2). 因此，若已知觀測節點 X 3 ，可以依貝氏定理推論，求其餘節點發生的條件機率，如式子(2.3)所示。 P( X 1 , X 2 | X 3 ) =. P( X 1 , X 2 , X 3 ) P( X 3 ). X1. X2. X3. 圖 2-2. 多節點貝氏網路結構圖. 三、建立貝氏網路結構的步驟 8. (2.3).

(16) 總結以上的觀念，要建立貝氏網路來作推論，必須取得研究資料樣本後，先根據資料及學科專業知識的分析，建立一個完整的貝氏網路結構、再根據資料來進行推論。建立模型的過程分成以下三個步驟： (一) 計算結構中各節點的機率值計算所有可觀測節點和未觀測節點的先驗機率及條件機率分布。這結構中節點的連結，要符合該領域資料群體特性及專業知識。 (二) 藉由觀測到的資料當證據以觀測的資料當證據，透過貝氏網路推論，獲得未觀測節點後驗機率。 (三) 評估後驗機率的正確率將模型填入這些資料適合嗎？這後驗機率對建立模型中所要知道的節點推論是否正確？根據以上三個步驟的檢視後，取得一個完整而且最合適的貝氏網路模型，將可根據此貝氏網路模型來進行推論。. 第二節貝氏網路在教育測驗上的應用. 教育評量專家常常能確認哪一個技能能解決什麼樣的試題，以及這些技能的哪一個樣式(pattern)產生較佳的期望效果。要將貝氏網路應用教育測驗上，必須要事先定義，在模型中所使用的技能，錯誤類型，試題庫。例如：令 Y = {Y1 ,....Yk }. 代表受測. 的技能、能力、及迷思概念的集合。 X = {X 1 ,..., X m } 代表試題的集合。明確的定義技能，以及哪些錯誤類型和試題之間，有哪些關聯。根據許雅菱(2005)文中提到 Mislevy, Almond, 與 Lukas(2003)所提出的 9.

(17) (evidence-centered design, 簡稱 ECD) (如圖 2-3)架構所定義的模型，將技能，錯誤類型，試題關聯畫出有向性樹狀模型，模型中每個技能，錯誤類型，試題用獨立的節點代表。. 組合模式. 學生模式. 證據模式測量模式. 作業模式. 呈現模式. 證據規則特徵值. 圖 2-3. 概念評量架構的原則設計物件圖(引自 Mislevy, Almond, & Lukas, 2003). 以下對ECD架構做個簡介，以方便未來在應用上，觀念的釐清。就其四個模式進行說明與分析，概念如下：一、學生模式(student model) 在學生模式中一個相當重要的問題就是要如何推估岀受試者的能力。這些能力可以包含一種知識、技能、或態度。該模式中的變數能定義一個或多個的變數，用來代表施測者在評量中欲推論的能力，也就是說變數代表在評量中受試者的某種知識、技能、或態度等等；以及評量的設計者需要做的推論，例如決定、報告、診斷性回饋或忠告。在本研究中簡單的學生模式明確指出學生在那些領域、單元或學習目標的作業能答對；較複雜的模式則可以說明學生在該學習領域或能力指標中知識或不同作業結合的程度表現。而作業模式裡所累積的證據將可提供證據來當成推論學生模式的變 10.

(18) 數集。如之前所言在學生模式中有一個相當重要的問題，就是要如何推估岀受試者的能力，因此在定義學生模式變數之前必須先明確訂定其推論的目的。在開始擬定評量時，研究者須清楚掌握有關於學生的變數的資訊，藉此資訊才能使推論的結果更為明確精準。因此，研究者需要透過教學經驗的交流或資料分析的程序來逐步收集證據以及結合新的資訊來建立其信念。在本研究中，將使用貝氏網路的架構來呈現學生模式。. 學生模式. 證據規則. 學生模式變數. 條件機率分布. 可觀察變數 (反應組型). 圖2-4. 學生模式中以機率來解釋證據模式中的可觀察變數(改編自Mislevy, et. al., 2003). 二、證據模式(evidence model) 證據模式是在描述給定受試者某個作業的過程中，受試者的表現能提供資訊並更新學生模式變數的機率分佈。在教育評量中的證據模式則描述如何從學生所完成的作業中取得可推論學生模式變數的證據。在本研究中可觀察的變數即為作業表現選項中的特徵。圖 2-5 說明作業表現及可觀察變數之間的關係即為證據規則。研究者從受試者所呈現的作業特徵中得到證據規則，並以可觀察變數來概述(summarize)這些證據。. 11.

(19) 測量模式. 證據規則. 作業表現. 證據規則. 可觀察變數 (反應組型). 圖 2-5. 作業表現及可觀察變數的關係(改編自 Mislevy, et. al., 2003). 證據模式可包含二個部分，分別為證據規則及測量模式。證據規則從受試者所完成的作業成果中去描述觀察的變數如何概述出受試者的真正表現，這些可觀察的變數值主要是來自作業的輸出結果。它們可提供二種資訊，其資訊可被用來更新學生模式變數的信念，以及對受試者所完成的作業給予回饋。在可操作的評量中，證據規則管理(guide) 反應分數步驟（response scoring process），並且定義及概述作業內可觀察變數中所蘊含的證據。而可觀察變數與每一個試題結合，本研究藉由這樣的證據規則，將學生的作答反應與正確答案的關鍵訊息做比對，並判斷其正確與否；一份作業模式需要數個步驟，每個步驟的訊息都可以被當做受試者在該作業模式中能力表現的證據。測量模式則為證據模式的一部分，提供相關的學生模式變數及可觀察變數之間的連結資訊。. 三、作業模式(task model) 作業模式是藉由受試者在作業上的表現以產生證據、回饋、決定、預測等基本作用。評量設計中所設計出的作業必須對評量目的有其作用。作業設計者經由作業環 12.

(20) 境的設計提供一個情境，讓受試者在此情境中被誘發出符合評量目的所需要的行為，並使其行為表現提供證據給證據模式來使用。在教育評量中作業是最易掌握的元素，可提供直接清楚的推論證據。作業模式需符合「該種作業或情況可以誘發出關於目標知識的證據行為」，主要是藉由該架構來描述受試者在作業上的表現狀況作業模式的變數為描述該作業的特徵以及這些特徵與作業表現的關聯性。研究者根據上述這些要素來設計其作業，並利用組合模式來組成評量。在作業模式中變數的另一個意義為連結學生模式變數值去預測受試者可觀察的行為。在一給定的作業中已知作業模式變數值，並用來計算出貝氏網路架構中證據模式的可觀察變數的條件機率分佈期望值，之後還可以計算顯著的學生模式變數所對應的機率分佈。作業模式. 明確定義作業結果 1xxxxxx 3xxxxxx 5xxxxxx. 2xxxxxx 4xxxxxx 6xxxxxx. 明確定義模擬情境條件以及可提供的物件. 圖 2-6. 作業模式的要素(改編自 Mislevy, et. al., 2003). 作業模式的要素必須能提供符合作業要求的工具，以及明確說明作業的結果。一份評量可能呈現多種作業模式，其作業表現可在不同形式下用來提供證據，或者是在不同能力值觀點以不同的呈現形式來提供證據。就如之前所提到，設計者提供受試者機會，去產生一些具體的反應來產生設計 13.

(21) 者想知道的資訊。評量設計的目的在於確定作業的特徵並取得證據，藉由給定的作業，受試者的反應將構成學生模式下受試者能力值的證據。因此，在證據模式中可以解決作業本身不能描述受試者應該產生什麼樣的表現或者如何評量研究者所見的表現的問題。. 四、組合模式(link model) 視研究者的目的為何，組合模式是將所有已知的資料組成一個評量測驗。不同的測驗方法適合不同的呈現方式，當確定試題的範圍後，組合模式將明確說明如何管理多種作業來組成一份給受試者受測的評量。根據作業的統計特徵值；例如受試者作答資訊的期望值提供給不同的學生模式變數、以及非評量的因素如內容、格式、時間、試題之間的相依性等特性來構成組合模式的限制條件，這些限制條件可以被彈性的使用。這些限制條件被定義在作業模式變數中，所以必須定義作業模式變數來特徵化每個作業給組合評量以便進行組卷提供給受試者作答。. 評量組合規格學生模式. 證據模式測量模式. 環境/介面作業模式. 證據規則. 1.xxxxxx. 2.xxxxxx. 3.xxxxxx. 4.xxxxxx. 5.xxxxxx. 6.xxxxxx. 模擬裝置. 概念/理論基礎. 圖 2-7. 將多種作業組成一個評量的情形(改編自 Mislevy, et. al., 2003). 組合評量時作業模式變數的作用在於將作業的特徵集合起來，並將多種作業組成 14.

(22) 一個評量，以提供受試者接受測驗，而受試者的表現將被用來定義學生模式中的變數。其中限制條件的集合與作業規格、證據規則、以及學生模式組成一個最佳化學生模式變數的評量，對於評量設計者而言這是一個相當重要的問題。而「呈現模式」主要在於呈現不同形式的評量。例如：紙筆測驗、網頁、電話訪談、學生的檔案資料等等來完成評量的工作。呈現模式描述如何以不同的形式來表現作業的設計，並將相關資料組成某種形式（如組卷）來呈現並記錄。. 第三節多重辨識器結合演算法一、基本概念藉由辨識器的結合的方式使我們可以在亦趨複雜的結構中更加專精於精確辨識效能的追求(Kuncheva, 2003)。換句話說，藉由辨識器的結合，可以讓我們去突破單一辨識器所產生的辨識效果提升之瓶頸的問題，取而代之的是藉由多個辨識器的結合以獲的更佳的辨識效果。這樣的概念又如同Ho(2002)所認為：現在我們所追求的是藉由多個辨識器的結合效果來取代追求單一辨識器低辨識效果的窘境。可以想像的是，接下來我們所追求的是多個辨識器應該如何做結合才能獲得最佳的辨識效果。在目前針對單一複雜結構的情況下作辨識率的提升是有其瓶頸的，自然而然多個辨識器進行結合企圖獲取更佳的辨識效果是一個自然的思維。就目前的情況來看，辨識器結合的概念在樣式比對的領域中正急速的成長，且越來越有其重要地位 (Kuncheva, 2003)。. 二、統計概念下的結合意函多個辨識器的結合效果引人注目，且在樣式辨識(pattern recognizing)領域中應用越來越廣泛。其最主要的原因在於多個辨識的結合效果可能優於單一辨識器辨識的效果。在此我們就統計的觀點來做這面向的解釋―為何結合多重辨識器辨識效能優於單一辨識器的辨識效能？ 15.

(23) 以圖形解釋觀點來看，應該可以清楚明瞭其中的概念。首先先定義圖形基本架構，如圖2-8所示。. 。 D1 。 D2 。 D* 。 D3. 。 D4. 圖2-8. 辨識器辨識效果分佈區域圖2-8的 D1 , D2 , D3 , D4 為單一辨識器， D * 為該問題的理想最佳辨識器。白色區域為各辨識器的可辨識區域，灰色區域是各辨識器的最佳辨識區域(Dietterich, 2000)。 *. 以這樣的觀點來看，若是能尋找到 D 的話，那該問題便有最佳的辨識結果 (Dietterich, 2000)；然這樣的情況並不多見，至少在結構複雜的情況下，要做這最佳辨識器的尋找是相當困難的，在這樣的情況下我們可以專注在尋找多個辨識器的結 *. 合，以獲得趨近於 D 的理想辨識器。. 三、結合的流程、方法其結合的方式我們可以採用由Kuncheva(2003)提出的架構。其基本架構如圖2-9 所示：. 16.

(24) 資料結構. 資料單元. 辨識器 1. 辨識器 2. ……. 辨識器 L. 辨識器結合階段圖2-9. 建構多重辨識器結合的方式. 就圖2-9來看，資料結構區塊所定義的是各單一辨識器辨識出來的類別資料型態。若以本研究的觀點便是錯誤類型、子技能和能力指標的有(1)或無(0)的後驗機率值。而在資料單元部分所定義的是輸入各單一辨識器的資料及其型態。該部分依所要使用的結合演算策略所需要的資料型態為主，可能是機率值；或是狀態值。而在單一辨識器的部分，所定義的是辨識器的結構，一本文所做的研究即是針對單一貝氏網路結構。而在辨識器結合的部分，就是定義辨識器應該怎樣進行結合的演算法。上述該方法是由Kuncheva(2003)所提出的方法。由上面可以看出，整個多重辨識器結合的做法，可以簡單的將觀點著重在結合的方式。換句話說，怎樣的結合將會使辨識效果獲得改善，甚而突破。而這也是本研究的研究核心―怎樣的結合演算法可以使辨識效果獲得最大的進步、突破。. 17.

(25) 四、結合的方式目前被常用的辨識器集合方式有兩種策略：多重辨識器融合策略、多重辨識器選擇策略(Kuncheva, 2003)。辨識器融合策略的觀念下，每一個參與融合的單一辨識器對於整個預辨識的空間都有整體性的影響，其概念可以如圖3-3所示。而在辨識器選擇策略下的概念中，每一個參與選擇策略的單一辨識器只對於欲辨識的空間中較佳的某區域有決定性的影響，其概念如圖2-10所示。. 資料集. 單一辨識器辨識效果. 單一辨識器辨識效果. 單一辨識器辨識效果. 單一辨識器辨識效果. 進行選擇策略演算程序. 圖2-10. 多重辨識器融合策略概念圖. 18. 單一辨識器辨識效果.

(26) 資料集. 單一辨識器辨識效果. 單一辨識器辨識效果. 單一辨識器辨識效果. 單一辨識器辨識效果. 單一辨識器辨識效果. 被選擇到的結構. 進行選擇策略演算程序. 圖2-11. 多重辨識器選擇策略概念圖. 第四節辨識器融合策略. 多重辨識器融合策略依照其單一辨識器所辨識出來的資料型態可以將其策略分為兩種形式，一種是標示(label)融合策略；另一種是可測(measurable)資料型別融合策略。一、標示融合策略主要是藉由單一辨識器所產生的標示資料型態來加以進行融合。其實所謂的標示資料型態就是Kuncheva(2003)所提出的oracle type。該型態的特色是經過辨識器所辨 19.

(27) 識出來的最終結果只有對(1)和錯(0)的資料型態。換句話說，我們捨棄其辨識器本來所辨識出來的相關資訊，而只給予一個標示來說明其是否屬於該狀態，若是的話屬於一般是給予“1”；反之給予“0”。在標示資料型態下，一般最常被用來進行融合的演算法則有Vote演算法。其實該演算法的基本概念正如現實生活中的投票選舉的概念，其實就是一種民主的表現方式。然就Day(1988)的研究來看，這樣的投票概念最早其實是可以追朔到西元1356年以前的時代的。而到了1365年才建立了所謂多數決(majority)的投票法則，並一直到了 1500年才最中發展成為一套真正的理論。對於vote演算法而言，就其投票規則的定義，可以將之分為三種不同的演算方式：完全通過(unanimity)演算規則、一半以上同意(simple majority)演算規則、多數決同意(plurality)演算規則，如圖4.1所示。其中假設我們的黑球、白球、灰球個自是參與融合演算過程中的單一辨識器個自的辨識結果。換句話說，每一個參與策略的單一辨識器個數有10個。而該圖2-12所表示的是最終辨識結果都是以黑球為最後辨識出來的最終辨識結果。為了對其有更完整的定義，我們首先假設第 i 個辨識器 di 針對資料集 x 辨識出來的狀態結果，如下式子(2.4)所示。. [d. K di c ] Î {0,1} , i = 1,K, L T. i1. c. ì1 , if di classifies for x Î wj, di j = í î0 , otherwise .. 20. (2.4).

(28) unanimit. simple majority. plurality. 最終辨識結果就上述而言黑球不管在何種演算方式均是被選取的最終. 圖2-12. 各種投票演算策略具體化圖形有了上述的定義後，來看我們對於多數決的演算法則可以將之定義為如方程式 (2.5)所示： L 個辨識器最終融合後對於 x 資料集其辨識結果為屬於 wk 狀態的結果。 L. åd i =1. c. ik. L. = Max å d i j j =1. (2.5). i =1. 之後再經過Xu, Krzyzak 與 Suen(1992)等人的改良以及建議將方程式(2.5)加上式子2.6的補充後，其整體架構更趨完備，其中 f 為Vote演算策略的函式， wc +1 代表其他非屬於 wk 狀態的辨識結果。也就是說就方程式(2.5)以及(2.6)而言，藉由 a 的調整我們可以涵蓋到整個投票的各種演算法則之定義。比方說當 a = 1 時，就會變成完全通過的演算法則等等。. 21.

(29) ì ï w , f ( x) Î í k ï î wc+1 ,. L. å( i =1. d ik )³ α, 0< α £1 L otherwise.. (2.6). 而其實所謂的多人決定演算法則便是所謂的“majority vote”的演算法則，該方法也是本文所要實作的演算法則之一。. 二、可測之連續量值融合策略主要是藉由單一辨識器所產生的可測之連續量值資料型態來加以進行融合。其實所謂的可測之連續量值資料型態就是由Xu, Krzyzak, 與 Suen(1992)等人提出的第三類資料型態。該型態的特色是經過辨識器所辨識出來的最終結果會表現出屬於該狀態的程度上的可測數值。一般我們可以假定可測數值為分佈在0和1之間的實數。本研究在這個面向的認知是將該值鎖定成所謂的後驗機率值。就一般而言，最常利用的融合演算策略除常見的最大演算法、最小演算法、乘積演算法以及最重要的平均值演算法。底下會一一作說明。首先作一般定義。假定 x 唯一欲辨識的資料集， W = {w1. w2 L wc } 為一狀態. 集，而 di 為要參與融合的第 i 個單一辨識器，合計共有 L 有個。不失一般性我們可以假定單一辨識器所辨識出來用以描述屬於何種狀態資料的程度數值是分布在0和1之間的實數。因此整個 L 個單一辨識器針對 x 資料集進行辨識後的結果可由底下的矩陣 (2.7)加以簡單的表現出來。. é d 11 ( x) L d 1 j ( x ) L d 1 c ( x) ù ê ú DP( x ) = ê d i 1 ( x) L d i j ( x) L d i c ( x ) ú, d i j ( x) Î [0,1] êd L ( x) L d L ( x ) L d L ( x )ú j c ë 1 û. [. (2.7). ]. 接下來我們藉由 d 1 j ( x) L d i j ( x) L d L j ( x ) , d i j ( x) Î [0,1] 的使用來進行融合演算法，這樣的方式可以便是由Kang, Kim 與 Kim(1997)等人所提出的一種稱為 “class-conscious“法。此外為了方便後續說明，我們定義 f 函數來代表結合演算的函 22.

(30) (. ). 式而其融合結果再藉由 m j (x) = f d1 j ( x) L d i j ( x) L d L j ( x) 來表達。而較常見的演算法有：. {. }. {. }. l. 最大(maximum)演算法： m j ( x ) = Max d i j ( x ) 。. l. 最小(minimum)演算法： m j ( x ) = Min d i j ( x ) 。. l. 乘積(product)演算法： m j ( x) = å d i j ( x). i. i. L. (2.8) (2.9). (2.10). i =1 L. l. 平均(average)演算法： m j ( x) = P d i j ( x). (2.11). i =1. 上面所述的各個演算法在樣式辨識的領域可以說應用非常廣泛。且經過其所運作的方式後可以獲得所要的辨識結果。為了清楚說明其實作細節，我們來舉一個較簡單的例子來加以說明其運作的過程。例子：假定 c = 2 而且 L = 5 的話則對於 DP(x) 的結果如(2.12)所示。. é0.2 ê0.7 ê DP(x ) = ê0.6 ê ê 0.1 êë0.4. 0.8ù 0.3úú 0.4ú ú 0.9ú 0.6úû. (2.12). 經過上述四個演算法的融合後結果如下所示：最大演算法： (0.7. 0.9). 最小演算法： (0.1 0.3) 乘積演算法： (0.00326 0.05184) 平均演算法： (0.4 0.6). 然就其原先在樣式便是上面的應用，接續會將辨識出來的結果取最大值來當做最 23.

(31) 後辨識的結果。也就是說最終狀態選取： Max (m1 ( x ) L m j ( x ) L m j ( x ) ) 。換句話說，各個演算法的最終狀態選取如下所示：最大演算法的情況下：辨識結果為―狀態二。最小演算法的情況下：辨識結果為―狀態二。乘積演算法的情況下：辨識結果為―狀態二。平均演算法的情況下：辨識結果為―狀態二。. 上述即是融合演算法的基本概念及其應用。亦是本文所要應用於多重貝氏網路結構融合演算的基本架構，然本研究的實作部份有針對其細節稍作改良以適用於本研究的多重貝氏網路之融合。. 第五節辨識器選擇策略. 多重辨識器選擇策略其基本概念即是，每一個參與結合的辨識器均是一位專家，且在針對同一個欲進行辨識的資料集而言，只有一位專家可以針對該資料集作最後狀態之決定的權利。其實該策略最早的想法是源自於Dasarathy 與 Sheela(1978)兩位專家為了將一個線性辨識器和一個k nearest neighbors辨識器作結合以便尋找較佳的辨識效果時所產生的。而到了1981年才由Rastrigin 與 Erenstein(1981)兩位專家時才對這樣的策略作完整的定義。為了可以清楚說明整個選擇策略的實作過程，底下我們將作一些基本定義：假定 d i 為參與選擇策略的第 i 個辨識器，合計共有 L 個。而 d i j = Pˆ ( w j | x, d i ) 代表著第 i 個辨識器在 x 這一個欲進行辨識的資料集下，辨識其屬於 w j 類別的機率值。因此 DP(x) 即是各個辨識器所辨識出來的結果。. 24.

(32) é d11 L d1 j ê DP( x) = ê d i 1 L d i j êd L L d L j ë 1. L d1 c ù ú L d i c ú, d i j ( x) Î [0,1] L d L c úû. (2.13). 而單一辨識器的最終結果我們定義式子(2.14)來說明，也就是說經過選擇策略後，最後認定 x 這一個欲進行辨識的資料集，其屬於 w j 類別的最終機率值。其中 c 為類別數目。 c. C (d i | x) = Max Pˆ ( w j | x, d i ). (2.14). j =1. 有上述定義後，我們將 DP(x) 經過這樣的步驟轉後後得 MAX _ RDC ( x) 如式子 (2.15)。. é c ˆ ù P( w j | x, D1 ) ú ê Max j =1 ê ú M ê c ú MAX _ RDC ( x ) = ê Max Pˆ ( w j | x, Di ) ú j =1 ê ú M ê c ú ê Max Pˆ ( w j | x, D L )ú ë j =1 û. (2.15). é C ( D1 | x) ù ê ú M ê ú MAX _ RDC ( x) = ê C ( Di | x) ú ê ú M ê ú êëC ( DL | x)úû. (2.16). 之後再藉由式子(2.16)的轉換，去取得最佳機率值 FC ( D | x) 如式子(2.17)，則為所求。. é C ( D1 | x) ù ú ê M ê ú FC ( D | x) = Max ê C ( Di | x) ú ê ú M ú ê êëC ( DL | x)úû. T. (2.17). 上述集是一個選擇策略的基本運作方式，經過選擇策略的選擇後，我們會得到一 25.

(33) 個最合適的辨識結果。因此就整體而言，這樣的策略來說是相當有其實用價值的，除目前應用在樣式辨識的技術外。甚有應用在及時系統(Real-time System)上(Alpaydin, & Kaynak, 1985; Egmont-Petersen, Dassen & Reiber, 1999; Bruzzone, & Cossu, 2002)。且因為這樣的技術可以就目前的辨識器來進行融合已獲取超越單一辨識器辨識效果的優點，所以最近幾年也成為主要的研究方向之一。然就上述的做法我們可以看出其目的在於辨識器的選取，也就是說我們必須藉由資料來選擇哪一辨識結構針對欲辨識資料集 x 有較佳的辨識效果，並認定該辨識器在該資料集 x 下的辨識結果為最終結果的選擇。並於實作部份獲取最佳的辨識結果。. 26.

(34) 第三章. 研究方法. 本研究旨在探就以多重貝氏網路結合的方式來改進單一貝氏網路辨識效果提升之瓶頸，並藉由提出多個融合演算法以及策略來加以實做、比較，以獲取合適的演算法法則。根據本研究之研究目的，本研究採用江存卿(2006)九年一貫國小三年級數與量之能力指標部份所建構而成的貝氏網路結構及相關資料為研究所用之資料來進行研究。該章主要分為五個部分：一、資料分析；二、演算法實作；三、研究工具；四、評估方式；五、研究流程。以說明整個研究架構。. 第一節資料分析. 本研究所採用的實驗資料是江存卿(2006)針對九年一貫國民小學三年級數與量之相關能力指標所建構出來的貝氏網路結構，其結構如圖 3-1 所示。其各部位分析及其說明如下：整個網路結構由左而右分別是試題(Item)層、錯誤類型(Bug)層、子技能(Skill)層、能力指標(Index)層。試題結構：此部分的題庫是根據多位在數學教育領域有多年經驗的數學教育專家及多位教授所共同建置完成的。總共出了 39 題，來作為這一部分題庫的建置。換句話說，該層有 39 個節點。如附錄一所示。錯誤類型：藉由子技能所命題的題目經由紙筆測驗分析而得之學生可能的錯誤類型，該部分除有經過文獻探究外，亦有多位專家教師及教授共同修訂而成。總共有 17 個錯誤類型。換句話說，該層總共有 17 個資料節點。如表 3-1 所示。子技能層：藉由所分析之能力結構。建立有上下位關係的專家知識結構，而結構之各節點及該層的各資料節點。總共有 36 個子技能。換句話說，該層總共 26.

(35) 有 36 個資料節點。如表 3-2 所示。能力指標：指根據九年一貫國民小學三年級數與量相關能力指標之內容所建構而成。總共有 6 個指標。換句話說，該層共有 6 個資料節點。如表 3-3 所示。表 3-1. 錯誤類型編號對照表節點流水號節點名稱 1 3-n-01-b01 2 3-n-01-b02 3 3-n-01-b03 4 3-n-01-b04 5 3-n-02-b01 5 3-n-03-b01 6 3-n-02-b02 6 3-n-03-b01 6 3-n-06-b01 7 3-n-02-b03 7 3-n-06-b02 8 3-n-02-b04 8 3-n-06-b03. 節點涵義不熟悉位名直接轉譯錯誤單位換算觀念不清位值換算計算錯誤及粗心進位錯誤進位錯誤加法計算錯誤及粗心加法計算錯誤及粗心加法計算錯誤及粗心退位錯誤退位錯誤減法計算錯誤及粗心減法計算錯誤及粗心. 27.

(36) 9 3-n-03-b02 9 3-n-05-b01 9 3-n-04-b01 10 3-n-04-b02 11 3-n-04-b03 12 3-n-04-b04 13 3-n-04-b05 14 3-n-04-b06 14 3-n-05-b02 14 3-n-06-b04 15 3-n-04-b07 15 3-n-05-b03 15 3-n-06-b05 16 3-n-04-b08 16 3-n-05-b04 17 3-n-04-b09 17 3-n-06-b07. 乘法計算錯誤乘法計算錯誤乘法計算錯誤不了解被除數的位置不了解除數的位置不了解商的位置不了解餘數的位置除完後，商、除數、餘數三者間的關係混淆除完後，商、除數、餘數三者間的關係混淆除完後，商、除數、餘數三者間的關係混淆除法計算錯誤及粗心除法計算錯誤及粗心除法計算錯誤及粗心不了解餘數ㄧ定比除數小不了解餘數ㄧ定比除數小文字題不懂題意或使用錯誤的運算文字題不懂題意或使用錯誤的運算. 表 3-2. 子技能編號對照表節點流水號 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19. 節點名稱 3-n-01-s01 3-n-01-s02 3-n-01-s03 3-n-01-s04 3-n-01-s05 3-n-01-s06 3-n-01-s07 3-n-01-s08 3-n-01-s09 3-n-01-s10 3-n-01-s11 3-n-02-s01 3-n-02-s02 3-n-02-s03 3-n-02-s04 3-n-03-s01 3-n-03-s02 3-n-04-s01 3-n-04-s02. 節點涵義正確表示千位的位名正確表示四位數阿拉伯數字正確表示四位數字國字的讀法正確表示四位數的合成正確表示四位數的分解 1000和100的位值換算 1000和10的位值換算 1000和1的位值換算 1000元和500元、100元的錢幣位值換算 1000元和500元錢幣位值換算 1000元和100元的錢幣位值換算進位的四位數加法直式計算借位的四位數減法直式計算多重進位的四位數加法直式計算多重借位的四位數減法直式計算熟練三位數乘以一位數的直式計算(有進位) 熟練二位數乘以二位數的計算(有進位) 了解被除數的位置了解除數的位置. 28.

(37) 20 3-n-04-s03 21 3-n-04-s04 22 3-n-04-s05 23 3-n-04-s06 24 3-n-04-s07 25 3-n-04-s08 26 3-n-04-s09 27 3-n-05-s01 28 3-n-05-s02 29 3-n-05-s03 30 3-n-05-s04 31 3-n-05-s05 32 3-n-05-s06 33 3-n-06-s01 34 3-n-06-s02 35 3-n-06-s03 36 3-n-06-s04. 了解商的位置了解餘數的位置了解商、除數、餘數的位置與三者間的關係會使用÷、＝作橫式紀錄（包括有餘數的情況）了解二位數除以一位數(包括有餘數) 了解二位數除以一位數的應用問題(包括有餘數) 了解商數加1的應用問題熟練二位數除以一位數直式計算(可整除) 熟練二位數除以一位數直式計算(商為一位，有餘數) 熟練二位數除以一位數直式計算(商為二位，有餘數) 熟練三位數除以一位數直式計算(可整除) 熟練三位數除以一位數直式計算(商為二位，有餘數) 熟練三位數除以一位數直式計算(商為三位，有餘數) 先加後除的應用問題先減後除的應用問題先除後加的應用問題先除後減的應用問題. 表 3-3. 能力指標編號對照表節點流水號節點名稱節點涵義 1 3-n-01 能認識10000以內的數及「千位」的位名，並進行位值單位換算 2 3-n-02 能熟練加減直式計算（四位數以內，和＜10000 ，含多重借位） 3 3-n-03 能熟練三位數乘以一位數的直式計算，並解決二位數乘以二位數的乘法問題 4 3-n-04 能理解除法的意義，運用÷、＝作橫式紀錄（包括有餘數的情況），並解決生活中的問題 3-n-05 能熟練三位數除以一位數的直式計算 5 6. 3-n-06. 能在具體情境中，解決兩步驟問題（加、減與除，不含併式）。. 29.

(38) 圖 3-1. 第一個單一貝氏網路結構 30.

(39) 如圖 3-1 所示即是專家所定義之單一結構的貝氏網路結構圖。然依據專家們所定義出來的合理之貝氏網路結構圖並非只有一個，而是有五個之多。換句話說，該知識領域由專家去定義其貝氏網路結構的話，至少有五個可以滿足其相關定義，且其中各個辨識效果不會相差很多。其餘四組單一貝氏網路結構呈現如圖 3-2、圖 3-3、圖 3-4、圖 3-5 所示。其和第一個單一貝氏網路結構圖的差異如表 3-4 所示。表 3-4. 不同貝氏網路的差異比較表貝氏網路結構序號. 和第一結構的差異之處. 第二結構. 錯誤類型(3-n-04-b07 、 3-n-05-b03、3-n-06-b05) 多連接到試題的第 36、37、38、39 題。錯誤類型(3-n-04-b09、3-n-06-b06) 多連接到試題的第 27、28 題。. 第三結構. 3-n-03-b02、3-n-04-b01、3-n-05-b01 該混合節點刪除本來連接到試題第 36,37,38,39 題的連線。. 第四結構. 具備第二和第三結構的差異. 第五結構. 具備第四結構的差異，並增加 3-n-02-s02、3-n-02-s04、多連線到 3-n-02-b01、3-n-03-b01 之混合錯誤類型節點 3-n-02-b02、3-n-03-b01、 3-n-06-b01 之混合錯誤類型節點。以及 3-n-05-s03、3-n-05-s04、 3-n-05-s05、3-n-05-s06、3-n-06-s01、 3-n-06-s02、3-n-06-s03、3-n-06-s04 多連接 3-n-02-b01、3-n-03-b01 之混合錯誤類型節點 3-n-02-b02、 3-n-03-b01、3-n-06-b01 之混合錯誤類型節點 3-n-02-b03、3-n-06-b02 之混合錯誤類型 3-n-02-b04、3-n-06-b03 之混合錯誤類型。 31.

(40) 圖 3-2. 第二個單一貝氏網路結構 32.

(41) 圖 3-3. 第三個單一貝氏網路結構 33.

(42) 圖 3-4. 第四個單一貝氏網路結構 34.

(43) 圖 3-5. 第五個單一貝氏網路結構 35.

(44) 第二節演算法實作. 為方便說明演算法實作過程。第一部分首先定義相關符號及其說明；第二部分再進一步說明各演算法的實作過程。而實作之演算法便是該研究的主要工具。一、符號定義下圖 3-6 為一個基本的單一貝氏網路結構圖，相關符號定義如下： Layer1. Layer2. Layer3. Layer4. 節點 1. 節點 1. 節點 1. 節點 1. 節點 2. 節點 2. 節點 2. 節點 2. …. …. …. …. 節點 n1. 節點 n2. 節點 n3. 節點 n4. 圖 3-6. 單一貝氏網路結構簡圖. 為了方便說明我們視圖 3-6 為第 i 個單一貝氏網路結構。我們目的要藉著結合 m 組單一貝氏網路結構已獲取較高的辨識效果。另外再定義第 i 個單一貝氏網路結構第 j 層的第 k 個節點在辨識最終結果為有(1)的後驗機率值為 M i j k。另外為方便後續結合演算法實做實的說明，我們更以式子(3.1)的矩陣形式來說明第 j 層的第 k 個節點在所有( m 組)單一貝氏網路結構下辨識最終結果為有(1)的所有後驗機率值。. 36.

(45) é M 1 jk ù ê M ú ê ú MPjk = ê M ijk ú ê ú ê M ú ê M mjk ú ë û. (3.1). 另外為了評估辨識出來的結果和真實資料所呈現的結果，所以必須將所求的後驗機率值換算成有(1)或無(0)的狀態值。以便進行辨識率的計算。其轉換方式如式子(3.2) 所示。. ì0, f ( MPjk ) < e FMPjk = í î1, f ( MPjk ) >= e. (3.2). 其中 FMPjk 為最終結合後的狀態值， f ( MPjk ) 為各融合演算法下不同的辨識結果結果，這裡意味著不同演算法便有不同的結果，而各演算法實作如底下個小節所示。另外 e 為分類決斷值，其值界在 0 到 1 之間的有理數。. 二、最大演算法就字面上的意思，即是從一資料集中取出最大值來當做最終的結果。也就是這樣的概念，所以實作部份如同式子(3.3)所示。. Max( MPjk ) = Max([M 1 jk. L M ijk. L M mjk ]T ). ì 0, Max( MPjk ) < e FMPjk = í î1, Max( MPjk ) >= e. (3.3). 三、最小演算法就字面上的意思，即是從一資料集中取出最小值來當做最終的結果。也就是這樣的概念，所以實作部份如同式子(3.4)所示。 37.

(46) Min( MPjk ) = Min([ M 1 jk. L M i jk. L M m jk ]T ). ì 0, Min( MPjk ) < e FMPjk = í î1, Min( MPjk ) >= e. (3.4). 四、乘積演算法就字面上的意思，即是從一資料集中取出個值來加以相乘來當做最終的結果。也就是這樣的概念，所以實作部份如同式子(3.5)所示。 m. product ( MPjk ) = P M ijk i =1. ì 0, product ( MPjk ) < e FMPjk = í î1, product ( MPjk ) >= e. (3.5). 五、平均演算法就字面上的意思，即是從一資料集中取出個值來加以算出其平均值來當做最終的結果。也就是這樣的概念，所以實作部份如同式子(3.6)所示。. average( MPjk ) =. 1æ m ö ç å M i jk ÷ m è i =1 ø. (3.6). ì 0, average( MPjk ) < e FMPjk = í î1, average( MPjk ) >= e. 六、投票演算法藉由文獻探究的結果本研究採用 Majority Vote 演算法來實作。首先將 MPjk 轉化為全為有(1)或無(0)的值，如同式子(3.7)所示。 38.

(47) æ BM 1 jk ö ç ÷ ç M ÷ ì 0, M ijk < e BMPjk = ç BM ijk ÷, BM ijk = í ç ÷ î1, M ijk >= e ç M ÷ ç BM ÷ mjk ø è. (3.7). 之後在藉由式子(3.8)的轉換以求出最終結合後的辨識結果。. ì0, average( BMPjk ) <= 0.5 FMPjk = í î 1, average( BMPjk ) > 0.5. (3.8). 七、結構融合演算法該演算法為本研究者所自行開發，並以其和上述各演算法作比較以期能提供更優於上述演算法的辨識效果。要實作該演算法必須先決定出哪一個結構在判斷該節點擁有較高的辨識效果。假定我們設第 j 層的第 k 個節點在第 s 個結構下其辨識率最高。並以這樣條件來建構一個最佳選取矩陣 FIT jk，其中 FIS jk 代表第 j 層第 k 個節點在第 i 個被式網路下其辨識效果是否為最好。若是最佳則為 1；反之則為 0。. FIT jk = (FIS 1 jk. L FIS ijk. L FIS mjk ). ì 1, i = s FIS ijk = í î0, other. (3.9). 有了最佳結構選取矩陣後，在經過式子(3.10)的計算便可以獲得最佳辨識效果，並獲得最終結合後的辨識結果。. ì 0, ( FIT jk * MPjk ) < e FMPjk = í î1, ( FIT jk * MPjk ) >= e. 39. (3.10).

(48) 第三節研究工具. 本研究目的在於藉由多重貝氏網路的結合來提升單一貝氏網路辨識效能提升的瓶頸。本研究除藉由上述所介紹之各演算法實作之工具外，研究過程中仍需要額外的輔助研究工具其說明如下： 1.Matlab 軟體：本研究使用 Matlab 7.0 版，進行各種結合演算法程式工具的撰寫，並與 Bayes Net Toolbox for Matlab 結合成一完整的程式。 2.貝氏網路工具箱：本研究使用 Murphy（2004）所撰寫的貝氏網路工具箱，作為撰寫貝氏網路程式所需的函數，此工具箱的優點為免費提供原始程式碼並可供修改及擴充，並附有詳細使用說明容易上手；其缺點是尚未建立完整的使用者介面，使用者必須具有專業的撰寫程式能力才能嫻熟使用。 3.硬體設備：本研究所使用的電腦硬體規格如下﹕中央處理機使用 Pentium 4 (R)3.0G，動態隨機記憶體 1024 M。 4.單一貝氏網路辨識系統：由研究者本人在上述開發環境下自行開發用以計算單一貝氏網路架構下的辨識率計算程式。. 第四節評估方式. 本研究目的在於藉由多重貝氏網路的結合來提升單一貝氏網路辨識效能提升的瓶頸。研究過程中，藉由多個多重貝氏網路融合演算法來實作，藉以用實證的方式來歸結出最佳的融合演算策略！研究過程主要是藉由比較不同融合演算法下所獲得的辨識效果高與低的比較來歸結出何種融合演算效果較佳除優於別的融合演算效果外，更優於單一貝氏網路結構所辨識出來的效果。 40.

(49) 換句話說，藉由辨識率的計算以提供本研究一個實證的方式，而辨識率的計算方式如下所示：. 貝氏網路有辨識結果 (1). 無 (0). 專家辨識結果有(1) 無(0). 辨識率=. f 11 + f 00 N. f 11. f10. f 01. f 00. (3.11). 其中 f ij 代表貝氏網路辨識結果為 i ，而專家辨識結果為 j 的事件數目。而辨識率的概念即是被式網路所辨識出來的結果應該和專家辨識出來的結果是一樣的，也就是在這樣的概念下，得到如式子(3.11)的通式。另外在式子(3.11)中的 N 即是測試資料數目。本論文所謂的測試資料是藉由 5-fold cross validation 的方式來作重複性的測試與評估。藉由計算辨識率的方式求出各融合演算法下辨識率的結果，並加以比較。最終目的在於歸結出最佳的融合演算法為何！. 第五節研究流程. 本研究所提出藉由多重貝氏網路的結合策略來改進單一貝氏網路之辨識效能提升之瓶頸，主要涉及以下步驟：文獻探究、演算法設計及改良、演算法程式化、進行實驗、比較靜態動態決斷值的辨識結果、綜合評估、提出適當的演算法則。詳細的流 41.

(50) 程圖如圖 3-7 所示。. 針對辨識器結合的文獻進行探究. 針對所要進行的實驗資料做收集以及分析的作業. 針對所要使用的演算法進行改良或設計. 程式化的演算法進行驗證其正確性. 靜態決斷值條件下執行演算法. 動態決斷值條件下執行演算法. 資料收集與整理. 資料比較與分析. 結果與建議. 圖 3-7. 研究流程圖. 42.

(51) 第四章研究結果本研究的目的在於藉由多重貝氏網路的結合策略來提升單一貝氏網路的辨識的效能。並藉由不同決斷值的設定之使用來歸納出最佳的演算策略。在經過不同演算策略下的結果將呈現在各個小節中。. 第一節. 單一貝氏網路的辨識結果. 一、靜態決斷值下的辨識率結果由於所有資料過於龐大在此只列出各個單一貝氏網路的平均辨識率如圖 4-1，其餘各節點詳細辨識效果請參閱附件各表格所列之資料。. 表 4-1. 單一貝氏網路於靜態決斷值下的比較網路結構編號. 最佳靜態決斷值. 平均辨識效果. 第一個. 0.7. 87.45%. 第二個. 0.7. 87.05%. 第三個. 0.6. 86.97%. 第四個. 0.6. 87.56%. 第五個. 0.5. 88.93%. 由上表可以發現五個單一貝氏網路在靜態絕斷值下的辨識效果其辨識率可以說是相當大約落在 86.97% ~ 88.93%。. 二、動態決斷值下的辨識率結果藉由分析出各單一貝氏網路的最佳動態絕斷值，以便進行單一貝氏網路動態絕斷值下的辨識。並以此和最佳靜態決斷值下的辨識平均效果作比較，以觀察辨識效果提升的優勢！. 表 4-2. 單一貝氏網路於動、靜態決斷值下的比較 43.

(52) 網路結構編號. 靜態最佳平均效果. 動態平均效果. 第一個. 87.45%. 88.34%. 第二個. 87.05%. 89.54%. 第三個. 86.97%. 88.61%. 第四個. 87.56%. 89.42%. 第五個. 88.93%. 90.12%. 由上表可以看出各個單一貝氏網路結構於動態絕斷值下的辨識效果均有明顯的提升。而提升後的各個單一貝氏網路結構其辨識效果亦相當，概略分布在 88.34% ~ 90.12%的區間！. 第二節. 多重貝氏網路融合方式的辨識結果. 該部分我們將利用我所編寫的融合演算程式來加以執行，並取得其辨識效果，以供比較說明。各個小節以不同演算法作為區隔，以提供一個較為完整的介紹及說明。然由於資料量過於龐大，因此各節只列出各演算法下的靜態最佳決斷值平均辨識效果、動態決斷值下的平均辨識效果以供比較說明。至於其他細部結果請參閱附件！一、在最大融合演算法的情況下多重貝氏網路於最大演算法下的融合辨識效果，可以依絕斷值的不同將結果分為兩部分：靜態絕斷值辨識效果，動態絕斷值辨識效果。各結果如表 4-3 所示：. 表 4-3. 最大演算法於動、靜態決斷值下的比較. 44.

(53) 結構編號. 靜態最佳平均效果. 動態平均效果. 第一個. 87.45%. 88.34%. 第二個. 87.05%. 89.54%. 第三個. 86.97%. 88.61%. 第四個. 87.56%. 89.42%. 第五個. 88.93%. 90.12%. 最大演算法. 88.16%. 89.33%. 由上表可以發現，最大演算法於靜態決斷值下的辨識效果不如動態決斷值下的辨識效果；此外，根據表 4-3 比較可以發現在最大演算法下的融合辨識效果並不能將辨識效果提昇超過單一貝氏網路結構的辨識效果！. 二、在最小融合演算法的情況下多重貝氏網路於最小演算法下的融合辨識效果，可以依絕斷值的不同將結果分為兩部分：靜態絕斷值辨識效果，動態絕斷值辨識效果。各結果如表 4-4 所示：表 4-4. 最小演算法於動、靜態決斷值下的比較結構編號. 靜態最佳平均效果. 動態平均效果. 第一個. 87.45%. 88.34%. 第二個. 87.05%. 89.54%. 第三個. 86.97%. 88.61%. 第四個. 87.56%. 89.42%. 第五個. 88.93%. 90.12%. 最小演算法. 88.02%. 90.23%. 由上表可以發現，最小演算法於靜態決斷值下的辨識效果不如動態決斷值下的辨識效果；此外，根據表 4-4 比較可以發現在最小演算法下的融合辨識效果有些許超過單一貝氏網路結構的辨識效果！三、在乘積融合演算法的情況下 45.

(54) 多重貝氏網路於乘積演算法下的融合辨識效果，可以依絕斷值的不同將結果分為兩部分：靜態絕斷值辨識效果，動態絕斷值辨識效果。各結果如表 4-5 所示：表 4-5. 乘積演算法於動、靜態決斷值下的比較結構編號. 靜態最佳平均效果. 動態平均效果. 第一個. 87.45%. 88.34%. 第二個. 87.05%. 89.54%. 第三個. 86.97%. 88.61%. 第四個. 87.56%. 89.42%. 第五個. 88.93%. 90.12%. 乘積演算法. 88.62%. 89.60%. 由上表可以發現，乘積演算法於靜態決斷值下的辨識效果不如動態決斷值下的辨識效果；此外，根據表 4-5 比較可以發現在乘積演算法下的融合辨識效果並未超過單一貝氏網路結構的辨識效果！四、在平均融合演算法的情況下多重貝氏網路於平均演算法下的融合辨識效果，可以依絕斷值的不同將結果分為兩部分：靜態絕斷值辨識效果，動態絕斷值辨識效果。各結果如表 4-6 所示：表 4-6. 平均演算法於動、靜態決斷值下的比較結構編號. 靜態最佳平均效果. 動態平均效果. 第一個. 87.45%. 88.34%. 第二個. 87.05%. 89.54%. 第三個. 86.97%. 88.61%. 第四個. 87.56%. 89.42%. 第五個. 88.93%. 90.12%. 平均演算法. 88.36%. 90.33%. 由上表可以發現，平均演算法於靜態決斷值下的辨識效果不如動態決斷值下的辨 46.

(55) 識效果；此外，根據表 4-6 比較可以發現在平均演算法下的融合辨識效果有些許超過單一貝氏網路結構的辨識效果！五、在投票融合演算法的情況下多重貝氏網路於投票演算法下的融合辨識效果，可以依絕斷值的不同將結果分為兩部分：靜態絕斷值辨識效果，動態絕斷值辨識效果。各結果如表 4-7 所示：. 表 4-7. 投票演算法於動、靜態決斷值下的比較結構編號. 靜態最佳平均效果. 動態平均效果. 第一個. 87.45%. 88.34%. 第二個. 87.05%. 89.54%. 第三個. 86.97%. 88.61%. 第四個. 87.56%. 89.42%. 第五個. 88.93%. 90.12%. 投票演算法. 87.63%. 89.72%. 由上表可以發現，投票演算法於靜態決斷值下的辨識效果不如動態決斷值下的辨識效果；此外，根據表 4-7 比較可以發現在投票演算法下的融合辨識效果不如單一貝氏網路結構的辨識效果！. 六、在結構融合演算法的情況下多重貝氏網路於結構融合演算法下的融合辨識效果，可以依絕斷值的不同將結果分為兩部分：靜態絕斷值辨識效果，動態絕斷值辨識效果。各結果如表 4-8 所示：. 47.

(56) 表 4-8. 結構融合演算法於動、靜態決斷值下的比較結構編號. 靜態最佳平均效果. 動態平均效果. 第一個. 87.45%. 88.34%. 第二個. 87.05%. 89.54%. 第三個. 86.97%. 88.61%. 第四個. 87.56%. 89.42%. 第五個. 88.93%. 90.12%. 結構融合演算法. 88.54%. 91.42%. 由上表可以發現，結構融合演算法於靜態決斷值下的辨識效果不如動態決斷值下的辨識效果；此外，根據表 4-8 比較可以發現在結構融合演算法下的融合辨識效果超過單一貝氏網路結構的辨識效果！最多有 3.08%；最少有 1.3%。. 第三節綜合評估. 經過上述的結果呈現後，我們可以發現結構選擇法的辨識結果為最佳甚至超過各個演算法的辨識效果。底下我們再以表 4-9 作綜合評估來看該演算法的辨識效果提升的優勢。. 48.

(57) 表 4-9. 各演算法綜合評估比較表結構編號. 靜態最佳平均效果. 動態平均效果. 第一個. 87.45%. 88.34%. 第二個. 87.05%. 89.54%. 第三個. 86.97%. 88.61%. 第四個. 87.56%. 89.42%. 第五個. 88.93%. 90.12%. 最大演算法. 88.16%. 89.33%. 最小演算法. 88.02%. 90.23%. 平均演算法. 88.36%. 90.33%. 乘積演算法. 88.62%. 89.60%. 投票演算法. 87.63%. 89.72%. 結構融合演算法. 88.54%. 91.42%※. 由表 4-9 綜合評估方面，我們可以發現結構融合演算法和其他單一或是融合演算法相較之下，其辨識都是最好的。尤其是和單一貝氏網路辨識效果相比較，最少增加 1.3%，最多增加有 3.08%可以說增加相當的多。換句話說，該演算法表現優於其他結構、其他演算法則的辨識效果。. 49.

(58) 第五章. 結論與建議. 本研究主要是藉由多重貝是網路結構結合的演算策略來加以突破單一貝氏網路結構下辨識效果提升的評頸。經過實證後發現下幾點：一、在單一貝氏網路的結構下，動態決段值的辨識效果比起靜態決斷值的辨識效果來的好。二、多重貝氏網路結構的融合策略下，動態決段值的辨識效果比起靜態決斷值的辨識效果來的好。三、經過比較，在利用結構融合演算法於動態決斷值的情況下，所獲得的辨識效果為最高。五、藉由多重貝氏網路的結合演算法，我們可以將不同單一貝氏網路的結構加以結合以提高辨識效果。六、在亦趨複雜的系統當中，找尋最佳單一貝氏網路結構是相當困難的。但是我們可以藉由多重貝氏網路結合的策略，在目前有的結構條件下，進行結合已獲得最佳辨識效果。本研究的研究過程中，總共提出 6 種演算策略，而在這 6 種演算策略中以結構融合的演算策略為表現最佳。然是否有其他策略，或是在其他策略下，我們可以獲得更高的辨識效果？以及在相同數目下的單一貝氏網路結構，我們是否可以不用利用這樣多的單一貝氏網路結構數目去獲得如此高的辨識效果？是否可以降低結合的數目以節省結合所花的時間以及發展單一貝氏網路結構的時間。等等相關的多重貝氏網路結合演算法的問題足以用來提高辨識效果的優勢，我想可以是下一研究之重點所在。. 50.

(59) 參考文獻中文部分江存卿(2006)。以貝氏網路為基礎之能力指標測驗編製及補救教學動畫製作－以三年級數學領域之「整數」相關指標為例。未出版之碩士論文，私立亞洲大學資訊工程研究所，台中市。許雅菱(2005)。貝氏網路在教育測驗分析上的應用。未出版之碩士論文，國立台中師範學院測驗統計研究所，台中市。劉湘川彙編(2004b)。「貝氏統計理論」教學講義。未出版手稿。蘇俊和(2004)。貝氏網路的建構與學習機制之研究－以航太產業績效管理為例。未出版之碩士論文，私立東海大學工業工程學研究所，台中市。. 外文部分 Alpaydin, E., & Kaynak, C. (1998). Cascading classifiers. KYBERNETIKA, 34(4), 369–374. Bruzzone, L., & Cossu, R. (2002). A multiple-cascade-classifier system for a robust and partially unsupervised updating of land-cover maps. IEEE Transactions on Geoscience and Remote Sensing, 40(9), 1984–1996. Dasarathy, B. V., & Sheela, B. V. (1978). A composite classifier system design: concepts and methodology. Proceedings of IEEE, 67, 708–713. Day, W. H. E. (1988). Consensus methods as tools for data analysis. In H. H. Bock (ed.). Classification and related methods for data analysis, elsevier science publishers B.V. (pp. 317–324). North Holland. Dietterich, T. G. (2000). Ensemble Methods in Machine Learning. In J. Kittler & F. Roli 51.

(60) (Ed.). First international workshop on multiple classifier systems, lecture notes in computer science (pp. 1-15). New York: Springer Verlag. Egmont-Petersen, M., Dassen, W. R. M., & Reiber, J. H. C. (1999). Sequential selection of discrete features for neural networks – A Bayesian approach to building a cascade. Pattern Recognition Letters, 20(11–13), 1439–1448. Ho, T. K. (2002). Multiple classifier combination: Lessons and the next steps. In A. Kandel & H. Bunke (Eds.). Hybrid methods in pattern recognition (pp. 171–198). World Scientific Publishing. Jensen, F. V. (1996). An introduction to Bayesian networks. New York: Springer. Jensen, F. V. (2001). Bayesian networks and decision graphs. New York: Springer. Kang, H. J., Kim, K., & Kim, J. H. (1997). A framework for probabilistic combination of multiple classifiers at an abstract level. Engineering Applications of Artificial Intelligence, 10(4), 379–385. Lauritzen, S. L., & Spiegelhalter, D. J. (1988). Local computations with probabilities on graphical structures and their application to expert systems. Journal of the Royal Statistical Society, Series B, 50(2), 157-224 Lam, L., & Suen, C. Y. (1997). Application of majority voting to pattern recognition: An analysis of its behavior and performance. IEEE Transactions on Systems, Man, and Cybernetics, 27(5), 553–568. Lee, J. (2003). Diagnosis of bugs in multi-column subtraction using Bayesian networks. Unpublished doctoral dissertation, Columbia University, U.S.A. Ludmila I. K. (2003). Combining Pattern Classifiers methods and algorithms. New Jersey: John Wiley & Sons, Inc. , Hoboken. Mislevy, R. J. (1995). Probability-based Inference in Cognitive Diagnosis. In P. Nichols, S. 52.