基於廣義隱藏式馬可夫模型之參數估計蒙地卡羅模擬研究基於廣義隱藏式馬可夫模型之參數估計蒙地卡羅模擬研究基於廣義隱藏式馬可夫模型之參數估計蒙地卡羅模擬研究

(1)

國立台中教育大學教育測驗統計研究所

理學碩士論文

指導教授：郭伯臣博士

基於廣義隱藏式馬可夫模型之參數估計

蒙地卡羅模擬研究

研究生：鄭弼文撰

中華民國九十五年一月

(2)

謝辭

回顧整個研究所的求學生涯中，得到許許多多的幫助與悉心的教導，才得以完成論文此論文的撰寫，心中充滿著對台中教育大學無限的感激與回憶。特別感謝指導教授郭伯臣老師在這兩年半的諄諄教誨，於百忙中給予學生專業知識及研究方向的指導。也非常感謝劉湘川教授的指導與毫無保留的照顧，並且讓我承接國科會的研究計畫，讓我深知專家學者的研究歷程，以及政府對研究人員的支持與照顧。在這兩年半的學期過程中，處處都有老師您悉心的叮嚀，讓我獲益良多。畢業後，我將帶著老師的祝福與期望邁向人生的下一個歷程，願能不辱師恩。感謝研究所的同學佳峯、冠志、佑誠，當我心情沮喪時，能適時地扶持我、幫助我，讓我能再度面對前方的挑戰；感謝我的研究伙伴、光佑、峻豪、友振…等，有了你們，讓我的生活更添加了無比的樂趣。感謝摯愛的父母、姑姑、爺爺奶奶的支持，尤其是爺爺，從考研究所到研究所畢業前的每一次餐桌上的聚會，都給我最誠摯的鼓勵與最完整的愛，讓我每次回到家鄉時，都能感受到長輩們的期盼與鼓勵，帶著那些期許讓我覺得應該成為怎樣的人和做完一切我該完成的事。最後，還是將碩士學位的成就獻給遠在南部的父母及爺爺。謝謝女友韻如，在論文完成期間的砥礪與英文知識的教導，使我不論是在英文閱讀或是寫作上，有了相當大的進步。並且當我相當疲累時，為我送上一杯熱騰騰的拿鐵，還附上許多充滿關愛的話語，讓我能再度提起精神，努力完成論文的撰寫。未來在人生的旅途上，若能有妳一起相伴，一路相隨，將永遠不再寂寞。鄭弼文謹致九十五年一月

(3)

摘要

原有之隱藏式馬可夫模型之各時間點「符號機率矩陣」均須相同，屬於「固定型隱藏式馬可夫模型」，僅能應用在符號機率固定之測驗分析。因此，其適用範圍相當有限，本論文擴張定義「重複測量之變動型隱藏式馬可模型」稱之為「廣義隱藏式馬可夫模型：GHMM」並使用 GHMM 專有之參數估計演算法來估計參數，使其能有效地應用在全民英檢之類，具狀態轉移機率之時間序列相關之線上測驗分析；同時亦可適用於一般任意選題作答非時間序列相關之紙筆測驗分析。本論文除簡介其理論架構外，並針對 GHMM 提出實例說明，進而發展電腦應用程式藉以進行參數估計蒙地卡羅模擬研究，且將此模型藉由實際施測來驗證其實用性，最後提出最佳的使用時機，方便教學研究者參考與應用。關鍵字: 「廣義隱藏式馬可夫模型；GHMM」、「時間序列 GHMM 模型」、「非時間序列 GHMM 模型」

(4)

Abstract

The symbol probability matrix at every time point must be the same in the original Hidden Markov Model（HMM）. HMM is treated as “Fixed Hidden Markov Model” and is only applied for the testing analysis which has the same symbol probability. Hence, the suitable scope of HMM is quite limited. This study expends the definition of “Hidden Markov Model” by including dynamic symbol probability. We call the expended definition as “Generalizing Hidden Markov Model; GHMM”. The study applies proper parameter estimation algorithm to estimate so that the usability of GHMM is not only for on-line-testing with transiting probability but also for general

paper-pencil-testing with item random answering. A theoretical framework of GHMM model is introduced in the study. Furthermore, we design a usable program for parameter estimation of the testing model based on GHMM model in a Monte Carlo simulation study, and make sure that the above model is useful by testing in the elementary school.Finally, we proposethe best timing to use GHMM and provide suggestions for the teaching researchers.

Keywords：

「Generalizing hidden Markov model ; GHMM”」、「Time series GHMM

(5)

目錄

第一章緒論 ... 1 第一節研究背景及動機 ...1 第二節研究目的 ...3 第三節名詞釋義 ... 4 第二章文獻探討 ... 5 第一節隱藏式馬可夫模型的簡介 ... 5 第二節廣義隱藏式馬可夫模型的探討 ... 9 第三節試題反應理論 ... 11 第三章研究方法 ... 15 第一節研究架構 ...15 第二節研究模式及架構 ...17 第三節研究工具 ... 38 第四章研究結果 ... 39 第一節模擬研究之探討 ... 39 第二節實際施測 ...51 第五章結論及建議 ... 82 第一節研究結論 ...82 第二節後續研究建議 ...84 參考文獻 ... 83 附錄 ...86

(6)

表目次

表 4-1 總體參數估計的誤差之比較表 ... 48 表 4-2 轉移矩陣 ... 51 表 4-3 第一題之符號矩陣 ... 52 表 4-4 第二題之符號矩陣 ... 53 表 4-5 第三題之符號矩陣 ... 54 表 4-6 第四題之符號矩陣 ... 55 表 4-7 第五題之符號矩陣 ... 56 表 4-8 第六題之符號矩陣 ... 57 表 4-9 第七題之符號矩陣 ... 58 表 4-10 第八題之符號矩陣 ... 59 表 4-11 第九題之符號矩陣 ... 60 表 4-12 第十題之符號矩陣 ... 61 表 4-13 第十一題之符號矩陣 ... 62 表 4-14 第十二題之符號矩陣 ... 63 表 4-15 第十三題之符號矩陣 ... 64 表 4-16 第十四題之符號矩陣 ... 65 表 4-17 第十五題之符號矩陣 ... 66 表 4-18 第十六題之符號矩陣 ... 67 表 4-19 第十七題之符號矩陣 ... 68 表 4-20 第十八題之符號矩陣 ... 69 表 4-21 第十九題之符號矩陣 ... 70 表 4-22 第二十題之符號矩陣 ... 71 表 4-23 第二十一題之符號矩陣 ... 72 表 4-24 第二十二題之符號矩陣 ... 73

(7)

表 4-25 第二十三題之符號矩陣 ... 74 表 4-26 第二十四題之符號矩陣 ... 75 表 4-27 第二十五題之符號矩陣 ... 76 表 4-28 第二十六題之符號矩陣 ... 77 表 4-29 第二十七題之符號矩陣 ... 78 表 4-30 第二十八題之符號矩陣 ... 79 表 4-31 第二十九題之符號矩陣 ... 80 表 4-32 第三十題之符號矩陣 ... 81

(8)

圖目次

圖 2-1 25 題 4 選 1 三狀態變動機率序列相關之例圖 ... 10 圖 2-2 25 題 4 選 1 三狀態固定機率序列獨立之例圖 ... 10 圖 3-1 研究架構圖 ... 16 圖 3-2 正算程序 ...21 圖 3-3 逆算程序 ...21 圖 3-4 25 題 4 選 1 選擇題有 2 個作答狀態之HMM模式 ... 32 圖 3-5 25 題 4 選 1 選擇題有 3 個作答狀態之HMM ...33 圖 3-6 25 題 4 選 1 選擇題有 2 個作答狀態且有 25 個「符號機率矩陣」不同的測驗之GHMM模式圖 ... 33 圖 3-7 25 題 4 選 1 選擇題有 3 個作答狀態且有 25 個「符號機率矩陣」不同的測驗之GHMM模式圖 ... 34 圖 3-8 25 題 4 選 1 選擇題為固定獨立狀態及變動符號機率測驗之GHMM模式圖 ... 35 圖 4-1 變數A在固定題數為 30 題時之誤差情形 ... 40 圖 4-2 變數A在固定題數為 50 題時之誤差情形 ... 40 圖 4-3 變數B在固定題數為 30 題時之誤差情形 ... 41 圖 4-4 變數B在固定題數為 50 題時之誤差情形 ... 41 圖 4-5 變數PI在固定題數為 30 題時之誤差情形 ... 42 圖 4-6 變數PI在固定題數為 50 題時之誤差情形 ... 42 圖 4-7 變數A在固定人數為 200 人之誤差情形 ... 43 圖 4-8 變數A在固定人數為 500 人之誤差情形 ... 44 圖 4-9 變數A在固定人數為 1000 人之誤差情形 ... 44 圖 4-10 變數B在固定人數為 200 人之誤差情形... 45 圖 4-11 變數B在固定人數為 500 人之誤差情形... 45

(9)

圖 4-12 變數B在固定人數為 1000 人之誤差情形 ... 46 圖 4-13 變數PI在固定人數為 200 人之誤差情形 ...46 圖 4-14 變數PI在固定人數為 500 人之誤差情形 ...47 圖 4-15 變數PI在固定人數為 1000 人之誤差情形 ... 47 圖 4-16 針對觀察PI之絕對誤差情形 ... 49 圖 4-17 針對觀察A之絕對誤差情形 ... 49 圖 4-18 針對觀察B之絕對誤差情形 ... 49 圖 4-19 第一題之符號矩陣 ... 52 圖 4-20 第二題之符號矩陣 ... 53 圖 4-21 第三題之符號矩陣 ... 54 圖 4-22 第四題之符號矩陣 ... 55 圖 4-23 第五題之符號矩陣 ... 56 圖 4-24 第六題之符號矩陣 ... 57 圖 4-25 第七題之符號矩陣 ... 58 圖 4-26 第八題之符號矩陣 ... 59 圖 4-27 第九題之符號矩陣 ... 60 圖 4-28 第十題之符號矩陣 ... 61 圖 4-29 第十一題之符號矩陣 ... 62 圖 4-30 第十二題之符號矩陣 ... 63 圖 4-31 第十三題之符號矩陣 ... 64 圖 4-32 第十四題之符號矩陣 ... 65 圖 4-33 第十五題之符號矩陣 ... 66 圖 4-34 第十六題之符號矩陣 ... 67 圖 4-35 第十七題之符號矩陣 ... 68

(10)

圖 4-38 第二十題之符號矩陣 ... 71 圖 4-39 第二一題之符號矩陣 ... 72 圖 4-40 第二十二題之符號矩陣 ... 73 圖 4-41 第二十三題之符號矩陣 ... 74 圖 4-42 第二十四題之符號矩陣 ... 75 圖 4-43 第二十五題之符號矩陣 ... 76 圖 4-44 第二十六題之符號矩陣 ... 77 圖 4-45 第二十七題之符號矩陣 ... 78 圖 4-46 第二十八題之符號矩陣 ... 79 圖 4-47 第二十九題之符號矩陣 ... 80 圖 4-48 第三十題之符號矩陣 ... 81

(11)

表目次

表 4-1 總體參數估計的誤差之比較表 ... 49 表 4-2 轉移矩陣 ...52 表 4-3 第一題之符號矩陣 ... 53 表 4-4 第二題之符號矩陣 ... 54 表 4-5 第三題之符號矩陣 ... 55 表 4-6 第四題之符號矩陣 ... 56 表 4-7 第五題之符號矩陣 ... 57 表 4-8 第六題之符號矩陣 ... 58 表 4-9 第七題之符號矩陣 ... 59 表 4-10 第八題之符號矩陣... 60 表 4-11 第九題之符號矩陣... 61 表 4-12 第十題之符號矩陣... 62 表 4-13 第十一題之符號矩陣... 63 表 4-14 第十二題之符號矩陣... 64 表 4-15 第十三題之符號矩陣... 65 表 4-16 第十四題之符號矩陣... 66 表 4-17 第十五題之符號矩陣... 67 表 4-18 第十六題之符號矩陣... 68 表 4-19 第十七題之符號矩陣... 69 表 4-20 第十八題之符號矩陣... 70 表 4-21 第十九題之符號矩陣 ... 71 表 4-22 第二十題之符號矩陣 ... 72 表 4-23 第二十一題之符號矩陣 ... 73

(12)

表 4-25 第二十三題之符號矩陣 ... 75 表 4-26 第二十四題之符號矩陣 ... 76 表 4-27 第二十五題之符號矩陣 ... 77 表 4-28 第二十六題之符號矩陣 ... 78 表 4-29 第二十七題之符號矩陣 ... 79 表 4-30 第二十八題之符號矩陣 ... 80 表 4-31 第二十九題之符號矩陣 ... 81 表 4-32 第三十題之符號矩陣 ... 82

(13)

第一章緒論

本研究旨在探討隱藏式馬可夫模型用於測驗分析中之研究，本章首先說明本研究之研究背景及動機，次說明本研究之研究目的，最後就重要名詞加以界定。

第一節研究背景及動機

利用可觀測的資訊對未知現象作判斷與分析乃是統計學所面臨的必然問題；在過去，由於運算能力的不足以及資料量的過於龐大，使得相當多的研究停滯不前；然而，隨著資訊時代的來臨，電腦具有更加強大的運算及處理能力，因此對於大量資料的分析有很大的助益。「隱藏馬可夫模型」是由可觀察之觀測序列與觀察不到之狀態序列所構成。狀態序列裡的狀態會產生觀測符號，其出現機率就稱為“觀測符號機率＂，而這些觀測符號即構成觀測序列。兩序列均由隨機過程所產生，因此隱藏馬可夫模型是一種雙重的隨機過程，具有整體隨機性和局部穩定性；此模型衍生於馬可夫鏈，在波氏(Baum) 等人提出將馬可夫模型參數最佳化的方法後，成功的將它運用在語音辨識上，此後更有應用於簽名辨別、基因辨別與氨基酸鏈搜尋等等。當在處理隱藏馬可夫模型時，最重要的工作是找出模型的參數。利用完整的觀測序列將模型參數反覆遞迴估算，直到參數收斂為止。如全民英文能力檢定測驗等類似之教學測驗，若測驗試題之作答依時間序列出現，每一受試者作答試題，因時間之限制，可能有多種（作答策略）狀態發生；例如：「認知作答」、「猜測作答」、及「遺漏未答」等，且前後試題具轉移機率關係時，並不能單純直接地應用「試題反應理論」進行測驗分析，因為一般之「試題反應理論」有「局部獨立假設」之限制，

(14)

是「二點計分試題反應模式」或「多點計分試題反應模式」在「遺漏未答」之情況，均少見以虛擬參數進行估計之處理方式，另在既有之「等級反應模式」、「部分給分模式」、及「量表評定模式」中，均少見有處理「猜測作答」之情況，當受試者答對時，很難自測驗分析之結果直接得悉是否為猜測所得，換言之，一般之「試題反應理論」不僅力有未逮且不合模式假設前題。事實上，上述類似之教學測驗之每一受試者之測驗作答反應序列，均各可視為一種隱藏式馬可夫模型序列，惟現有之隱藏式馬可夫模型（HMM 模式），其「符號機率矩陣；B」及「狀態轉移機率矩陣；A」均限定為不隨時間點變動之常數矩陣，亦即；其全部 T 個時間點之「符號機率矩陣」；及（T-1）個「狀態轉移機率矩陣」均相同；亦即；A1 =A2 = =... AT−1= A， 1 2 ... T B =B = =B =B，僅適用於各時間點符號機率固定，且前後試題具轉移機率關係為定值之測驗分析，一般而言，上述類似之教學測驗之 T 個試題對應時間點之「符號機率矩陣」及（T-1）個「狀態轉移機率矩陣」常不盡相同，故本研究考慮擴張討論隨時間點變動之「符號機率矩陣」序列

(

B B1, 2,...,BT

)

，及「狀態轉移機率矩陣」序列

(

A A1, 2,...,AT−1

)

，亦即；全部 T 個時間點之「符號機率矩陣」及（T-1）個「狀態轉移機率矩陣」可不盡相同。為區辨計，特稱研究擴張發展之隱藏式馬可夫模型族之為「變動型 HMM 模式」，並稱其重複測量模式族為「廣義隱藏式馬可夫模型；GHMM」，另仿「波氏法」，提出 GHMM 專有之參數三種最佳化解演算法；「重複測量波氏法」、「符號機率變動法」、「符號及狀態機率變動法」，進而結合試題反應理論(IRT)中之二點計分、等級計分及部分計分等模式，盼能提供一般化具轉移機率關係測驗分析之一有力之研究分析工具。

(15)

第二節研究目的

根據上述之動機，在觀測序列資料下，本研究將用EM法估計參數： • 【E步驟】：(求期望值或平均值)：只要參數有重複測量情況，即可以重複測量之樣本平均值作為參數之迭代估計值，在 GHMM中A、B參數有重複測量情況。 • 【M步驟】：(求極大化值)：取相繼二次迭代之GHMM概似值之最大者為參數之迭代估計值。使用上述的方法重複估算隱藏馬可夫模的型參數直到收斂，便能獲得模型中許多未知的參數，期望能提供日後運用隱藏馬可夫模型的使用者一些參考。故整體而言，本研究之研究目的有以下幾點：一、在變動的隱藏馬可夫模型參數下，以蒙地卡羅之方法產生一完整的觀測序列來模擬學生之作答情型，並依據理論撰寫程式來進行估算。二、將上述的方法分別代入人數分別為200、500、1000人；試題數分別為 30、50題的程式中，探討試題數與人數對誤差的影響情形。三、以一組實際施測的學生作答資料，代入上述的模式與程式中，說明學生對此份試題的作答策略，作為教師測驗與評量後的參考指標。

(16)

第三節名詞釋義

隱藏式馬可夫模型已在多個領域廣泛的應用，但依然要依其所應用的情形將模型做適當的改變，不過隱藏式馬可夫模型的精神卻沒改變，即模型應具有觀測序列及隱藏狀態序列。本研究所使用隱藏式馬可夫模型，任意狀態所產生之觀測符號，其機率值是由一個蒙地卡羅隨機過程所決定，目的是模擬學生的作答情形，之後再藉由一連串的演算法估計出隱藏之參數，並計算誤差，因此本論文可說是「基於廣義隱藏式馬可夫模型之測驗分析模式之參數估計蒙地卡羅模擬研究」。至於其他詳細的內容將於文獻探討中一一說明。

(17)

第二章文獻探討

第一節隱藏式馬可夫模型的簡介

隱藏式馬可夫模型（Hidden Markov Model；HMM）源自馬可夫鍊（Markov Chains；Markov, 1907）；最早是由 Baum 和 Petrie 在 1966 年所發展出來，其基於統計的機率模型，並於近十幾年來逐漸被廣泛應用，概因其擁有豐富的數學架構及基礎能夠成功地解決所欲處理的問題；而 HMM 這個名稱最早是由 Poritz 命名（1988）而來，由於 HMM 為雙重隨機程序之混合機率模式，包含一隱藏狀態序列及一可觀測之符號序列，故而有此命名。

壹、隱藏式馬可夫模型之基本定義

隱藏式馬可夫模型 (Hidden Markov Model ; HMM)源自馬可夫(Markov Chains ; A. A. Markov 1907)，為雙重隨機程序之混合機率模式，包含狀態集合、觀測符號的集合；一隱藏狀態序列，及一可觀測之符號序列；。 HMM 模式由 A, B ,π 三種機率參數構成之；故可簡記為λ = ( A, B ,π ) 。分別定義如下：（一）Q=

{

1,2,…,N

}

表狀態集合，其中N 表狀態之個數。（二）V =

{

1, …2, ,M

}

表觀測符號的集合，其中M 表符號之個數。每個狀態中可能有不同的觀測符號，且觀測符號可以是一向量、數值或符號。（三）

(

w

)

T w w w o o o O = ₁ , ₂,…, 表受試者 w 作答可觀測到之符號序列，其中T表觀測序列的長度， w t o 表受試者 w 在時間t時作答所對應的觀測符號。

(

)

(18)

狀態序列長度， w t

s 表受試者 w 在時間t時之作答策略狀態。

（五）π =

[ ]

πi 1×_N ：表初始狀態機率矩陣 (initial state probability

matrix)。

[

1, 2,..., N

]

π = π π π 其中

∑

= = N i i 1 1 π ， P(s1 i) w i = = π ，i=1,2,…N i π 為初始狀態機率；表第一個時間點時會產生狀態i的機率。（六）At =

[ ]

aij _N_×_N：表狀態轉移機率矩陣(state-transition probability matrix)。 ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ = NN N N N N a a a a a a a a a 2 1 2 22 21 1 12 11 A 其中

∑

= = N j ij a 1 1，i=1,2,…N

(

s j s i

)

P a_ij = _tw₊₁ = | _tw = ，i,j=1,2,…N、t=1,2,…T −1 ij a 表示在狀態i之下，轉移到狀態j的機率。（七） B=

[ ]

bj

( )

k _N_×_M ：表觀測符號機率矩陣 (observation symbol probability matrix)。

( )

⎥⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ = M b b b M b b b M b b b N 1 1 1 1 2 1 1 1 2 1 2 1 2 1 B 其中

∑

( )

= = M k j k b 1 1， j=1 …,2, ,N b

( )

k P

(

o k stw j

)

w t j = = | = ，j=1 …,2, ,N、k =1 …,2, ,M 、t =1 …,2, ,T

(19)

( )

k b_j 表在狀態j之下，產生觀測符號k的機率。（八）

(

|λ

)

(

1 , 2,

)

|λ

)

w T w w w o o o O P = … 表受試者 w 在作答模型λ之下產生觀測符號序列

(

w

)

T w w w o o o O = 1 , 2,… 的機率。

貳、隱藏式馬可夫模型之基本性質

若 HMM 模型λ =

(

[ ]

A ,

[ ]

B ,π

)

有N 種隱藏狀態、M 種觀測符號，觀測符號序列

(

w

)

T w w w o o o O = 1, 2,… ，其相對的狀態序列

(

)

w T w w w s s s S = 1 , 2,… ，則 HMM 具有

與 HMM 相同之下列四個性質(MacDonald & Zucchini, 1997)：性質一：

(

1 , | ,λ

)

( 1 , , | ,λ) ( 1, , | ,λ) w t w T w t w t w t w w t w T w s o o P s o o P s o o P … = … ⋅ ₊ … ，t=1,2…T 性質二： P

(

o₁w,…o_Tw |s_tw,s_tw₊₁,λ

)

=P(o₁w,…,o_tw |s_tw,λ)⋅P(o_tw₊₁,…,o_Tw |s_tw₊₁,λ) ， 1 2 , 1 − = T t … 性質三：P

(

o_tw,…o_Tw |s_lw,s_tw,λ

)

=P(o_tw,…,o_Tw |s_tw,λ)， 1≤l≤t≤T 性質四：

(

, | ,λ

)

( | ,λ) ( 1, , | ,λ) w t w T w t w t w t w t w T w t o s P o s P o o s o P … = ⋅ ₊ … ， t=1,2 T HMM模式之理論架構要點有三；（I）P O

(

;λ

)

值之計算、（II）A , B ,π 三種機率參數之估計、（III）最佳隨機狀態序列s

(

s s1, 2, ,sT

)

∗ ₌ ∗ ∗ _… ∗ _之搜尋，上述三者若獲得解決，則可藉以預測搜尋或比較具狀態轉移機率相關之特

(20)

預測」「動態簽名」等方面，近來「HMM與資訊結合之研究與應用」正在諸多不同領域內熱門地持續發展。

(21)

第二節廣義隱藏式馬可夫模型的探討

今欲考慮應用於測驗分析，而 HMM 與資訊結合之研究與應用正在諸多不同領域內熱門地持續發展中，唯僅能適用於同質試題之測驗分析中，劉湘川（2004）因而擴張 HMM ，考慮隨時間點變動之符號機率矩陣序列，即原有之HMM模式中之「符號機率矩陣；B」限定為不隨時間點變動之常數矩陣，亦即；其全部 T 個時間點之「符號機率矩陣」均相同； 1 2 ... T B =B = =B =B，僅適用於各時間點符號機率固定，前後試題具轉移機率關係之測驗分析中，本研究擴張考慮隨時間點變動之「符號機率矩陣」序列

(

B B1, 2,...,BT

)

，其全部T個時間點之「符號機率矩陣」可不盡相同。為區辨計，特稱本研究擴張發展之隱藏式馬可夫模型族之為「變動型HMM模式」，並稱其重複測量模式族為「廣義隱藏式馬可夫模型；GHMM」，另仿「波氏法」，提出GHMM專有之參數三種最佳化解演算法；「重複測量波氏法」、「符號機率變動法」、「符號及狀態機率變動法」則可有效地應用於一般化具轉移機率關係之測驗分析中，且有更廣闊應用發展空間。因此其不僅適用於如全民英檢類具狀態轉移機率之時間序列之線上測驗分析，同時亦可適用於一般任意選題作答非時間序列之紙筆測驗分析。 GHMM 模型可依功能概分為兩類：在任意時間點 t 作答之前，若各狀態之轉移機率不盡相同時，即表作答第 t 題之前之轉移機率會受作答第（t-1）題的結果影響時，稱為「時間序列 GHMM 模型」，如線上測驗之全民英檢；在任意時間點t作答之前，若各狀態均有相同的轉移機率時，即表作答第 t 題之前之轉移機率不受作答第（t-1）題的結果影響時，稱為「非時間序列 GHMM 模型」，如一般在任意時間點 t 可任意選題作答之紙

(22)

未答 0.05 0.05 _A_~_D A A A A A A A B B B B B B C C C C C C D D D D D D 猜測作答認知作答 S S T T 0.4 0.3 0.2 0.3 0.2 0.4 0.2 0.4 0.3 0.1 0.1 0.1 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.05 0.1 0.85 0.1 0.1 0.85 0.85 0.1 0.1 0.1 0.1 0.8 0.8 0.1 0.1 0.05 0.05 0.85 0.85 1 1 1 − B 1 2 s = s2=1 s25 =3 − − − − − − − − − 0 0 0 0 0 0 0 0 0 ~ A D A~D 1 1 1

...

測作答、3：認知作答）：型一：選擇題型測驗分析時間序列 GHMM 應用實例：圖2-1 25 題 4 選 1 三狀態變動機率序列相關之例圖型二：選擇題型測驗分析非時間序列 GHMM 應用實例圖2-2 25 題 4 選 1 三狀態固定機率序列獨立之例圖未答 0 .0 5 0 .0 5 _A_~_D A A A A A A A B B B B B B C C C C C C D D D D D D 猜測作答認知作答 S S T T 0.4 0 .3 0.2 0.3 0 .2 0 .4 0.2 0 .4 0 .3 0.1 0.1 0.1 0.25 0.25 0 .2 5 0 .2 5 0 .2 5 0 .2 5 0 .2 5 0 .2 5 0 .2 5 0 .2 5 0 .2 5 0 .2 5 0 .0 5 0.1 0 .8 5 0 .1 0 .1 0.85 0 .8 5 0.1 0.1 0.05 0.05 0.85 0.85 1 1 1 − B 1 2 s = s2=1 s25=3 − − − − − − − − − 0 0 0 0 0 0 0 0 0 ~ A D A~ D 1 1 1 ... 0 .0 5 0 .0 5 0 .1 0 .1 0 .8 5 0 .8 5

(23)

第三節試題反應理論

壹、試題反應理論之假設

測驗需具有下列幾項基本假設，唯有在這些假設都成立的前提下，試題反應模式才能被用來分析所有的測驗資料（Weiss＆Yoes,1991）其假設有四：一、單向度（unidimensionality）試題反應理論中的各種模式有個最常用的共同假設，那就是測驗中的各個試題都測量到同一種共同的能力或潛在特質；這種單一能力或潛在特質（因素）必須包含在測驗試題裡的假設，便是單向度的假設。其實，在實際的測驗情境裡，考生在測驗上的表現情形很少是純粹受到一種因素的影響，其他因素如：成就動機、考試焦慮、應試技巧、及人格特質等，也都會影響到測驗的結果；因此，試題反應理論中對測驗必須具有單向度因素的基本看法，認為只要該測驗具有能夠影響測驗結果的一個「主要成份或因素」（dominant component or factor），便算符合單向度假設的基本要求，而這個主要因素所指的，即是該測驗所測量到的單一能力或潛在特質。適用於含有單一主要因素測驗資料的試題反應模式，便稱作單向度模式。二、局部獨立性（local independence）它的涵義是說，當影響測驗表現的能力被固定不變時，考生在任何一對試題上的反應，在統計學上而言是獨立的；換句話說，在考慮考生的能力因素後，考生在不同試題上的反應間沒有任何關係存在。簡單地說，這意謂著涵蓋在試題反應模式裡的能力因素，才是唯一影響考生在測驗試題上做反應的因素；這組能力因素代表整個潛在空間（complete latent

(24)

代表具有能力為θ的考生在第 i 試題上的反應機率，且P U

(

_i =1|θ

)

為正確反應的機率，P U

(

_i =0 |θ

)

為錯誤反應的機率，那麼局部獨立性的涵義：

(

1 2 3

)

(

1

) (

2

) (

3

)

(

)

(

)

1 , , , , | | | | | | n n n i i P U U U U θ P U θ P U θ P U θ P U θ P U θ = = ⋅ ⋅ ⋅ ⋅ =

∏

… ，這條公式即是說明，對某一特定能力的考生而言，在某份測驗上的反應組型(response pattern)的機率，等於在單獨一題試題上反應機率的連乘積。例如，某位考生在一組三個試題測驗的反應組型為（1,1,0），其中 1 1, 2 1, 3 0 U = U = U = ，那麼，局部獨立性所要表達的意思即為：

(

1 1, 2 1, 3 0 |

)

(

1 1|

) (

2 1|

) (

3 0 |

)

1 2 3 P U = U = U = θ =P U = θ ⋅P U = θ ⋅P U = θ = ⋅ ⋅P P Q，其中

(

_1|

)

₁ i i i P =P U = θ 且Qi = −P，由於P U

(

i|θ

)

是一種條件機率（conditional probabilities）的表達方式，因此，局部獨立性假設又稱為條件獨立性（conditional independence）假設。通常，當單向度假設獲得成立時，局部獨立性假設也會獲得成立，就這一項涵義而言，這兩個概念是相通的（Lord, 1980； Lord & Novick, 1968），甚至於，即使資料不是單向度的，局部獨立性也可以獲得成立。只要整個潛在空間被界定清楚，亦即當所有影響表現的能力向度都考慮之後，局部獨立性便可獲得成立。局部獨立性在下列情況下無法成立：影響測驗表現的能力向度不只一種時，連鎖性試題，以及試題本身提供作答的線索等，在這種情況下，試題反應模式也就無法適用於該筆測驗資料。三、非速度測驗試題反應模式所適用的情況有個隱含的基本假設，那就是測驗的實施不是在速度限制下完成的；換句話說，考生的考試成績不理想，是由於能力不足所引起，而不是由於時間不夠答完所有試題所致。由於這項假設是隱含在單向度假設裡，所以不常被試題反應理論學者所提起，但是在選用試題反應模式時，這項基本假設亦必須要被考慮到才行。

(25)

四、知道—正確假設（know-correct assumption）

如果考生知道某一試題的正確答案，必然會答對該試題；換句話說，如果他答錯某一試題，他必然不知道該試題的答案。當然，把正確答案填錯在別的格子上以致整個試卷都錯的例子，不在本假設所考慮的範圍內，因為人為的疏忽不是任何測驗理論所能顧及到的。此外，省略不答的試題（omitted items）和未答完的試題（unreached items）有所不同，前者是受能力影響所致，後者是受施測速度影響所致。本假設僅能適用於前者，它和前個假設一樣，都隱含在單向度假設裡，故殊少被提及。

貳、試題反應理論的參數模式

一、二元計分單參數對數模式

二元計分單參數對數模式(One-parameter bivariate logistic model) 又稱 Rasch 模式(Rasch,1960;Wright & Stone,1979;Wright &

Masters,1982)，式中僅有「難度參數(difficulty parameter);bi」，令xis 表受試者 s 在第 i 題的作答反應情形，θ 表第 s 位受試者能力參數，其機s 率函數如下: pi(xis＝1｜θ ) = s )) ( 7 . 1 exp( 1 1 i S −b − + θ Rasch 模式只涉及難度參數，比較簡單容易使用，且有很好的數理統計性質，應用甚廣，唯其須具「等鑑別力」及「最小猜測」之假定，常被批評為不符實際，故而有下列二元計分雙參數對數模式、二元計分三參數對數模式、二元計分四參數對數模式、等二元計分多參數試題特徵曲線模式。

(26)

二、二元計分雙參數對數模式

二元計分雙參數對數模式 (Two-parameter bivariate logistic model)比 Rasch 模式多一「鑑別度參數(discrimination parameter)」，是由美國測驗學者 A.Birnbaum 修改自 F.M.Lord 的原始雙參數肩型模式 (Normal ogive model) 而來(Birnbaum,1968) 其機率函數如下:

pi(xis＝1｜θ ) ＝ s )) ( 7 . 1 exp( 1 1 i s i b a − − + θ 三、二元計分三參數對數模式

二元計分三參數對數模式(Three-parameter bivariate logistic model)比二元計分雙參數對數模式多了一個「猜測度參數(guessing parameter)」，大多用於選擇題的測驗，受試者會發生猜題現象

(Birnbaum,1968;Lord,1980;Mislevy & Bock,1990)，其機率函數如下: pi(xis＝1｜θ ) ＝cs i＋ )) ( 7 . 1 exp( 1 1 i s i i b a c − − + − θ

(27)

第三章研究方法

本章主要介紹隱藏式馬可夫過程的研究方法，主要分成三節分述之，第一節為研究架構，第二節為研究模式及步驟，第三節為研究工具。

第一節研究架構

本研究根據理論撰寫電腦程式，以電腦模擬產生資料的方式，來比較不同人數、試題數時的誤差來驗證理論的可行性及合理性，最後到國小進行施測，以取得實際的作答情形，再以本架構進行分析，以確認架構的可用性。圖 3-1 為本研究之研究動機、研究目的、研究背景以及參考相關文獻之後的研究架構圖。

(28)

圖 3-1 研究架構圖

擬定研究主題

數學理論推導

撰寫程式模擬

與真值求得誤差

出題並施測

模擬結果討論

分析實測資料

撰寫研究結果

閱讀相關文獻

(29)

第二節研究模式及步驟

壹、廣義隱藏式馬可夫模型之基本定義

廣義隱藏式馬可夫模型（GHMM）由

[ ] [ ]

At T, Bt _T,π 三種參數組成，其中

[ ] [

At T = A1,A2,...,AT

]

、

[ ] [

Bt T = B1,B2,...,BT

]

。且 GHMM 可簡記“模型λ＂，即：

[ ] [ ]

(

π

)

λ = At T, Bt _T, ，當 A1 = A2 =...= AT = A 且 B1 =B2 =...=BT =B 時

[ ] [ ]

(

A_t _T, B_t _T,

)

λ = π 可簡記為λ =

(

A, B,π

)

，此時即為傳統之 HMM，換言之，HMM 只是 GHMM 之一特例，而 GHMM 是 HMM 一般化之推廣。GHMM 基本符號定義如下：（一）Q=

{

1,2,…,N

}

表狀態集合，其中N 表狀態之個數。（二）V =

{

1, …2, ,M

}

表觀測符號的集合，其中M 表符號之個數。每個狀態中可能有不同的觀測符號，且觀測符號可以是一向量、數值或符號。（三）

(

w

)

T w w w o o o O = ₁ , ₂,…, 表受試者 w 作答可觀測到之符號序列，其中T表觀測序列的長度， w t o 表受試者 w 在時間t時作答所對應的觀測符號。（四）

(

w

)

T w w w s ,s , ,s S = ₁ ₂ … 表受試者 w 不可觀測之作答策略狀態序列，其中T表狀態序列長度， w t s 表受試者 w 在時間t時之作答策略狀態。

（五）π =

[ ]

πi 1×_N ：表初始狀態機率矩陣 (initial state probability

matrix)。

[

, ,...,

]

π = π π π 其中

∑

= N 1 π ，π =P(sw =i)，i=1,2,…N

(30)

i π 為初始狀態機率；表第一個時間點時會產生狀態i的機率。（六）

[ ]

t _N _N ij t a A = _× ：表在時間點 t 之狀態轉移機率矩陣(state-transition probability matrix)。 ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ = t NN t N t N t N t t t N t t t a a a a a a a a a 2 1 2 22 21 1 12 11 A 其中

∑

= = N j t ij a 1 1，i=1,2,…N

(

s j s i

)

P a_ijt = _tw₊₁= | _tw = ，i,j=1,2,…N、t=1,2,…T−1 t ij a 為時間點 t 之狀態轉移機率；表時間點 t 時，在狀態i 之下，轉移到狀態j的機率。（七）

[ ]

t

( )

_N _M j t b k B = _× ：表在時間點 t 之觀測符號機率矩陣(observation

symbol probability matrix)。

( )

⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ = M b b b M b b b M b b b t t t N t t t t t t t 1 1 1 1 2 1 1 1 2 1 2 1 2 1 B 其中

∑

( )

= = M k j k b 1 1， j=1 …,2, ,N bt_j

( )

k =P

(

o_tw =k|s_tw = j

)

， j=1 …,2, ,N、k=1 …,2, ,M 、t=1 …,2, ,T

( )

k btj 表時間點 t，在狀態j之下，產生觀測符號k的機率。（八）P

(

O_w |λ

)

=

(

o₁w,o₂w,…o_Tw

)

|λ

)

表受試者 w 在作答模型λ之下產生觀測符號序列

(

w

)

T w w w o o o O = ₁ , ₂,… 的機率。

(31)

貳、廣義隱藏式馬可夫模型之基本性質

若 GHMM 模型λ=

(

[ ] [ ]

A_t _T, B_t _T,π

)

有N種隱藏狀態、M種觀測符號，觀測符號序列

(

w

)

T w w w o o o O = ₁, ₂,… ，其相對的狀態序列

(

w

)

T w w w s s s S = ₁ , ₂,… ，則 GHMM

具有與 HMM 相同之下列四個性質(MacDonald & Zucchini, 1997)：性質一：

(

₁ , | ,λ

)

( ₁ , , | ,λ) ( ₁, , | w,λ) t w T w t w t w t w w t w T w s o o P s o o P s o o P … = … ⋅ ₊ … ，t=1,2…T 性質二： P

(

o₁w,…o_Tw |s_tw,s_tw₊₁,λ

)

=P(o₁w,…,o_tw |s_tw,λ)⋅P(o_tw₊₁,…,o_Tw |s_tw₊₁,λ) ， 1 2 , 1 − = T t … 性質三：P

(

o_tw,…o_Tw |s_lw,s_tw,λ

)

=P(o_tw,…,o_Tw |s_tw,λ)， 1≤l≤t≤T 性質四：

(

, | ,λ

)

( | ,λ) ( ₁, , | w,λ) t w T w t w t w t w t w T w t o s P o s P o o s o P … = ⋅ ₊ … ， t =1,2 T

參、廣義隱藏式馬可夫模型之參數估計

「廣義隱藏式馬可夫模型；GHMM」在參數估計過程中，如同 HMM 之考慮過程，必須考慮四種演算法則：（一）P

(

O_w|λ

)

之遞迴精簡計算演算法；

「正算程序(Forward procedure)」與「逆算程序(Backward procedure)」，

（二）GHMM 參數重估(Parameter re-estimation) 演算法；本文推廣 Baldi & Brunak（1997）提及之波氏法，發展出下列三則：（I）「重複測量波氏法」、（II）「符號機率變動法」、（III）「符號狀態機率變動法」，（三）避

(32)

如下：（一）「正算程序」與「逆算程序」（劉湘川 2004）由性質二可得：

(

)

(

) (

)

(

)

(

)

1 1 2 2 3 3 1 | , | , | , | , | , | , w w w w w w w w w w T T T w w t t t P O S P o s P o s P o s P o s P o s λ λ λ λ λ λ = = ⋅ ⋅ ⋅ ⋅ =

∏

故可得P

(

O_w|λ

)

直接計算之通式為：

(

)

(

₁ ₁ ₂ ₁

)

(

₁

( ) ( )

₂

( )

)

1 2 1 2 , | w w w w w w w w T T T w w w T w w w w T s s s s s s s s s s s P O a a b o b o b o λ π − =

∑

⋅ ⋅ ⋅ … T t N stw =1,2…, ; =1,2… ，w=1,2,…W 可知P

(

O_w |λ

)

之直接計算量約2TNT次，而以正算程序與逆算程序求算

(

O_w |λ

)

P ，則計算量降低為大約TN2次，其定義及步驟簡介如下：（i）正算程序 1. 定義正算變數：α_tw

( )

i ； w=1 …,2, ,W

( )

i w t α ：表示受試者 w 在模型λ之下其時間t時停留於狀態i、觀察點序列為 w t w w o o o₁, ₂,…, 之機率。即α_tw

( )

i =P

(

o₁w,o₂w,…,o_tw,s_tw =i|λ

)

。 2. 正算程序步驟： (1) 初始值：

( )

w i i w o b i 1 1 =π ⋅ α ，i=1,2,…N (2) 遞廻正算變數：圖 3-2 為正算程序示意圖。

( )

w t j N i t ij w t w t j i a b o 1 1 1 + = + ⎥⋅ ⎦ ⎤ ⎢ ⎣ ⎡ _⋅ =

∑

α α ，t=1,2,…T−1、j=1,2,…N (3) 終止：α_Tw

( )

i = P

(

o₁w,o₂w,…,o_Tw,s_Tw = i|λ

)

， i=1,2,…N

(33)

因此由正算程序即可求出P

(

Ow |λ

)

：

(

)

(

1 2

)

( )

1 | , , | N w w w w w T T i P O λ P o o o λ α i = = … =

∑

1 =

w t

s

a

₁t_j

2 =

w t

s

a

₂t_j

․ ․

w₁ t

s

₊

=

j

․ ․

N

s

_tw

=

a

_Nt _j t i

a

₁

s

_tw₊₁

=

1

t i

a

₂

s

_tw₊₁

=

2 i

s

_tw

= ․ ․

․ ․

t iN

a

s

_tw₊₁

=

N

圖 3-2 正算程序圖 3-3 逆算程序（ii）逆算程序 1. 定義逆算變數：β_tw

( )

i ； w=1,2,…,W

( )

i w t β ：表示受試者 w 在模型λ、時間t時停留於狀態i之下其觀察點序列為 w T w t w t o o o₊₁, ₊₂,…, 之機率。即β_tw

( )

i =P

(

o_tw₊₁,o_tw₊₂,…,o_Tw |s_tw =i,λ

)

。 2. 逆算程序步驟： (1) 初始值：β_Tw

( )

i =P

(

o_Tw₊₁|s_Tw =i,λ

)

=1，i=1,2,…N 因受試者 w 作答觀測序列長度為 T，第 T+1 個觀察點為明確結束點，故令機率為 1。 (2) 遞廻逆算變數：圖 3-3 為逆算程序示意圖。

( )

₁

( )

, 1, 2,...,1 1 1 ⋅ = − − ⋅ = ₊ = +

∑

a b o j t T T i _tw N j w t j t ij w t β β 、 i,j =1,2,...,N

(34)

因此由逆算程序即可求出P

(

Ow |λ

)

：（劉湘川 2004）

(

)

(

)

( )

1 2 1 1 1 1 1 | , ,..., , | w N w w w w T i N w w i i i P O P o o o s i b o i λ λ π β = = = = = ⋅ ⋅

∑

由正算和逆算程序、條件機率及性質一可得：

(

)

(

) (

)

( )

1 2 1 2 1 2 , ,..., , | , ,..., , | , ,..., | , w w w w T t w w w w w w w w t t t t T t w w t t P o o o s i P o o o s i P o o o s i i i λ λ λ α β + + = = = ⋅ = = ⋅ 故可得：

(

)

(

)

( )

1 2 1 1 1 1 1 1 | , ,..., , | w N w w w w T t i N w w t t i N N w t w w t ij j t t i j P O P o o o s i i i i a b o j

λ

α

β

α

β

= = + + = = = = = ⋅ = ⋅ ⋅ ⋅

∑

∑∑

(35)

（二）GHMM 參數重估演算法

[ ] [ ]

(

π

)

λ = A_t _T, B_t _T, 中之參數矩陣A_t,B_t,π 之元素滿足下三者：

(

) (

₍

₎

)

( )

(

) (

₍

₎

)

(

s i

)

w W P W w T t j s P j s k s P j s k o P k b W w T t i s P j s i s P i s j s P a w i w t w t w t w t w t t j w t w t w t w t w t t ij ,..., 2 , 1 , | ,..., 2 , 1 , ,..., 2 , 1 , | | , , | ,..., 2 , 1 , 1 ,..., 2 , 1 , | | , , | 1 1 1 = = = = = = = = = = = = = − = = = = = = = = + + λ π λ λ λ λ λ λ 由 EM 之觀念知：「若將上 3 式之分子、分母改寫為觀測序列Ow之條件機率，則參數重估後之模型λ 產生觀測序列Ow的機率會增大」，﹝其證明

可參閱 MacDonald & Zucchini (1997)書之附錄 ﹞。

首先，定義二個函數φ_tw

( )

i,j 與ρ_tw

( )

i ：（i）φ_tw

( )

i,j =P

(

s_tw =i,s_tw₊₁ = j|O_w ,λ

)

, t =1,2,...T−1 、 i,j =1,2,...,N 由條件機率及性質二可得：

(

)

(

λ

) (

λ

)

λ , , | | , | , , 1 1 1 j s i s O P j s i s P O j s i s P w t w t w w t w t w w t w t = = ⋅ = = = = = + + +

( )

1 1

( )

w t w w t i a b oij j t t j α ₊ β₊ = ⋅ ⋅ ⋅ 進而可得：

( )

(

) (

₍

₎

)

( )

₍

( )

₎

( )

W w O P j o b a i O P O j s i s P O j s i s P j i w w t w t j t ij w t w w w t w t w w t w t w t ,... 2 , 1 | | | , , , | , , 1 1 1 1 = ⋅ ⋅ ⋅ = = = = = = = + + + + _λ β α λ λ λ φ

(36)

（ii）

( )

(

) (

₍

₎

)

₍

( )

₎

( )

₍

( )

₎

( )

(

)

( )

W w N i T t j i O P j o b a i O P j o b a i O P i i O P O i s P O i s P i N j w t w N j w t w t j t ij w t w N i w t w t j t ij w t w w t w t w w w t w w t w t ,... 2 , 1 , ,..., 2 , 1 , ,... 2 , 1 , | | | | | , , | 1 1 1 1 1 1 1 = = = = ⋅ ⋅ ⋅ = ⋅ ⋅ ⋅ = ⋅ = = = = =

∑

= = + + = + + φ λ β α λ β α λ β α λ λ λ ρ 由以上的參數，可知模型在λ 、觀測序列Ow條件下，在 1,2,..,T-1,T 之 T 個時間點內： (1) 受試者 w 出現狀態 i 之機率（期望次數）為：

(

)

_∑

( )

∑

= = = = T t w t T t w w t i O i s P 1 1 , | λ ρ (2) 受試者 w 出現狀態i 且觀測符號k 之機率（期望次數）為：

(

)

_∑

( )

∑

= = = = = = T k o t s t w t T t w w t w t w t i O i s k o P . . 1 1 , | , λ ρ (3) 受試者 w 出現狀態i轉移到狀態 j 之機率（期望次數）為：

(

)

_∑

( )

∑

− + = + = = = 1 1 1 1 | , , , T t w t T t w w t w t i s j O i j s P λ φ （I）「重複測量波氏法」當λ=

(

[ ] [ ]

A_t _T, B_t _T,π

)

退化為有重複測量之λ =

(

A, B,π

)

時，參數矩陣 π 、、B A 之元素滿足下三者：

(

) (

₍

₎

)

t T w W i s P j s i s P i s j s P a _w t w t w t w t w t ij 1,2, , 1 1,2, , | | , , | 1 1 = … − = … = = = = = = = + + _λ ，、 λ λ

( )

(

) (

₍

₎

)

t T w W j s P j s k o P j s k o P k b _w t w t w t w t w t j 1,2, , 1 1,2, , | | , , | = … − = … = = = = = = = ，、 λ λ λ

(

s i

)

w W P w i = 1 = |λ ， =1,2,…, π

(37)

推廣 Bilmes（1998）提及之波氏法，發展出「重複測量波氏法」，可藉以進行有重複測量之λ =

(

A, B,π

)

之參數重估，可估出新的模型參數

(

π

)

λ = A, B, ，其中：

(

)

(

)

( )

i i j N j i O i s P O j s i s P a _W w T t w t W w T t w t W w T t w w t W w T t w w t w t ij , 1,2, , , , | , | , 1 1 1 1 1 1 1 1 1 1 1 1 1 … = = = = = =

∑∑

= − = = − = = − = = − = + _， ρ φ λ λ

( )

(

)

(

)

( )

j j N j O j s P O j s k o P k b _W w T t w t W w T k o t s t w t W w T t w w t W w T t w w t w t j w t , , 2 , 1 , | , | , 1 1 1 . . 1 1 1 1 1 = = _… = = = =

∑∑

∑ ∑

∑∑

= = = = = = = = = _， ρ ρ λ λ

(

)

(

)

( )

N i W i O i s P O i s P W w w W w N i w w W w w w i 1,2, , , | , | 1 1 1 1 1 1 1 … = = = = =

∑

∑∑

∑

= = = = _， ρ λ λ π 由aij,bj

( )

k ,πi 可算得新的機率值

∏

(

)

= w w w O P 1 |λ 。如此反覆遞迴，直到

(

)

(

)

∑

= = − W w W w old w new w P O O P 1 1 | log | log λ λ 小於某一門檻值為止。（II）「符號機率變動法」適用於「轉移機率矩陣固定、符號機率矩陣變動」之情況，即 GHMM 模型為λ=

(

[ ] [ ]

At T, Bt T,π

)

=

(

A,

[ ]

Bt _T,π

)

，即A1 =A2 =…=AT =A。 GHMM 模型 λ 中參數矩陣 A、

[ ]

B_t _T、π 之元素滿足下三者：

(

) (

₍

₎

)

t T w W i s P j s i s P i s j s P a _w t w t w t w t w t ij 1,2, , 1 1,2, , | | , , | 1 1 = … − = … = = = = = = = + + _λ ，、 λ λ

( )

(

) (

₍

₎

)

t T w W j s P j s k o P j s k o P k b _w w t w t w t w t t j 1,2, , 1 1,2, , | | , , | = … − = … = = = = = = = ，、 λ λ λ

(38)

進行有重複測量之λ=

(

A,

[ ]

Bt _T,π

)

[ ]

(

π

)

λ = A, Bt _T, ，其中：

(

)

(

)

( )

i i j N j i O i s P O j s i s P a _W w T t w t W w T t w t W w T t w w t W w T t w w t w t ij , 1,2, , , , | , | , 1 1 1 1 1 1 1 1 1 1 1 1 1 … = = = = = =

∑∑

= − = = − = = − = = − = + _， ρ φ λ λ

( )

(

)

(

)

( )

j j N j O j s P O j s k o P k b _W w w t W k o t s w w t W w w w t W w w w t w t t j w t , , 2 , 1 , | , | , 1 . . 1 1 1 = = _… = = = =

∑

= = = = = _， ρ ρ λ λ 、t=1,2,…,T

(

)

(

)

( )

∑

∑∑

∑

= = = = _， ρ λ λ π 由 t

( )

_i j ij b k a , ,π 可算得新的機率值

∏

(

)

(

)

(

)

∑

= = − W w W w old w new w P O O P 1 1 | log | log λ λ 小於某一門檻值為止。（III）「符號狀態機率變動法」適用於「轉移機率矩陣與符號機率矩陣均變動」之情況，即 GHMM 模型為λ=

(

[ ] [ ]

At T, Bt _T,π

)

，模型λ中參數矩陣

[ ]

At T、

[ ]

Bt T、π 之元素滿足下三者：

(

) (

₍

₎

)

t T w W i s P j s i s P i s j s P a _w t w t w t w t w t t ij 1,2, , 1 1,2, , | | , , | 1 1 = … − = … = = = = = = = + + _λ ，、 λ λ

( )

(

) (

₍

₎

)

t T w W j s P j s k o P j s k o P k b _w t w t w t w t w t t j 1,2, , 1 1,2, , | | , , | = … − = … = = = = = = = ，、 λ λ λ

(

s i

)

w W P w i = 1 = |λ ， =1,2,…, π 進行有重複測量之λ =

(

[ ] [ ]

At T, Bt _T,π

)

(39)

[ ] [ ]

(

π

)

λ = At T, Bt _T, ，其中：

(

)

(

)

( )

i i j N t T j i O i s P O j s i s P a _W w w t W w w t W w w w t W w w w t w t t ij , 1,2, , , 1,2, , , , | , | , 1 1 1 1 1 … … = = = = = = =

∑

= = = = + _， ρ φ λ λ

( )

(

)

(

)

( )

j j N t T j O j s P O j s k o P k b _W w w t W k o t s w w t W w w w t W w w w t w t t j w t … … 2 , 1 , , , 2 , 1 , | , | , 1 . . 1 1 1 = = = = = = =

∑

= = = = = _， ρ ρ λ λ

(

)

(

)

( )

∑

∑∑

∑

= = = = _， ρ λ λ π 由 t

( )

_i j t ij b k a , ,π 可算得新的機率值

∏

(

)

(

)

(

)

∑

= = − W w W w old w new w P O O P 1 1 | log | log λ λ 小於某一門檻值為止。（三）避免溢位之條件機率演算法（劉湘川 2004）當受試者人數 W 或時間點數 T 或每個時間點之狀態數 N 變大時，在計算 GHMM 之相關機率時，會產生過多項機率值之乘積趨近於零，而導致電腦計算發生極小值溢位（underflow）的問題，此時可參 Levinson, Rabiner, and Sondhi（1983）利用條件機率之優良性質所提出量尺化（scaling）演算法，進而引進「GHMM 之條件機率演算法」如下步驟：

(40)

(

)

(

)

⎪⎩ ⎪ ⎨ ⎧ = = = − if t T o o o o p t if o p w t w w w t w , , 3 , 2 , , , , , | 1 , | t) CP(w, 1 2 1 1 … … λ λ

(

)

(

)

(

) (

)

(

)

( )

∏

= − = ⋅ ⋅ ⋅ ⋅ = = T k w T w w w T w w w w w w w T w w w k w CP o o o P o o o P o o P o P o o o P O P 1 1 2 1 2 1 3 1 2 1 2 1 , , , , , | , , | , | | | , , , | : λ λ λ λ λ λ … … 可得 2、利用CP

( )

w,t 及正算變數αtw

( )

i 產生條件正算變數

( )

i w t αˆ ：

( )

(

)

( )

(

)

( )

1 1 2 1 ˆ , , , , | 1, 2, , , 1, 2, , , 1, 2, , w t w t t k w t w w w t w t N w t i i i CP w k i P o o o i i i N t T w W α α α λ α α = = = = = = = =

∏

∑

… … … … 可得：

( )

_⎥ ⎦ ⎤ ⎢ ⎣ ⎡ ⋅ =

∏

= t k w t w t i i CP w k 1 , ˆ α α 3、利用CP

( )

w,t 及逆算變數βtw

( )

i 產生條件逆算變數

( )

i w t βˆ _：

( )

∏

= = _T t k w t w t t w CP i i , ˆ β β ,i=1,2,…,N , t=T,T−1,…,1 , w=1,2,…,W 可得：

( )

_⎥ ⎦ ⎤ ⎢ ⎣ ⎡ ⋅ =

∏

+ = + + T t k w t w t i i CP wk 1 1 1 βˆ , β 4、利用CP

( )

w,t 、αˆtw

( )

i 、

( )

i w t βˆ _可得 w

( )

_i _j t , φ 、ρtw

( )

i 之轉換式：

( )

(

)

( )

1 1 1 , , | , ˆ ˆ 1, 2,... 1 , , 1, 2,..., , 1, 2,... w w w t t t w w t w w t ij j t t i j P s i s j O i a b o j t T i j N w W φ λ α β + + + = = = = ⋅ ⋅ ⋅ = − = =

基於廣義隱藏式馬可夫模型之參數估計蒙地卡羅模擬研究基於廣義隱藏式馬可夫模型之參數估計蒙地卡羅模擬研究基於廣義隱藏式馬可夫模型之參數估計蒙地卡羅模擬研究

國 立 台 中 教 育 大 學 教 育 測 驗 統 計 研 究 所

理 學 碩 士 論 文

指 導 教 授 ： 郭 伯 臣 博 士

基於廣義隱藏式馬可夫模型之參數估計

蒙地卡羅模擬研究

研 究 生 ： 鄭 弼 文 撰

中 華 民 國 九 十 五 年 一 月

謝 辭

摘 要

Abstract

目 錄

表 目 次

圖 目 次

表 目 次

第一章 緒論

第一節 研究背景及動機

(

)

(

)

第二節 研究目的

第三節 名詞釋義

第二章 文獻探討

第一節 隱藏式馬可夫模型的簡介

壹、隱藏式馬可夫模型之基本定義

{

}

{

}

(

)

(

)

[ ]

[

]

∑

[ ]

∑

(

)

[ ]

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

∑

( )

( )

(

)

( )

(

)

(

(

)

)

(

)

貳、隱藏式馬可夫模型之基本性質

(

[ ]

[ ]

)

(

)

(

)

(

)

(

)

國立台中教育大學教育測驗統計研究所

理學碩士論文

指導教授：郭伯臣博士

研究生：鄭弼文撰

中華民國九十五年一月

謝辭

摘要

目錄

表目次

圖目次

表目次

第一章緒論

第一節研究背景及動機

第二節研究目的

第三節名詞釋義

第二章文獻探討

第一節隱藏式馬可夫模型的簡介

第二節廣義隱藏式馬可夫模型的探討

第三節試題反應理論

第三章研究方法

第一節研究架構

擬定研究主題

數學理論推導

撰寫程式模擬

與真值求得誤差

出題並施測

模擬結果討論

分析實測資料

撰寫研究結果

閱讀相關文獻

第二節研究模式及步驟