國 立 台 中 教 育 大 學 教 育 測 驗 統 計 研 究 所
理 學 碩 士 論 文
指 導 教 授 : 郭 伯 臣 博 士
基於廣義隱藏式馬可夫模型之參數估計
蒙地卡羅模擬研究
研 究 生 : 鄭 弼 文 撰
中 華 民 國 九 十 五 年 一 月
謝 辭
回顧整個研究所的求學生涯中,得到許許多多的幫助與悉心的教導, 才得以完成論文此論文的撰寫,心中充滿著對台中教育大學無限的感激與 回憶。 特別感謝指導教授郭伯臣老師在這兩年半的諄諄教誨,於百忙中給予 學生專業知識及研究方向的指導。也非常感謝劉湘川教授的指導與毫無保 留的照顧,並且讓我承接國科會的研究計畫,讓我深知專家學者的研究歷 程,以及政府對研究人員的支持與照顧。在這兩年半的學期過程中,處處 都有老師您悉心的叮嚀,讓我獲益良多。畢業後,我將帶著老師的祝福與 期望邁向人生的下一個歷程,願能不辱師恩。 感謝研究所的同學佳峯、冠志、佑誠,當我心情沮喪時,能適時地扶 持我、幫助我,讓我能再度面對前方的挑戰;感謝我的研究伙伴、光佑、 峻豪、友振…等,有了你們,讓我的生活更添加了無比的樂趣。 感謝摯愛的父母、姑姑、爺爺奶奶的支持,尤其是爺爺,從考研究所 到研究所畢業前的每一次餐桌上的聚會,都給我最誠摯的鼓勵與最完整的 愛,讓我每次回到家鄉時,都能感受到長輩們的期盼與鼓勵,帶著那些期 許讓我覺得應該成為怎樣的人和做完一切我該完成的事。最後,還是將碩 士學位的成就獻給遠在南部的父母及爺爺。 謝謝女友韻如,在論文完成期間的砥礪與英文知識的教導,使我不論 是在英文閱讀或是寫作上,有了相當大的進步。並且當我相當疲累時,為 我送上一杯熱騰騰的拿鐵,還附上許多充滿關愛的話語,讓我能再度提起 精神,努力完成論文的撰寫。未來在人生的旅途上,若能有妳一起相伴, 一路相隨,將永遠不再寂寞。 鄭弼文 謹致 九十五年一月摘 要
原有之隱藏式馬可夫模型之各時間點「符號機率矩陣」均須相同,屬 於「固定型隱藏式馬可夫模型」,僅能應用在符號機率固定之測驗分析。 因此,其適用範圍相當有限,本論文擴張定義「重複測量之變動型隱藏式 馬可模型」稱之為「廣義隱藏式馬可夫模型:GHMM」並使用 GHMM 專有之 參數估計演算法來估計參數,使其能有效地應用在全民英檢之類,具狀態 轉移機率之時間序列相關之線上測驗分析;同時亦可適用於一般任意選題 作答非時間序列相關之紙筆測驗分析。本論文除簡介其理論架構外,並針 對 GHMM 提出實例說明,進而發展電腦應用程式藉以進行參數估計蒙地卡 羅模擬研究,且將此模型藉由實際施測來驗證其實用性,最後提出最佳的 使用時機,方便教學研究者參考與應用。 關鍵字: 「廣義隱藏式馬可夫模型;GHMM」、「時間序列 GHMM 模型」、「非時間序列 GHMM 模型」Abstract
The symbol probability matrix at every time point must be the same in the original Hidden Markov Model(HMM). HMM is treated as “Fixed Hidden Markov Model” and is only applied for the testing analysis which has the same symbol probability. Hence, the suitable scope of HMM is quite limited. This study expends the definition of “Hidden Markov Model” by including dynamic symbol probability. We call the expended definition as “Generalizing Hidden Markov Model; GHMM”. The study applies proper parameter estimation algorithm to estimate so that the usability of GHMM is not only for on-line-testing with transiting probability but also for general
paper-pencil-testing with item random answering. A theoretical framework of GHMM model is introduced in the study. Furthermore, we design a usable program for parameter estimation of the testing model based on GHMM model in a Monte Carlo simulation study, and make sure that the above model is useful by testing in the elementary school.Finally, we proposethe best timing to use GHMM and provide suggestions for the teaching researchers.
Keywords:
「Generalizing hidden Markov model ; GHMM”」、「Time series GHMM
目 錄
第一章 緒論 ... 1 第一節 研究背景及動機 ...1 第二節 研究目的 ...3 第三節 名詞釋義 ... 4 第二章 文獻探討 ... 5 第一節 隱藏式馬可夫模型的簡介 ... 5 第二節 廣義隱藏式馬可夫模型的探討 ... 9 第三節 試題反應理論 ... 11 第三章 研究方法 ... 15 第一節 研究架構 ...15 第二節 研究模式及架構 ...17 第三節 研究工具 ... 38 第四章 研究結果 ... 39 第一節 模擬研究之探討 ... 39 第二節 實際施測 ...51 第五章 結論及建議 ... 82 第一節 研究結論 ...82 第二節 後續研究建議 ...84 參考文獻 ... 83 附 錄 ...86表 目 次
表 4-1 總體參數估計的誤差之比較表 ... 48 表 4-2 轉移矩陣 ... 51 表 4-3 第一題之符號矩陣 ... 52 表 4-4 第二題之符號矩陣 ... 53 表 4-5 第三題之符號矩陣 ... 54 表 4-6 第四題之符號矩陣 ... 55 表 4-7 第五題之符號矩陣 ... 56 表 4-8 第六題之符號矩陣 ... 57 表 4-9 第七題之符號矩陣 ... 58 表 4-10 第八題之符號矩陣 ... 59 表 4-11 第九題之符號矩陣 ... 60 表 4-12 第十題之符號矩陣 ... 61 表 4-13 第十一題之符號矩陣 ... 62 表 4-14 第十二題之符號矩陣 ... 63 表 4-15 第十三題之符號矩陣 ... 64 表 4-16 第十四題之符號矩陣 ... 65 表 4-17 第十五題之符號矩陣 ... 66 表 4-18 第十六題之符號矩陣 ... 67 表 4-19 第十七題之符號矩陣 ... 68 表 4-20 第十八題之符號矩陣 ... 69 表 4-21 第十九題之符號矩陣 ... 70 表 4-22 第二十題之符號矩陣 ... 71 表 4-23 第二十一題之符號矩陣 ... 72 表 4-24 第二十二題之符號矩陣 ... 73表 4-25 第二十三題之符號矩陣 ... 74 表 4-26 第二十四題之符號矩陣 ... 75 表 4-27 第二十五題之符號矩陣 ... 76 表 4-28 第二十六題之符號矩陣 ... 77 表 4-29 第二十七題之符號矩陣 ... 78 表 4-30 第二十八題之符號矩陣 ... 79 表 4-31 第二十九題之符號矩陣 ... 80 表 4-32 第三十題之符號矩陣 ... 81
圖 目 次
圖 2-1 25 題 4 選 1 三狀態變動機率序列相關之例圖 ... 10 圖 2-2 25 題 4 選 1 三狀態固定機率序列獨立之例圖 ... 10 圖 3-1 研究架構圖 ... 16 圖 3-2 正算程序 ...21 圖 3-3 逆算程序 ...21 圖 3-4 25 題 4 選 1 選擇題有 2 個作答狀態之HMM模式 ... 32 圖 3-5 25 題 4 選 1 選擇題有 3 個作答狀態之HMM ...33 圖 3-6 25 題 4 選 1 選擇題有 2 個作答狀態且有 25 個「符號機率矩陣」 不同的測驗之GHMM模式圖 ... 33 圖 3-7 25 題 4 選 1 選擇題有 3 個作答狀態且有 25 個「符號機率矩陣」 不同的測驗之GHMM模式圖 ... 34 圖 3-8 25 題 4 選 1 選擇題為固定獨立狀態及變動符號機率測驗之GHMM模 式圖 ... 35 圖 4-1 變數A在固定題數為 30 題時之誤差情形 ... 40 圖 4-2 變數A在固定題數為 50 題時之誤差情形 ... 40 圖 4-3 變數B在固定題數為 30 題時之誤差情形 ... 41 圖 4-4 變數B在固定題數為 50 題時之誤差情形 ... 41 圖 4-5 變數PI在固定題數為 30 題時之誤差情形 ... 42 圖 4-6 變數PI在固定題數為 50 題時之誤差情形 ... 42 圖 4-7 變數A在固定人數為 200 人之誤差情形 ... 43 圖 4-8 變數A在固定人數為 500 人之誤差情形 ... 44 圖 4-9 變數A在固定人數為 1000 人之誤差情形 ... 44 圖 4-10 變數B在固定人數為 200 人之誤差情形... 45 圖 4-11 變數B在固定人數為 500 人之誤差情形... 45圖 4-12 變數B在固定人數為 1000 人之誤差情形 ... 46 圖 4-13 變數PI在固定人數為 200 人之誤差情形 ...46 圖 4-14 變數PI在固定人數為 500 人之誤差情形 ...47 圖 4-15 變數PI在固定人數為 1000 人之誤差情形 ... 47 圖 4-16 針對觀察PI之絕對誤差情形 ... 49 圖 4-17 針對觀察A之絕對誤差情形 ... 49 圖 4-18 針對觀察B之絕對誤差情形 ... 49 圖 4-19 第一題之符號矩陣 ... 52 圖 4-20 第二題之符號矩陣 ... 53 圖 4-21 第三題之符號矩陣 ... 54 圖 4-22 第四題之符號矩陣 ... 55 圖 4-23 第五題之符號矩陣 ... 56 圖 4-24 第六題之符號矩陣 ... 57 圖 4-25 第七題之符號矩陣 ... 58 圖 4-26 第八題之符號矩陣 ... 59 圖 4-27 第九題之符號矩陣 ... 60 圖 4-28 第十題之符號矩陣 ... 61 圖 4-29 第十一題之符號矩陣 ... 62 圖 4-30 第十二題之符號矩陣 ... 63 圖 4-31 第十三題之符號矩陣 ... 64 圖 4-32 第十四題之符號矩陣 ... 65 圖 4-33 第十五題之符號矩陣 ... 66 圖 4-34 第十六題之符號矩陣 ... 67 圖 4-35 第十七題之符號矩陣 ... 68
圖 4-38 第二十題之符號矩陣 ... 71 圖 4-39 第二一題之符號矩陣 ... 72 圖 4-40 第二十二題之符號矩陣 ... 73 圖 4-41 第二十三題之符號矩陣 ... 74 圖 4-42 第二十四題之符號矩陣 ... 75 圖 4-43 第二十五題之符號矩陣 ... 76 圖 4-44 第二十六題之符號矩陣 ... 77 圖 4-45 第二十七題之符號矩陣 ... 78 圖 4-46 第二十八題之符號矩陣 ... 79 圖 4-47 第二十九題之符號矩陣 ... 80 圖 4-48 第三十題之符號矩陣 ... 81
表 目 次
表 4-1 總體參數估計的誤差之比較表 ... 49 表 4-2 轉移矩陣 ...52 表 4-3 第一題之符號矩陣 ... 53 表 4-4 第二題之符號矩陣 ... 54 表 4-5 第三題之符號矩陣 ... 55 表 4-6 第四題之符號矩陣 ... 56 表 4-7 第五題之符號矩陣 ... 57 表 4-8 第六題之符號矩陣 ... 58 表 4-9 第七題之符號矩陣 ... 59 表 4-10 第八題之符號矩陣... 60 表 4-11 第九題之符號矩陣... 61 表 4-12 第十題之符號矩陣... 62 表 4-13 第十一題之符號矩陣... 63 表 4-14 第十二題之符號矩陣... 64 表 4-15 第十三題之符號矩陣... 65 表 4-16 第十四題之符號矩陣... 66 表 4-17 第十五題之符號矩陣... 67 表 4-18 第十六題之符號矩陣... 68 表 4-19 第十七題之符號矩陣... 69 表 4-20 第十八題之符號矩陣... 70 表 4-21 第十九題之符號矩陣 ... 71 表 4-22 第二十題之符號矩陣 ... 72 表 4-23 第二十一題之符號矩陣 ... 73表 4-25 第二十三題之符號矩陣 ... 75 表 4-26 第二十四題之符號矩陣 ... 76 表 4-27 第二十五題之符號矩陣 ... 77 表 4-28 第二十六題之符號矩陣 ... 78 表 4-29 第二十七題之符號矩陣 ... 79 表 4-30 第二十八題之符號矩陣 ... 80 表 4-31 第二十九題之符號矩陣 ... 81 表 4-32 第三十題之符號矩陣 ... 82
第一章 緒論
本研究旨在探討隱藏式馬可夫模型用於測驗分析中之研究,本章首先 說明本研究之研究背景及動機,次說明本研究之研究目的,最後就重要名 詞加以界定。第一節 研究背景及動機
利用可觀測的資訊對未知現象作判斷與分析乃是統計學所面臨的必 然問題;在過去,由於運算能力的不足以及資料量的過於龐大,使得相當 多的研究停滯不前;然而,隨著資訊時代的來臨,電腦具有更加強大的運 算及處理能力,因此對於大量資料的分析有很大的助益。 「隱藏馬可夫模型」是由可觀察之觀測序列與觀察不到之狀態序列所 構成。狀態序列裡的狀態會產生觀測符號,其出現機率就稱為“觀測符號機 率",而這些觀測符號即構成觀測序列。兩序列均由隨機過程所產生,因 此隱藏馬可夫模型是一種雙重的隨機過程,具有整體隨機性和局部穩定 性; 此模型衍生於馬可夫鏈,在波氏(Baum) 等人提出將馬可夫模型參數 最佳化的方法後,成功的將它運用在語音辨識上,此後更有應用於簽名辨 別、基因辨別與氨基酸鏈搜尋等等。當在處理隱藏馬可夫模型時, 最重 要的工作是找出模型的參數。利用完整的觀測序列將模型參數反覆遞迴估 算, 直到參數收斂為止。 如全民英文能力檢定測驗等類似之教學測驗,若測驗試題之作答依時 間序列出現,每一受試者作答試題,因時間之限制,可能有多種(作答策 略)狀態發生;例如:「認知作答」、「猜測作答」、及「遺漏未答」等, 且前後試題具轉移機率關係時, 並不能單純直接地應用「試題反應理論」 進行測驗分析,因為一般之「試題反應理論」有「局部獨立假設」之限制,是「二點計分試題反應模式」或「多點計分試題反應模式」在「遺漏未答」 之情況,均少見以虛擬參數進行估計之處理方式,另在既有之「等級反應 模式」、「部分給分模式」、及「量表評定模式」中,均少見有處理「猜 測作答」之情況,當受試者答對時,很難自測驗分析之結果直接得悉是否 為猜測所得,換言之,一般之「試題反應理論」不僅力有未逮且不合模式 假設前題。 事實上,上述類似之教學測驗之每一受試者之測驗作答反應序列,均 各可視為一種隱藏式馬可夫模型序列,惟現有之隱藏式馬可夫模型(HMM 模式),其「符號機率矩陣;B」及「狀態轉移機率矩陣;A」均限定為不 隨時間點變動之常數矩陣,亦即;其全部 T 個時間點之「符號機率矩陣」; 及(T-1)個「狀態轉移機率矩陣」均相同;亦即;A1 =A2 = =... AT−1= A, 1 2 ... T B =B = =B =B,僅適用於各時間點符號機率固定,且前後試題具轉移 機率關係為定值之測驗分析,一般而言,上述類似之教學測驗之 T 個試題 對應時間點之「符號機率矩陣」及(T-1)個「狀態轉移機率矩陣」常不 盡相同,故本研究考慮擴張討論隨時間點變動之「符號機率矩陣」序列
(
B B1, 2,...,BT)
,及「狀態轉移機率矩陣」序列(
A A1, 2,...,AT−1)
,亦即;全部 T 個時間點之「符號機率矩陣」及(T-1)個「狀態轉移機率矩陣」可不盡 相同。為區辨計,特稱研究擴張發展之隱藏式馬可夫模型族之為「變動型 HMM 模式」,並稱其重複測量模式族為「廣義隱藏式馬可夫模型;GHMM」, 另仿「波氏法」,提出 GHMM 專有之參數三種最佳化解演算法;「重複測量 波氏法」、「符號機率變動法」、「符號及狀態機率變動法」,進而結合試題 反應理論(IRT)中之二點計分、等級計分及部分計分等模式,盼能提供一 般化具轉移機率關係測驗分析之一有力之研究分析工具。第二節 研究目的
根據上述之動機,在觀測序列資料下,本研究將用EM法估計參數: • 【E步驟】:(求期望值或平均值): 只要參數有重複測量情況,即可以重複測量之樣本平均值作為參數之 迭代估計值,在 GHMM中A、B參數有重複測量情況。 • 【M步驟】:(求極大化值): 取相繼二次迭代之GHMM概似值之最大者為參數之迭代估計值。 使用上述的方法重複估算隱藏馬可夫模的型參數直到收斂,便能獲得 模型中許多未知的參數,期望能提供日後運用隱藏馬可夫模型的使用者一 些參考。故整體而言,本研究之研究目的有以下幾點: 一、在變動的隱藏馬可夫模型參數下,以蒙地卡羅之方法產生一完整的觀 測序列來模擬學生之作答情型,並依據理論撰寫程式來進行估算。 二、將上述的方法分別代入人數分別為200、500、1000人;試題數分別為 30、50題的程式中,探討試題數與人數對誤差的影響情形。 三、以一組實際施測的學生作答資料,代入上述的模式與程式中,說明學 生對此份試題的作答策略,作為教師測驗與評量後的參考指標。第三節 名詞釋義
隱藏式馬可夫模型已在多個領域廣泛的應用,但依然要依其所應用的 情形將模型做適當的改變,不過隱藏式馬可夫模型的精神卻沒改變,即模 型應具有觀測序列及隱藏狀態序列。 本研究所使用隱藏式馬可夫模型,任意狀態所產生之觀測符號,其機 率值是由一個蒙地卡羅隨機過程所決定,目的是模擬學生的作答情形,之 後再藉由一連串的演算法估計出隱藏之參數,並計算誤差,因此本論文可 說是「基於廣義隱藏式馬可夫模型之測驗分析模式之參數估計蒙地卡羅模 擬研究」。至於其他詳細的內容將於文獻探討中一一說明。第二章 文獻探討
第一節 隱藏式馬可夫模型的簡介
隱藏式馬可夫模型(Hidden Markov Model;HMM)源自馬可夫鍊(Markov Chains;Markov, 1907);最早是由 Baum 和 Petrie 在 1966 年所發展 出來,其基於統計的機率模型,並於近十幾年來逐漸被廣泛應用,概因其 擁有豐富的數學架構及基礎能夠成功地解決所欲處理的問題;而 HMM 這 個名稱最早是由 Poritz 命名(1988)而來,由於 HMM 為雙重隨機程序 之混合機率模式,包含一隱藏狀態序列及一可觀測之符號序列,故而有此 命名。
壹、隱藏式馬可夫模型之基本定義
隱藏式馬可夫模型 (Hidden Markov Model ; HMM)源自馬可夫(Markov Chains ; A. A. Markov 1907),為雙重隨機程序之混合機率模式,包含 狀態集合、觀測符號的集合;一隱藏狀態序列,及一可觀測之符號序列;。 HMM 模式由 A, B ,π 三種機率參數構成之;故可簡記為λ = ( A, B ,π ) 。 分別定義如下: (一)Q=
{
1,2,…,N}
表狀態集合,其中N 表狀態之個數。 (二)V ={
1, …2, ,M}
表觀測符號的集合,其中M 表符號之個數。每個狀態 中可能有不同的觀測符號,且觀測符號可以是一向量、數值或符號。 (三)(
w)
T w w w o o o O = 1 , 2,…, 表受試者 w 作答可觀測到之符號序列,其中T表觀 測序列的長度, w t o 表受試者 w 在時間t時作答所對應的觀測符號。(
)
狀態序列長度, w t
s 表受試者 w 在時間t時之作答策略狀態。
( 五 )π =
[ ]
πi 1×N : 表 初 始 狀 態 機 率 矩 陣 (initial state probabilitymatrix)。
[
1, 2,..., N]
π = π π π 其中∑
= = N i i 1 1 π , P(s1 i) w i = = π ,i=1,2,…N i π 為初始狀態機率;表第一個時間點時會產生狀態i的機率。 (六)At =[ ]
aij N×N:表狀態轉移機率矩陣(state-transition probability matrix)。 ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ = NN N N N N a a a a a a a a a 2 1 2 22 21 1 12 11 A 其中∑
= = N j ij a 1 1,i=1,2,…N(
s j s i)
P aij = tw+1 = | tw = ,i,j=1,2,…N、t=1,2,…T −1 ij a 表示在狀態i之下,轉移到狀態j的機率。 ( 七 ) B=[ ]
bj( )
k N×M : 表 觀 測 符 號 機 率 矩 陣 (observation symbol probability matrix)。( )
( )
( )
( )
( )
( )
( )
( )
( )
⎥⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ = M b b b M b b b M b b b N 1 1 1 1 2 1 1 1 2 1 2 1 2 1 B 其中∑
( )
= = M k j k b 1 1, j=1 …,2, ,N b( )
k P(
o k stw j)
w t j = = | = ,j=1 …,2, ,N、k =1 …,2, ,M 、t =1 …,2, ,T( )
k bj 表在狀態j之下,產生觀測符號k的機率。 (八)(
|λ)
(
(
1 , 2,)
|λ)
w T w w w o o o O P = … 表受試者 w 在作答模型λ之下產生觀測符 號序列(
w)
T w w w o o o O = 1 , 2,… 的機率。貳、隱藏式馬可夫模型之基本性質
若 HMM 模型λ =(
[ ]
A ,[ ]
B ,π)
有N 種隱藏狀態、M 種觀測符號,觀測符 號序列(
w)
T w w w o o o O = 1, 2,… ,其相對的狀態序列(
)
w T w w w s s s S = 1 , 2,… ,則 HMM 具有與 HMM 相同之下列四個性質(MacDonald & Zucchini, 1997): 性質一:
(
1 , | ,λ)
( 1 , , | ,λ) ( 1, , | ,λ) w t w T w t w t w t w w t w T w s o o P s o o P s o o P … = … ⋅ + … ,t=1,2…T 性 質 二 : P(
o1w,…oTw |stw,stw+1,λ)
=P(o1w,…,otw |stw,λ)⋅P(otw+1,…,oTw |stw+1,λ) , 1 2 , 1 − = T t … 性質三:P(
otw,…oTw |slw,stw,λ)
=P(otw,…,oTw |stw,λ), 1≤l≤t≤T 性質四:(
, | ,λ)
( | ,λ) ( 1, , | ,λ) w t w T w t w t w t w t w T w t o s P o s P o o s o P … = ⋅ + … , t=1,2 T HMM模式之理論架構要點有三;(I)P O(
;λ)
值之計算、(II)A , B ,π 三種機率參數之估計、(III)最佳隨機狀態序列s(
s s1, 2, ,sT)
∗ = ∗ ∗ … ∗ 之搜尋, 上述三者若獲得解決,則可藉以預測搜尋或比較具狀態轉移機率相關之特預測」 「動態簽名」等方面,近來「HMM與資訊結合之研究與應用」 正 在諸多不同領域內熱門地持續發展。
第二節 廣義隱藏式馬可夫模型的探討
今欲考慮應用於測驗分析,而 HMM 與資訊結合之研究與應用正在諸 多不同領域內熱門地持續發展中,唯僅能適用於同質試題之測驗分析中, 劉湘川(2004)因而擴張 HMM ,考慮隨時間點變動之符號機率矩陣序列, 即原有之HMM模式中之「符號機率矩陣;B」限定為不隨時間點變動之常數 矩 陣 , 亦 即 ; 其 全 部 T 個 時 間 點 之 「 符 號 機 率 矩 陣 」 均 相 同 ; 1 2 ... T B =B = =B =B,僅適用於各時間點符號機率固定,前後試題具轉移機 率關係之測驗分析中,本研究擴張考慮隨時間點變動之「符號機率矩陣」 序列(
B B1, 2,...,BT)
,其全部T個時間點之「符號機率矩陣」可不盡相同。為 區辨計,特稱本研究擴張發展之隱藏式馬可夫模型族之為「變動型HMM模 式」,並稱其重複測量模式族為「廣義隱藏式馬可夫模型;GHMM」,另仿「波 氏法」,提出GHMM專有之參數三種最佳化解演算法;「重複測量波氏法」、「符 號機率變動法」、「符號及狀態機率變動法」則可有效地應用於一般化具轉 移機率關係之測驗分析中,且有更廣闊應用發展空間。 因此其不僅適用於如全民英檢類具狀態轉移機率之時間序列之線上 測驗分析,同時亦可適用於一般任意選題作答非時間序列之紙筆測驗分 析。 GHMM 模型可依功能概分為兩類:在任意時間點 t 作答之前,若各狀 態之轉移機率不盡相同時,即表作答第 t 題之前之轉移機率會受作答第 (t-1)題的結果影響時,稱為「時間序列 GHMM 模型」,如線上測驗之全 民英檢;在任意時間點t作答之前,若各狀態均有相同的轉移機率時,即 表作答第 t 題之前之轉移機率不受作答第(t-1)題的結果影響時,稱為 「非時間序列 GHMM 模型」,如一般在任意時間點 t 可任意選題作答之紙未 答 0.05 0.05 A~D A A A A A A A B B B B B B C C C C C C D D D D D D 猜 測 作 答 認 知 作 答 S S T T 0.4 0.3 0.2 0.3 0.2 0.4 0.2 0.4 0.3 0.1 0.1 0.1 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.25 0.05 0.1 0.85 0.1 0.1 0.85 0.85 0.1 0.1 0.1 0.1 0.8 0.8 0.1 0.1 0.05 0.05 0.85 0.85 1 1 1 − B 1 2 s = s2=1 s25 =3 − − − − − − − − − 0 0 0 0 0 0 0 0 0 ~ A D A~D 1 1 1
...
測作答、3:認知作答): 型一:選擇題型測驗分析時間序列 GHMM 應用實例: 圖2-1 25 題 4 選 1 三狀態變動機率序列相關之例圖 型二:選擇題型測驗分析非時間序列 GHMM 應用實例 圖2-2 25 題 4 選 1 三狀態固定機率序列獨立之例圖 未 答 0 .0 5 0 .0 5 A~D A A A A A A A B B B B B B C C C C C C D D D D D D 猜 測 作 答 認 知 作 答 S S T T 0.4 0 .3 0.2 0.3 0 .2 0 .4 0.2 0 .4 0 .3 0.1 0.1 0.1 0.25 0.25 0 .2 5 0 .2 5 0 .2 5 0 .2 5 0 .2 5 0 .2 5 0 .2 5 0 .2 5 0 .2 5 0 .2 5 0 .0 5 0.1 0 .8 5 0 .1 0 .1 0.85 0 .8 5 0.1 0.1 0.05 0.05 0.85 0.85 1 1 1 − B 1 2 s = s2=1 s25=3 − − − − − − − − − 0 0 0 0 0 0 0 0 0 ~ A D A~ D 1 1 1 ... 0 .0 5 0 .0 5 0 .1 0 .1 0 .8 5 0 .8 5第三節 試題反應理論
壹、試題反應理論之假設
測驗需具有下列幾項基本假設,唯有在這些假設都成立的前提下,試 題反應模式才能被用來分析所有的測驗資料(Weiss&Yoes,1991)其假設 有四: 一、 單向度(unidimensionality) 試題反應理論中的各種模式有個最常用的共同假設,那就是測驗中的 各個試題都測量到同一種共同的能力或潛在特質;這種單一能力或潛在特 質(因素)必須包含在測驗試題裡的假設,便是單向度的假設。其實,在 實際的測驗情境裡,考生在測驗上的表現情形很少是純粹受到一種因素的 影響,其他因素如:成就動機、考試焦慮、應試技巧、及人格特質等,也 都會影響到測驗的結果;因此,試題反應理論中對測驗必須具有單向度因 素的基本看法,認為只要該測驗具有能夠影響測驗結果的一個「主要成份 或因素」(dominant component or factor),便算符合單向度假設的基 本要求,而這個主要因素所指的,即是該測驗所測量到的單一能力或潛在 特質。適用於含有單一主要因素測驗資料的試題反應模式,便稱作單向度 模式。 二、 局部獨立性(local independence) 它的涵義是說,當影響測驗表現的能力被固定不變時,考生在任何一 對試題上的反應,在統計學上而言是獨立的;換句話說,在考慮考生的能 力因素後,考生在不同試題上的反應間沒有任何關係存在。簡單地說,這 意謂著涵蓋在試題反應模式裡的能力因素,才是唯一影響考生在測驗試題 上做反應的因素;這組能力因素代表整個潛在空間(complete latent代表具有能力為θ的考生在第 i 試題上的反應機率,且P U
(
i =1|θ)
為正確 反應的機率,P U(
i =0 |θ)
為錯誤反應的機率,那麼局部獨立性的涵義:(
1 2 3)
(
1) (
2) (
3)
(
)
(
)
1 , , , , | | | | | | n n n i i P U U U U θ P U θ P U θ P U θ P U θ P U θ = = ⋅ ⋅ ⋅ ⋅ =∏
… ,這條公式即是說明,對某一特定能力的考生而言,在某份測驗上的反應 組型(response pattern)的機率,等於在單獨一題試題上反應機率的連乘 積。例如,某位考生在一組三個試題測驗的反應組型為(1,1,0),其中 1 1, 2 1, 3 0 U = U = U = ,那麼,局部獨立性所要表達的意思即為:(
1 1, 2 1, 3 0 |)
(
1 1|) (
2 1|) (
3 0 |)
1 2 3 P U = U = U = θ =P U = θ ⋅P U = θ ⋅P U = θ = ⋅ ⋅P P Q,其 中(
1|)
1 i i i P =P U = θ 且Qi = −P,由於P U(
i|θ)
是一種條件機率(conditional probabilities)的表達方式,因此,局部獨立性假設又稱為條件獨立性 (conditional independence)假設。通常,當單向度假設獲得成立時, 局部獨立性假設也會獲得成立,就這一項涵義而言,這兩個概念是相通的 (Lord, 1980; Lord & Novick, 1968),甚至於,即使資料不是單向度 的,局部獨立性也可以獲得成立。只要整個潛在空間被界定清楚,亦即當 所有影響表現的能力向度都考慮之後,局部獨立性便可獲得成立。局部獨 立性在下列情況下無法成立:影響測驗表現的能力向度不只一種時,連鎖 性試題,以及試題本身提供作答的線索等,在這種情況下,試題反應模式 也就無法適用於該筆測驗資料。 三、 非速度測驗 試題反應模式所適用的情況有個隱含的基本假設,那就是測驗的實施 不是在速度限制下完成的;換句話說,考生的考試成績不理想,是由於能 力不足所引起,而不是由於時間不夠答完所有試題所致。由於這項假設是 隱含在單向度假設裡,所以不常被試題反應理論學者所提起,但是在選用 試題反應模式時,這項基本假設亦必須要被考慮到才行。四、知道—正確假設(know-correct assumption)
如果考生知道某一試題的正確答案,必然會答對該試題;換句話說, 如果他答錯某一試題,他必然不知道該試題的答案。當然,把正確答案填 錯在別的格子上以致整個試卷都錯的例子,不在本假設所考慮的範圍內, 因為人為的疏忽不是任何測驗理論所能顧及到的。此外,省略不答的試題 (omitted items)和未答完的試題(unreached items)有所不同,前者 是受能力影響所致,後者是受施測速度影響所致。本假設僅能適用於前 者,它和前個假設一樣,都隱含在單向度假設裡,故殊少被提及。
貳、試題反應理論的參數模式
一、二元計分單參數對數模式
二元計分單參數對數模式(One-parameter bivariate logistic model) 又稱 Rasch 模式(Rasch,1960;Wright & Stone,1979;Wright &
Masters,1982),式中僅有「難度參數(difficulty parameter);bi」,令xis 表受試者 s 在第 i 題的作答反應情形,θ 表第 s 位受試者能力參數,其機s 率函數如下: pi(xis=1|θ ) = s )) ( 7 . 1 exp( 1 1 i S −b − + θ Rasch 模式只涉及難度參數,比較簡單容易使用,且有很好的數理統 計性質,應用甚廣,唯其須具「等鑑別力」及「最小猜測」之假定,常被 批評為不符實際,故而有下列二元計分雙參數對數模式、二元計分三參數 對數模式、二元計分四參數對數模式、等二元計分多參數試題特徵曲線模 式。
二、二元計分雙參數對數模式
二元計分雙參數對數模式 (Two-parameter bivariate logistic model)比 Rasch 模式 多一「鑑別度參數(discrimination parameter)」, 是由美國測驗學者 A.Birnbaum 修改自 F.M.Lord 的原始雙參數肩型模式 (Normal ogive model) 而來(Birnbaum,1968) 其機率函數如下:
pi(xis=1|θ ) = s )) ( 7 . 1 exp( 1 1 i s i b a − − + θ 三、二元計分三參數對數模式
二元計分三參數對數模式(Three-parameter bivariate logistic model)比二元計分雙參數對數模式多了一個「猜測度參數(guessing parameter)」,大多用於選擇題的測驗,受試者會發生猜題現象
(Birnbaum,1968;Lord,1980;Mislevy & Bock,1990),其機率函數如下: pi(xis=1|θ ) =cs i+ )) ( 7 . 1 exp( 1 1 i s i i b a c − − + − θ
第三章 研究方法
本章主要介紹隱藏式馬可夫過程的研究方法,主要分成三節分述之, 第一節為研究架構,第二節為研究模式及步驟,第三節為研究工具。第一節 研究架構
本研究根據理論撰寫電腦程式,以電腦模擬產生資料的方式,來比 較不同人數、試題數時的誤差來驗證理論的可行性及合理性,最後到國小 進行施測,以取得實際的作答情形,再以本架構進行分析,以確認架構的 可用性。圖 3-1 為本研究之研究動機、研究目的、研究背景以及參考相關 文獻之後的研究架構圖。圖 3-1 研究架構圖
擬 定 研 究 主 題
數 學 理 論 推 導
撰 寫 程 式 模 擬
與 真 值 求 得 誤 差
出 題 並 施 測
模 擬 結 果 討 論
分 析 實 測 資 料
撰 寫 研 究 結 果
閱 讀 相 關 文 獻
第二節 研究模式及步驟
壹、廣義隱藏式馬可夫模型之基本定義
廣義隱藏式馬可夫模型(GHMM)由[ ] [ ]
At T, Bt T,π 三種參數組成,其中[ ] [
At T = A1,A2,...,AT]
、[ ] [
Bt T = B1,B2,...,BT]
。且 GHMM 可簡記“模型λ",即:[ ] [ ]
(
π)
λ = At T, Bt T, , 當 A1 = A2 =...= AT = A 且 B1 =B2 =...=BT =B 時[ ] [ ]
(
At T, Bt T,)
λ = π 可簡記為λ =(
A, B,π)
,此時即為傳統之 HMM,換言之,HMM 只是 GHMM 之一特例,而 GHMM 是 HMM 一般化之推廣。GHMM 基本符號定義如 下: (一)Q={
1,2,…,N}
表狀態集合,其中N 表狀態之個數。 (二)V ={
1, …2, ,M}
表觀測符號的集合,其中M 表符號之個數。每個狀態 中可能有不同的觀測符號,且觀測符號可以是一向量、數值或符號。 (三)(
w)
T w w w o o o O = 1 , 2,…, 表受試者 w 作答可觀測到之符號序列,其中T表觀 測序列的長度, w t o 表受試者 w 在時間t時作答所對應的觀測符號。 (四)(
w)
T w w w s ,s , ,s S = 1 2 … 表受試者 w 不可觀測之作答策略狀態序列,其中T表 狀態序列長度, w t s 表受試者 w 在時間t時之作答策略狀態。( 五 )π =
[ ]
πi 1×N : 表 初 始 狀 態 機 率 矩 陣 (initial state probabilitymatrix)。
[
, ,...,]
π = π π π 其中∑
= N 1 π ,π =P(sw =i),i=1,2,…Ni π 為初始狀態機率;表第一個時間點時會產生狀態i的機率。 (六)
[ ]
t N N ij t a A = × :表在時間點 t 之狀態轉移機率矩陣(state-transition probability matrix)。 ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ = t NN t N t N t N t t t N t t t a a a a a a a a a 2 1 2 22 21 1 12 11 A 其中∑
= = N j t ij a 1 1,i=1,2,…N(
s j s i)
P aijt = tw+1= | tw = ,i,j=1,2,…N、t=1,2,…T−1 t ij a 為時間點 t 之狀態轉移機率;表時間點 t 時,在狀態i 之下,轉 移到狀態j的機率。 (七)[ ]
t( )
N M j t b k B = × :表在時間點 t 之觀測符號機率矩陣(observationsymbol probability matrix)。
( )
( )
( )
( )
( )
( )
( )
( )
( )
⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ = M b b b M b b b M b b b t t t N t t t t t t t 1 1 1 1 2 1 1 1 2 1 2 1 2 1 B 其中∑
( )
= = M k j k b 1 1, j=1 …,2, ,N btj( )
k =P(
otw =k|stw = j)
, j=1 …,2, ,N、k=1 …,2, ,M 、t=1 …,2, ,T( )
k btj 表時間點 t,在狀態j之下,產生觀測符號k的機率。 (八)P(
Ow |λ)
=(
(
o1w,o2w,…oTw)
|λ)
表受試者 w 在作答模型λ之下產生觀測符 號序列(
w)
T w w w o o o O = 1 , 2,… 的機率。貳、廣義隱藏式馬可夫模型之基本性質
若 GHMM 模型λ=(
[ ] [ ]
At T, Bt T,π)
有N種隱藏狀態、M種觀測符號,觀測 符號序列(
w)
T w w w o o o O = 1, 2,… ,其相對的狀態序列(
w)
T w w w s s s S = 1 , 2,… ,則 GHMM具有與 HMM 相同之下列四個性質(MacDonald & Zucchini, 1997): 性質一:
(
1 , | ,λ)
( 1 , , | ,λ) ( 1, , | w,λ) t w T w t w t w t w w t w T w s o o P s o o P s o o P … = … ⋅ + … ,t=1,2…T 性 質 二 : P(
o1w,…oTw |stw,stw+1,λ)
=P(o1w,…,otw |stw,λ)⋅P(otw+1,…,oTw |stw+1,λ) , 1 2 , 1 − = T t … 性質三:P(
otw,…oTw |slw,stw,λ)
=P(otw,…,oTw |stw,λ), 1≤l≤t≤T 性質四:(
, | ,λ)
( | ,λ) ( 1, , | w,λ) t w T w t w t w t w t w T w t o s P o s P o o s o P … = ⋅ + … , t =1,2 T參、廣義隱藏式馬可夫模型之參數估計
「廣義隱藏式馬可夫模型;GHMM」在參數估計過程中,如同 HMM 之考 慮過程,必須考慮四種演算法則:(一)P(
Ow|λ)
之遞迴精簡計算演算法;「正算程序(Forward procedure)」與「逆算程序(Backward procedure)」,
(二)GHMM 參數重估(Parameter re-estimation) 演算法;本文推廣 Baldi & Brunak(1997)提及之波氏法,發展出下列三則:(I)「重複測量波氏 法」、(II)「符號機率變動法」、(III)「符號狀態機率變動法」,(三)避
如下: (一)「正算程序」與「逆算程序」(劉湘川 2004) 由性質二可得:
(
)
(
) (
) (
)
(
)
(
)
1 1 2 2 3 3 1 | , | , | , | , | , | , w w w w w w w w w w T T T w w t t t P O S P o s P o s P o s P o s P o s λ λ λ λ λ λ = = ⋅ ⋅ ⋅ ⋅ =∏
故可得P(
Ow|λ)
直接計算之通式為:(
)
(
1 1 2 1)
(
1( ) ( )
2( )
)
1 2 1 2 , | w w w w w w w w T T T w w w T w w w w T s s s s s s s s s s s P O a a b o b o b o λ π − =∑
⋅ ⋅ ⋅ … T t N stw =1,2…, ; =1,2… ,w=1,2,…W 可知P(
Ow |λ)
之直接計算量約2TNT次,而以正算程序與逆算程序求算(
Ow |λ)
P ,則計算量降低為大約TN2次, 其定義及步驟簡介如下: (i)正算程序 1. 定義正算變數:αtw( )
i ; w=1 …,2, ,W( )
i w t α :表示受試者 w 在模型λ之下其時間t時停留於狀態i、觀察點序 列為 w t w w o o o1, 2,…, 之機率。即αtw( )
i =P(
o1w,o2w,…,otw,stw =i|λ)
。 2. 正算程序步驟: (1) 初始值:( )
( )
w i i w o b i 1 1 =π ⋅ α ,i=1,2,…N (2) 遞廻正算變數:圖 3-2 為正算程序示意圖。( )
( )
( )
w t j N i t ij w t w t j i a b o 1 1 1 + = + ⎥⋅ ⎦ ⎤ ⎢ ⎣ ⎡ ⋅ =∑
α α ,t=1,2,…T−1、j=1,2,…N (3) 終止:αTw( )
i = P(
o1w,o2w,…,oTw,sTw = i|λ)
, i=1,2,…N因此由正算程序即可求出P
(
Ow |λ)
:(
)
(
(
1 2)
)
( )
1 | , , | N w w w w w T T i P O λ P o o o λ α i = = … =∑
1
=
w ts
a
1tj2
=
w ts
a
2tj․ ․
w1 ts
+=
j
․ ․
․ ․
N
s
tw=
a
Nt j t ia
1s
tw+1=
1
t ia
2s
tw+1=
2
i
s
tw= ․ ․
․ ․
․ ․
t iNa
s
tw+1=
N
圖 3-2 正算程序 圖 3-3 逆算程序 (ii)逆算程序 1. 定義逆算變數:βtw( )
i ; w=1,2,…,W( )
i w t β :表示受試者 w 在模型λ、時間t時停留於狀態i之下其觀察點序 列為 w T w t w t o o o+1, +2,…, 之機率。即βtw( )
i =P(
otw+1,otw+2,…,oTw |stw =i,λ)
。 2. 逆算程序步驟: (1) 初始值:βTw( )
i =P(
oTw+1|sTw =i,λ)
=1,i=1,2,…N 因受試者 w 作答觀測序列長度為 T,第 T+1 個觀察點為明確結束 點,故令機率為 1。 (2) 遞廻逆算變數:圖 3-3 為逆算程序示意圖。( )
( )
1( )
, 1, 2,...,1 1 1 ⋅ = − − ⋅ = + = +∑
a b o j t T T i tw N j w t j t ij w t β β 、 i,j =1,2,...,N因此由逆算程序即可求出P
(
Ow |λ)
:(劉湘川 2004)(
)
(
)
( )
( )
1 2 1 1 1 1 1 | , ,..., , | w N w w w w T i N w w i i i P O P o o o s i b o i λ λ π β = = = = = ⋅ ⋅∑
∑
由正算和逆算程序、條件機率及性質一可得:(
)
(
) (
)
( )
( )
1 2 1 2 1 2 , ,..., , | , ,..., , | , ,..., | , w w w w T t w w w w w w w w t t t t T t w w t t P o o o s i P o o o s i P o o o s i i i λ λ λ α β + + = = = ⋅ = = ⋅ 故可得:(
)
(
)
( )
( )
( )
( )
( )
1 2 1 1 1 1 1 1 | , ,..., , | w N w w w w T t i N w w t t i N N w t w w t ij j t t i j P O P o o o s i i i i a b o jλ
λ
α
β
α
β
= = + + = = = = = ⋅ = ⋅ ⋅ ⋅∑
∑
∑∑
(二)GHMM 參數重估演算法
[ ] [ ]
(
π)
λ = At T, Bt T, 中之參數矩陣At,Bt,π 之元素滿足下三者:(
) (
(
)
)
( )
(
) (
(
)
)
(
s i)
w W P W w T t j s P j s k s P j s k o P k b W w T t i s P j s i s P i s j s P a w i w t w t w t w t w t t j w t w t w t w t w t t ij ,..., 2 , 1 , | ,..., 2 , 1 , ,..., 2 , 1 , | | , , | ,..., 2 , 1 , 1 ,..., 2 , 1 , | | , , | 1 1 1 = = = = = = = = = = = = = − = = = = = = = = + + λ π λ λ λ λ λ λ 由 EM 之觀念知:「若將上 3 式之分子、分母改寫為觀測序列Ow之條件 機率,則參數重估後之模型λ 產生觀測序列Ow的機率會增大」,﹝其證明可參閱 MacDonald & Zucchini (1997)書之附錄 ﹞。
首先,定義二個函數φtw
( )
i,j 與ρtw( )
i : (i)φtw( )
i,j =P(
stw =i,stw+1 = j|Ow ,λ)
, t =1,2,...T−1 、 i,j =1,2,...,N 由條件機率及性質二可得:(
)
(
λ) (
λ)
λ , , | | , | , , 1 1 1 j s i s O P j s i s P O j s i s P w t w t w w t w t w w t w t = = ⋅ = = = = = + + +( )
( )
1 1( )
w t w w t i a b oij j t t j α + β+ = ⋅ ⋅ ⋅ 進而可得:( )
(
) (
(
)
)
( )
(
( )
)
( )
W w O P j o b a i O P O j s i s P O j s i s P j i w w t w t j t ij w t w w w t w t w w t w t w t ,... 2 , 1 | | | , , , | , , 1 1 1 1 = ⋅ ⋅ ⋅ = = = = = = = + + + + λ β α λ λ λ φ(ii)
( )
(
) (
(
)
)
(
( )
( )
)
( )
(
( )
)
( )
( )
( )
( )
(
)
( )
W w N i T t j i O P j o b a i O P j o b a i O P i i O P O i s P O i s P i N j w t w N j w t w t j t ij w t w N i w t w t j t ij w t w w t w t w w w t w w t w t ,... 2 , 1 , ,..., 2 , 1 , ,... 2 , 1 , | | | | | , , | 1 1 1 1 1 1 1 = = = = ⋅ ⋅ ⋅ = ⋅ ⋅ ⋅ = ⋅ = = = = =∑
∑
∑
= = + + = + + φ λ β α λ β α λ β α λ λ λ ρ 由以上的參數,可知模型在λ 、觀測序列Ow條件下,在 1,2,..,T-1,T 之 T 個時間點內: (1) 受 試 者 w 出 現 狀 態 i 之 機 率 ( 期 望 次 數 ) 為 :(
)
∑
( )
∑
= = = = T t w t T t w w t i O i s P 1 1 , | λ ρ (2) 受 試 者 w 出 現 狀 態i 且 觀 測 符 號k 之 機 率 ( 期 望 次 數 ) 為 :(
)
∑
( )
∑
= = = = = = T k o t s t w t T t w w t w t w t i O i s k o P . . 1 1 , | , λ ρ (3) 受 試 者 w 出 現 狀 態i轉 移 到 狀 態 j 之 機 率 ( 期 望 次 數 ) 為 :(
)
∑
( )
∑
− + = + = = = 1 1 1 1 | , , , T t w t T t w w t w t i s j O i j s P λ φ (I)「重複測量波氏法」 當λ=(
[ ] [ ]
At T, Bt T,π)
退化為有重複測量之λ =(
A, B,π)
時,參數矩陣 π 、 、B A 之元素滿足下三者:(
) (
(
)
)
t T w W i s P j s i s P i s j s P a w t w t w t w t w t ij 1,2, , 1 1,2, , | | , , | 1 1 = … − = … = = = = = = = + + λ , 、 λ λ( )
(
) (
(
)
)
t T w W j s P j s k o P j s k o P k b w t w t w t w t w t j 1,2, , 1 1,2, , | | , , | = … − = … = = = = = = = , 、 λ λ λ(
s i)
w W P w i = 1 = |λ , =1,2,…, π推廣 Bilmes(1998)提及之波氏法,發展出「重複測量波氏法」,可 藉以進行有重複測量之λ =
(
A, B,π)
之參數重估,可估出新的模型參數(
π)
λ = A, B, ,其中:(
)
(
)
( )
( )
i i j N j i O i s P O j s i s P a W w T t w t W w T t w t W w T t w w t W w T t w w t w t ij , 1,2, , , , | , | , 1 1 1 1 1 1 1 1 1 1 1 1 1 … = = = = = =∑∑
∑∑
∑∑
∑∑
= − = = − = = − = = − = + , ρ φ λ λ( )
(
)
(
)
( )
( )
j j N j O j s P O j s k o P k b W w T t w t W w T k o t s t w t W w T t w w t W w T t w w t w t j w t , , 2 , 1 , | , | , 1 1 1 . . 1 1 1 1 1 = = … = = = =∑∑
∑ ∑
∑∑
∑∑
= = = = = = = = = , ρ ρ λ λ(
)
(
)
( )
N i W i O i s P O i s P W w w W w N i w w W w w w i 1,2, , , | , | 1 1 1 1 1 1 1 … = = = = =∑
∑∑
∑
= = = = , ρ λ λ π 由aij,bj( )
k ,πi 可算得新的機率值∏
(
)
= w w w O P 1 |λ 。如此反覆遞迴,直到(
)
(
)
∑
∑
= = − W w W w old w new w P O O P 1 1 | log | log λ λ 小於某一門檻值為止。 (II)「符號機率變動法」 適用於「轉移機率矩陣固定、符號機率矩陣變動」之情況,即 GHMM 模型為λ=(
[ ] [ ]
At T, Bt T,π)
=(
A,[ ]
Bt T,π)
,即A1 =A2 =…=AT =A。 GHMM 模 型 λ 中 參 數 矩 陣 A、[ ]
Bt T、π 之 元 素 滿 足 下 三 者 :(
) (
(
)
)
t T w W i s P j s i s P i s j s P a w t w t w t w t w t ij 1,2, , 1 1,2, , | | , , | 1 1 = … − = … = = = = = = = + + λ , 、 λ λ( )
(
) (
(
)
)
t T w W j s P j s k o P j s k o P k b w w t w t w t w t t j 1,2, , 1 1,2, , | | , , | = … − = … = = = = = = = , 、 λ λ λ進行有重複測量之λ=