第三章 研究方法
第一節 研究架構
本研究根據理論撰寫電腦程式,以電腦模擬產生資料的方式,來比 較不同人數、試題數時的誤差來驗證理論的可行性及合理性,最後到國小 進行施測,以取得實際的作答情形,再以本架構進行分析,以確認架構的 可用性。圖 3-1 為本研究之研究動機、研究目的、研究背景以及參考相關 文獻之後的研究架構圖。
圖 3-1 研究架構圖
擬 定 研 究 主 題
數 學 理 論 推 導
撰 寫 程 式 模 擬
與 真 值 求 得 誤 差
出 題 並 施 測 模 擬 結 果 討 論
分 析 實 測 資 料
撰 寫 研 究 結 果
閱 讀 相 關 文 獻
第二節 研究模式及步驟
壹、廣義隱藏式馬可夫模型之基本定義
廣義隱藏式馬可夫模型(GHMM)由
[ ] [ ] A
t T, B
t T,
π 三種參數組成,其中[ ] [ A
t T= A
1, A
2,..., A
T]
、[ ] [ B
t T= B
1, B
2,..., B
T]
。且 GHMM 可簡記“模型λ
",即:[ ] [ ]
(
π)
λ
= A
t T, B
t T,
, 當 A1 = A2 =...= AT = A 且 B1 =B2 =...=BT =B 時[ ] [ ]
( A
t T, B
t T, )
λ
=
π 可簡記為λ =(
A, B,π)
,此時即為傳統之 HMM,換言之,HMM 只是 GHMM 之一特例,而 GHMM 是 HMM 一般化之推廣。GHMM 基本符號定義如 下:(一)Q=
{
1,2,…,N}
表狀態集合,其中N 表狀態之個數。(二)V =
{
1, …2, ,M}
表觀測符號的集合,其中M
表符號之個數。每個狀態 中可能有不同的觀測符號,且觀測符號可以是一向量、數值或符號。(三)
(
Tw)
w w
w
o o o
O =
1,
2, … ,
表受試者 w 作答可觀測到之符號序列,其中T
表觀 測序列的長度,o
tw表受試者 w 在時間t
時作答所對應的觀測符號。(四)
(
Tw)
w w
w
s , s , , s
S =
1 2…
表受試者 w 不可觀測之作答策略狀態序列,其中T
表 狀態序列長度,s
tw表受試者 w 在時間t
時之作答策略狀態。( 五 )π
= [ ]
πi 1×N : 表 初 始 狀 態 機 率 矩 陣 (initial state probability matrix)。[
, ,...,]
π = π π π 其中
∑
N π= 1
,π= P ( s
w= i )
,i = 1 , 2 , … N
π 為初始狀態機率;表第一個時間點時會產生狀態i
i
的機率。(六)
A
t= [ ] a
ijt N×N:表在時間點 t 之狀態轉移機率矩陣(state-transition probability matrix)。⎥⎥ symbol probability matrix)。
( ) ( ) ( )
貳、廣義隱藏式馬可夫模型之基本性質
若 GHMM 模型λ
= ( [ ] [ ] A
t T, B
t T,
π)
有N種隱藏狀態、M
種觀測符號,觀測 符號序列(
Tw)
w w
w
o o o
O =
1,
2, …
,其相對的狀態序列(
Tw)
w w
w
s s s
S =
1,
2, …
,則 GHMM 具有與 HMM 相同之下列四個性質(MacDonald & Zucchini, 1997):性質一:
( o
1w, o
Tw| s
tw,
λ) P ( o
1w, , o
tw| s
tw,
λ) P ( o
tw1, , o
Tw| s
tw,
λ)
P … = … ⋅
+…
,t = 1 , 2 … T
性 質 二 :
P ( o
1w, … o
Tw| s
tw, s
tw+1,
λ) = P ( o
1w, … , o
tw| s
tw,
λ) ⋅ P ( o
tw+1, … , o
Tw| s
tw+1,
λ)
,1
2 ,
1 −
= T
t …
性質三:
( , | , ,
λ) ( , , |
tw,
λ)
wT w t w
t w l w T w
t
o s s P o o s
o
P … = …
, 1≤l≤t≤T性質四:
P ( o
tw, … o
Tw| s
tw,
λ) = P ( o
tw| s
tw,
λ) ⋅ P ( o
tw+1, … , o
Tw| s
tw,
λ)
,t = 1 , 2 T
參、廣義隱藏式馬可夫模型之參數估計
「廣義隱藏式馬可夫模型;GHMM」在參數估計過程中,如同 HMM 之考 慮過程,必須考慮四種演算法則:(一)
P ( O
w|
λ)
之遞迴精簡計算演算法;「正算程序(Forward procedure)」與「逆算程序(Backward procedure)」,
(二)GHMM 參數重估(Parameter re-estimation) 演算法;本文推廣 Baldi
& Brunak(1997)提及之波氏法,發展出下列三則:(I)「重複測量波氏 法」、(II)「符號機率變動法」、(III)「符號狀態機率變動法」,(三)避
如下:
因此由正算程序即可求出
P ( O
w|
λ)
:因此由逆算程序即可求出
P ( O
w|
λ)
:(劉湘川 2004)(二)GHMM 參數重估演算法 可參閱 MacDonald & Zucchini (1997)書之附錄 ﹞。
首先,定義二個函數φtw
( ) i , j 與
ρtw( ) i
:(ii)
推廣 Bilmes(1998)提及之波氏法,發展出「重複測量波氏法」,可
進行有重複測量之λ
= ( A , [ ] B
t T,
π)
之參數重估,可估出新的模型參數[ ] [ ]
腦計算發生極小值溢位(underflow)的問題,此時可參 Levinson, Rabiner, and Sondhi(1983)利用條件機率之優良性質所提出量尺化(scaling)演算法,進而引進「GHMM 之條件機率演算法」如下步驟:
1、 定義受試者 w、時間 t 之條件機率參數CP
( )
w,t :( )
( ) ( ) ( )
徑;維特比演算法(Viterbi,1967)即是利用 Bellman(1957)之「動態 規劃最佳化原理」找出使機率最大的一條路徑。同理可得本文 GHMM 之「動值δ
( ) max [
1,
2, ,
1, ,
1,
2,
λ]
1】、【例 2】屬固定型隱藏式馬可夫模型序列,則以 HMM 模型進行分析即可,
另如【例 3】、【例 4】、【例 5】屬變動型隱藏式馬可夫模型序列,並不適合 以 HMM 進行分析,則應進而應用 GHMM 模型進行分析。
本文特別強調 GHMM 模型另可依功能概分為兩類;在任意時間點 t 作答 之前,若各狀態之轉移機率不盡相同時,即表作答第 t 題之前之轉移機率 會受作答第(t-1)題之結果之影響時,稱為「時間序列 GHMM 模型」,如線 上測驗之「全民英檢」及【例 1】、【例 2】、【例 3】、【例 4】均屬具狀態轉 移機率之「時間序列 GHMM 模型」。在任意時間點 t 作答之前,若各狀態均 有相同轉移機率時,即表作答第 t 題之前之轉移機率不受作答第(t-1)題 之結果之影響時,稱為「非時間序列 GHMM 模型」,如一般在任意時間點 t 可任意選題作答之紙筆測驗及【例 5】均屬「非時間序列 GHMM 模型」。本 文主要議題聚焦於「非時間序列 GHMM 模型」之實例說明及參數估計蒙地 卡羅模擬實驗之驗證研究。
一、 隱藏式馬可夫模型在測驗分析上之應用
【例 1】 25 題 4 選 1 選擇題有 2 個作答狀態之 HMM 測驗分析應用例子
( ) ( )
( ) ( )
[ ] [ ]
1 2 2 5
1 2 2 5
1 2
1 1 1 2
2 1 2 2
, , ..., , , ...
, , ..., 1, 2 , ...1 , 0 .1 , 0 .9
0 .3 0 .7 0 .2 0 .8
O o o o A B D
S s s s
a a
A a a
π π π
= =
= =
= =
⎡ ⎤ ⎡ ⎤
= ⎢ ⎥ = ⎢ ⎥
⎣ ⎦
⎣ ⎦
符 號 序 列 狀 態 序 列 初 始 狀 態 機 率 狀 態 轉 移 機 率 矩 陣
( ) ( ) ( ) ( )
( ) ( ) ( ) ( )
1 1 1 1
2 2 2 2
1 2 3 4 0.25 0.25 0.25 0.25 1 2 3 4 0.40 0.30 0.20 0.10
b b b b
B b b b b
⎡ ⎤ ⎡ ⎤
=⎢ ⎥ ⎢= ⎥
⎣ ⎦
⎣ ⎦
觀測符號機率矩陣
猜
0.25 0.25
0.25
猜
0.25 0.25
0.25
【例 4】 25 題 4 選 1 選擇題有 3 個作答狀態變動符號機率之 GHMM 測驗分
0.05 0.10 0.85 0.10 0.10 0.80 0.10 0.05 0.85
1 2
...
( ) ( )
0.05 0.10 0.85 0.05 0.10 0.85 0.05 0.10 0.85
T
0.05 0.10 0.85 0.05 0.10 0.85 0.05 0.10 0.85
T T T
為一試題選項之作答機率值,以具「認知作答」、「猜測作答」及「遺漏未 答」等三種作答策略狀態及有「選項 1」、「選項 2」、「選項 3」、「選項 4」、
「空白」等五種可觀測符號之 GHMM 模型之參數重估「符號機率變動法」
為 例 , 遞 迴 估 計 之 初 始 值 之 訂 定 :
π
=[ π π π
1, 2, 3]
, 其 中π3
= 空白之符號總數/(總人數*總試題數)
、π1= − (1
π3) *0.9
、π2= − (1
π3) *0.1
,At
π π π
⎡ ⎤⎢ ⎥
= ⎢ ⎥
⎢ ⎥⎣ ⎦
,其餘有關符號機率矩陣
B
t部分,其中每個選項最高出現的機率不大於 0.8,且五種符號可能出現的機率和等於一;將以上三種參數的初 始值代入廣義隱藏式馬可夫模型再進行廣義隱藏式馬可夫模型之遞迴估 計,即可估出與我們模擬出來的三種參數的真值誤差甚小可被接受的參數 估計值,從 200、500、1000 名學生及有 30、50 試題中分別重複 50 次地 參數重估,然後最後取其 50 次的絕對誤差值的平均值,得以減少離群值 的影響,並每種人數與題數的組合產生 5 種不同的學生作答情形,即有不 同的參數值,加以進行估計之。
第三節 研究工具
壹、利用 MATLAB 撰寫程式,產生模擬資料及做符號矩陣、
初始矩陣、及轉移矩陣之估計,並與真值求得誤差。
本研究的目的主要是比較各種組合中,各矩陣的估算何者的誤差較 小,故以 MATLAB 撰寫程式以做電腦模擬試驗。先模擬出受試者的作答情 形,在根據第二節所提出的模式來估計各參數,由參數與真值便可求得絕 對誤差,由誤差的大小來決定模型的適用範圍與使用限制,方便未來對於 廣義隱藏式馬可夫模型有興趣者之建議與參考。而選擇 MATLAB 的原因為 因為 MATLAB 採用直譯指令的方式使用起來較為容易,其涵蓋的範圍甚廣,
當然也可採用其他軟體,如 C++、Java 語言,只要呈現之結果具有可信度 即可。
貳、實際施測:實際出題並到各國小進行施測。
此項作法的目的主要是取得學生實際的作答情形,再使用上述的模型 來對試題進行分析,除了主要分析學生潛在的作答方式,讓猜測與實際認 知的題目分開之外,亦可分析試題是否具有誘答力。方便教師在教學的過 程中更能瞭解學生的學習情形與出題方針,以便於未來施測或是補救教學 時的參考指標。
第四章 研究結果
在本章中,本研究根據第三章所提出的研究架構逐步實施,將於第一 節依不同的人數的人數、試題數不同來分別做不同的實驗設計,於第二節 中以實測資料帶入研究架構中,來嘗試探討學生隱藏的作答模式。
第一節 模擬研究之探討
本文針對「非時間序列廣義隱藏式馬可夫模型」應用在一般任意選題 作答之非時間序列紙筆測驗分析,進行參數估計之蒙地卡羅模擬研究,並 後者提出實例說明,進而發展電腦應用程式藉以進行參數估計蒙地卡羅模 擬研究。該「非時間序列 GHMM」,每一時間點對應於一特定試題,不同之 時間點對應於不同之試題,且其每一時間點符號機率矩陣對應於特定試題 在不同之作答策略狀態之下選答特定選項之機率矩陣,簡言之,每一時間 點之單一符號機率值即為一試題選項之作答機率值,以具「認知作答」、「猜 測作答」及「遺漏未答」等三種作答策略狀態及有「選項 1」、「選項 2」、
「選項 3」、「選項 4」、「空白」等五種可觀測符號之 GHMM 模型之參數重估
「符號機率變動法」為例,遞迴估計之初始值之訂定:
π
=[ π π π
1, 2, 3]
,其中π3
= 空白之符號總數/(總人數*總試題數)
、π1= − (1
π3) *0.9
、π2= − (1
π3) *0.1
,At
π π π
⎡ ⎤⎢ ⎥
= ⎢ ⎥
⎢ ⎥⎣ ⎦
,其餘有關符號機率矩陣
B
t部分,其中每個選項最高出現的機率不大於 0.8,且五種符號可能出現的機率和等於一;將以上三種參數的初 始值代入廣義隱藏式馬可夫模型再進行廣義隱藏式馬可夫模型之遞迴估 計,即可估出與我們模擬出來的三種參數的真值誤差甚小可被接受的參數
參數重估,然後最後取其 50 次的絕對誤差值的平均值,得以減少離群值 的影響,並每種人數與題數的組合產生 5 種不同的學生作答情形,即有不 同的參數值,加以進行估計之。
一、 人數不同:
主要針對在相同題數下,人數對於變數 A、B、pi 誤差的影響。
1.A 變數之誤差情形
變數A在固定題數為30題時之誤差情形
0 0.02 0.04 0.06 0.08 0.1
1 2 3 4 5
實驗次數 絕
對 誤 差
N=200人 N=500人 N=1000人
圖 4-1 變數 A 在固定題數為 30 題時之誤差情形
變數A在固定題數為50題時之誤差情形
0 0.02 0.04 0.06 0.08
1 2 3 4 5
實驗次數 絕
對 誤 差
N=200人 N=500人 N=1000人
圖 4-2 變數 A 在固定題數為 50 題時之誤差情形
由圖 4-1,圖 4-2 可知,在人數為 200 人時,誤差曲線呈現不規則跳 動,當人數為 500 人時,曲線的波動漸趨穩定,當人數到達 1000 人時,
可明顯發現整個誤差曲線相當穩定,並且可控制在合理的範圍內。因此,
人數的增加對於變數 A 誤差的減少,有顯著的影響,若之後相關之研究若 要降低 A 誤差,可以用增加人數來達成目的。
2.B 變數之誤差情形
參數B在固定試題數為30下之誤差情形
0 0.02 0.04 0.06 0.08
1 2 3 4 5
實驗次數 絕
對 誤 差
N=200人 N=500人 N=1000人
圖 4-3 變數 B 在固定題數為 30 題時之誤差情形
參數B在固定試題為50題之誤差情形
0 0.02 0.04 0.06 0.08
1 2 3 4 5
實驗次數 絕
對 誤 差
N=200人 N=500人 N=1000人
由圖 4-3,圖 4-4 可知,對於 B 變數而言,由於變數 B 本身為一變動 之變數,人數的增加對於誤差情形只有稍微的改善,並無相當明顯之改 進。然而,當人數為 1000 人時,誤差也較 200 人、500 人來的穩定。因此,
人數的增加,對於誤差的減少雖無顯著的成效,但是對於誤差的穩定水 平,還是有所增進。
3.pi 變數之誤差情形
pi變數在固定題數為30題之誤差情形
0 0.02 0.04 0.06 0.08
1 2 3 4 5
實驗次數 絕
對 誤 差
N=200人 N=500人 N=1000人
圖 4-5 變數 pi 在固定題數為 30 題時之誤差情形
pi變數在固定題數為50題之誤差情形
0 0.02 0.04 0.06 0.08
1 2 3 4 5
實驗次數 絕
對 誤 差
N=200人 N=500人 N=1000人
圖 4-6 變數 pi 在固定題數為 50 題時之誤差情形
由圖 4-5,圖 4-6 可知,在人數為 200 人時,誤差曲線呈現不規則跳 動,當人數為 500 人時,曲線的波動漸趨穩定,當人數到達 1000 人時,
可明顯發現整個誤差曲線相當穩定,並且可控制在合理的範圍內。因此,
人數的增加對於變數 pi 誤差的減少,有顯著的影響,若之後相關之研究 若要降低 pi 誤差,可以用增加人數來達成目的。
二、 試題數的不同
主要針對在相同人數下,試題數對於變數 A、B、pi 誤差的影響。
主要針對在相同人數下,試題數對於變數 A、B、pi 誤差的影響。