• 沒有找到結果。

第三組實驗之實驗結果與討論

gSlip 和 gGuess 的增大而有略為降低的趨勢,而不管是固定 slip 與 guess 值改變 gSlip 與 gGuess 值、或是固定 gSlip 與 gGuess 值改變 slip 與 guess 值,在我們所觀察的實驗參數

5.3.3 第三組實驗之實驗結果與討論

在第三組實驗中,我們以 A_B_C_D_ABCD 作為模擬腳本中貝氏網路的真實結構。套用 到圖 5.1 的流程,我們的程式在第一回合中必須先由 2 個親代觀念的所有可能歷程組合 中 ( 共 有 AB_CD_ABCD 、 BC_AD_ABCD 、 AC_BD_ABCD 、 A_BCD_ABCD 、 B_ACD_ABCD、C_ABD_ABCD、D_ABC_ABCD,7 個結構)找到一組結構為我們認 為較符合真實狀況結構,並根據這一組結構來進行更深入的比較。

5.3.3.1 以 MI-B 作為歷程評比指標之實驗結果

guess與slip

AB_CD

圖 5.45 3_1_MI-B_gSlip 與 gGuess_0.1

0

guess與slip

AB_CD

圖 5.46 3_1_MI-B_gSlip 與 gGuess_0.2

0

gGuess與gSlip

AB_CD

圖 5.47 3_1_MI-B_slip 與 guess_0.1

0

gGuess與gSlip

AB_CD

圖 5.48 3_1_MI-B_slip 與 guess_0.2

在 此 組 實 驗 中 , 一 個 值 得 討 論 的 問 題 是 , 在 我 們 知 道 真 實 的 隱 藏 結 構 為 A_B_C_D_ABCD 的前提之下,A_BCD_ABCD、 B_ACD_ABCD、C_ABD_ABCD 、 D_ABC_ABCD 在定性的角度下應該有相等的機會會被選為第一回合中的候選結構,然 而藉由表 5.1 之學生類別與觀念能力表的內容我們可以發現,觀念 dABC 的能力內容與 綜合觀念 dABCD 之親代觀念(cA、cB、cC、cD)的內容比起觀念 dACD 與 dABD 與 dABCD 之親代觀念(cA、cB、cC、cD)的內容較為相近,而在「cA 與 dBCD」的親 代觀念組合中,我們認為這一組觀念能力的內容含有「具有所有親代觀念的能力而卻不

具有綜合觀念能力」的學生類別,我們推測,由於此類學生不具有綜合觀念 dABCD 的 能力,因此既使此類學生擁有很強的親代觀念的能力,他們可以在親代觀念的試題作答 上有良好的表現,但是卻很難有機會在綜合觀念 dABCD 的試題作答上有良好的表現,

而系統觀察到這一類的資料,但是我們的方法卻無法判別出考生在綜合觀念 dABCD 的 試題作答上表現不佳的原因,因此就不容易認為這個歷程結構(A_BCD_ABCD)為較 符合現實狀況的結構。基於以上的推論,我們認為在第一回合中,D_ABC_ABCD 的確 比 A_BCD_ABCD、B_ACD_ABCD、C_ABD_ABCD 擁有較多的機會會被系統推薦為目 前較符合現實狀況的歷程結構。

我們在 2 個親代觀念的所有可能歷程組合中找到 D_ABC_ABCD 為目前最適合的結 構後,第二回合則必須與所有 D_ABC_ABCD 所分裂而出且親代觀念數目為 3 的歷程組 合(共有 D_A_BC_ABCD 與 D_B_AC_ABCD、D_C_AB_ABCD,3 個結構)進行比較。

圖 5.49 至圖 5.52 為系統在第二回合中系統以 MI-B 作為歷程評比指標並改變實驗參 數之實驗數據結果圖表。觀察此四個圖表,我們可發現,在我們所觀察的實驗參數範圍 中,D_B_AC_ABCD 均能得到比其他歷程結構高出許多的推荐次數,因此系統均能從 4 個可能的歷程結構中挑選出 D_B_AC_ABCD 為我們認為目前較符合現實狀況的歷程結 構。

0 20 40 60 80 100

0 0.05 0.1 0.15 0.2

guess與slip

D_A_BC D_B_AC D_C_AB D_ABC

圖 5.49 3_2_MI-B_gSlip 與 gGuess_0.1

0 20 40 60 80 100

0 0.05 0.1 0.15 0.2

guess與slip

D_A_BC D_B_AC D_C_AB D_ABC

圖 5.50 3_2_MI-B_gSlip 與 gGuess_0.2

0 20 40 60 80 100

0 0.05 0.1 0.15 0.2

gGuess與gSlip

D_A_BC D_B_AC D_C_AB D_ABC

圖 5.51 3_2_MI-B_slip 與 guess_0.1

0 20 40 60 80 100

0 0.05 0.1 0.15 0.2

gGuess與gSlip

D_A_BC D_B_AC D_C_AB D_ABC

圖 5.52 3_2_MI-B_slip 與 guess_0.2

在此組實驗中,一個值得討論的問題是,在實驗結果中,D_B_AC_ABCD 都會優 先於 D_A_AB_ABCD 和 D_C_AB_ABCD C 被選上,而從定性的分析角度來看,這三個 選擇應該沒有誰先誰後的明顯理由,然而我們嘗試從表 5.1 的 cgmatrix 的內容來推測造 成這個現象的原因。下表 5.10 為與表 5.1 內容相同的學生觀念與類別能力表,我們比較 綜合觀念分別在 D_B_AC_ABCD、D_A_BC_ABCD 和 D_C_AB_ABCD C 結構中的親代 觀念的能力。

表 5.10 dAB、dBC 與 dAC 的觀念能力內容比較表 基本觀念的能力/建立縱合觀念的能力 類

cA cB cC cD dAB dBC dAC dAD dBD dCD dABC dABD dBCD dACD dABCD 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 1 2 1 1 1 1 1 1 1 1 1 1 0 0 1 0 0 3 1 1 1 1 0 0 0 0 1 0 1 0 1 0 1 4 1 1 1 1 0 0 1 0 1 0 0 0 0 0 0 5 1 1 1 1 1 0 0 1 0 1 1 1 1 1 1 6 1 1 1 1 0 0 1 0 0 0 1 1 1 1 1 7 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

由表 5.8 中我們可以發現,這三個結構相關的能力內容僅有在第 4、5 與 6 類別中的 dAB、dBC 與 dAC 有明顯不同的地方(cA、cB、cC 與 cD 的 cgmatrix 內容均為 1)。而 在我們的真實結構 A_B_C_D_ABCD 中,綜合觀念 dABC 之親代觀念是由 cA、cB、cC

與 cD 衍生而來,觀念 dAC 的 cgmatrix 內容與「cA、cB、cC 與 cD」的相似度比起 dAB、

dBC 分別與「cA、cB、cC 與 cD」都較為高,因此我們推測這是 D_B_AC_ABCD 都會 優先於 D_A_AB_ABCD 和 D_C_AB_ABCD C 被選上的原因。

我們在 3 個親代觀念的所有可能歷程組合中找到 D_B_AC_ABCD 為目前最適合的 結構後,第三回合則必須與所有 D_B_AC_ABCD 所分裂而出且親代觀念數目為 4 的歷 程組合(僅有 A_B_C_D_ABCD)進行比較。

在比較 D_B_AC_ABCD 與 A_B_C_D_ABCD 兩個歷程結構的優劣過程中,系統使 用 MI-B 為評比指標,在我們所觀測的參數範圍中,A_B_C_D_ABCD 這組結構均能在 100 次測試之中得到近乎 100%的推荐次數,因此我們在此省略其圖表,並於下節中作 詳細的討論。

5.3.3.2 以 KS 作為歷程評比指標之實驗結果

圖 5.53 至圖 5.56 為系統在第一回合中系統以 KS 作為歷程評比指標並改變實驗參數之實 驗數據結果圖表。如同系統以 MI-B 作為評比指標的第一回合實驗,在我們所觀察的實 驗參數範圍中,D_ABC_ABCD 均能得到比其他歷程結構高出許多的推荐次數,因此系 統均能從 7 個可能的歷程結構中挑選出 D_ABC_ABCD 為我們認為目前較符合現實狀況 的歷程結構。

0 20 40 60 80 100

0 0.05 0.1 0.15 0.2

guess與slip

AB_CD BC_AD AC_BD A_BCD B_ACD C_ABD D_ABC

圖 5.53 3_1_KS_gSlip 與 gGuess_0.1

0 20 40 60 80 100

0 0.05 0.1 0.15 0.2

guess與slip

AB_CD BC_AD AC_BD A_BCD B_ACD C_ABD D_ABC

圖 5.54 3_1_KS_gSlip 與 gGuess_0.2

0

gGuess與gSlip

AB_CD

圖 5.55 3_1_KS_slip 與 guess_0.1

0

gGuess與gSlip

AB_CD

圖 5.56 3_1_KS_slip 與 guess_0.2 由以上的實驗數據我們可以看出,在尋找 A_B_C_D_ABCD 之歷程結構的第一回合 中,不管我們使用 MI-B 或 KS 作為歷程結構評比的指標,在實驗參數高達 20%時,

D_ABC_ABCD 皆有即高的機會被推荐為目前最適合的結構。

我們在 2 個親代觀念的所有可能歷程組合中找到 D_ABC_ABCD 為目前最適合的結 構後,第二回合則必須與所有 D_ABC_ABCD 所分裂而出且親代觀念數目為 3 的歷程組 合(共有 D_A_BC_ABCD 與 D_B_AC_ABCD、D_C_AB_ABCD,3 個結構)進行比較。

圖 5.57 至圖 5.60 為系統在第二回合中系統以 KS 作為歷程評比指標並改變實驗參數 之實驗數據結果圖表。觀察此四個圖表,我們可發現,在我們所觀察的實驗參數範圍中,

D_B_AC_ABCD 均能得到比其他歷程結構高出許多的推荐次數,因此系統均能從 4 個 可能的歷程結構中挑選出 D_B_AC_ABCD 為我們認為目前較符合現實狀況的歷程結 構。

guess與slip

D_A_BC D_B_AC D_C_AB D_ABC

圖 5.57 3_2_KS_gSlip 與 gGuess_0.1

0

guess與slip

D_A_BC D_B_AC D_C_AB D_ABC

圖 5.58 3_2_KS_gSlip 與 gGuess_0.2

0 20 40 60 80 100

0 0.05 0.1 0.15 0.2

gGuess與gSlip

D_A_BC D_B_AC D_C_AB D_ABC

圖 5.59 3_1_KS_slip 與 guess_0.1

0 20 40 60 80 100

0 0.05 0.1 0.15 0.2

gGuess與gSlip

D_A_BC D_B_AC D_C_AB D_ABC

圖 5.60 3_1_KS_slip 與 guess_0.2 由以上的實驗數據結果我們可以看出,在尋找 A_B_C_D_ABCD 之歷程結構的第二 回合中,不管我們使用 MI-B 或 KS 作為歷程結構評比的指標,在實驗參數高達 20%時,

D_B_AC_ABCD 街友及高的機會被推荐為目前最適合的結構。

我們在 3 個親代觀念的所有可能歷程組合中找到 D_B_AC_ABCD 為目前最適合的 結構後,第三回合則必須與所有 D_B_AC_ABCD 所分裂而出且親代觀念數目為 4 的歷 程組合(僅有 A_B_C_D_ABCD)進行比較。

在比較 D_B_AC_ABCD 與 A_B_C_D_ABCD 兩個歷程結構的優劣過程中,系統以

KS 為評比指標,在我們所觀測的參數範圍中,A_B_C_D_ABCD 這組結構均能在 100

次測試之中得到近乎 100%的推荐次數,因此我們在此省略其圖表,並於下節中作詳細 的討論。

相關文件