預測準確度

第 4 章結果與討論

4.2 實驗結果

4.2.2 預測準確度

點。當 n=8，要挑去點的數量為 2 時，演算法輸出前 4 筆 RMSD 最小數值與編碼組合的對應關係，分別是:

3467(6.1676 )、1346(6.3678 )、13467(7.1312 )、1367(7.2509 )。

從這 4 組參考編碼組合之結果，演算法判斷出沒有編碼 2、5、8 的出現。接著進行 Maximum Outlier 計算，來判斷哪個編碼才是真正該被剔除。從該例中得知，離群值界定範圍為[-2.0501, 4.3248]。但由於在這組測試中，所有組合經過旋轉矩陣疊合後，

所有 RMSD 值都小於 4.3248，因此在沒有 Maximum Outlier 的結果之下，演算法便判斷應該被剔除的編碼為 2、5、8。儘管預測的答案中的一部分，仍對應了正確答案，但因此判斷結果並未完全回答正確(正確答案僅為 2 與 8)，而視為預測錯誤。

造成演算法判斷錯誤的情形，我們歸納了以下兩種原因：

(1) 演算法輸出參考編碼組合數量的限制：測試資料樣本中因為演算法輸出參考編碼組合組數的定義與限制，造成有些編碼所對應的 RMSD 值很小，卻沒排列在輸出參考編碼組合組數的限制內，就以 n=8、C⁸₈+C⁸₇+C⁸₆+C⁸₅+C⁸₄共 163 個 RMSD 值為例，其中一組測試資料中，RMSD 前 4 組最小值的對應組合編碼都並沒有編碼 2、5、8 的出現，但若繼續往下觀察第 5 組 RMSD 值與對應組合編碼時，便出現 4567 (8.36 )，因此便可排除編碼 5，而得到 2 與 8 的正確結果。

此外，我們觀察在這筆測試資料中，發現依順序在第 23 組 RMSD 值與對應組合編碼中，才開始出現編碼 2，組合情形與 RMSD 值的情形為 1234567

(0.207254Å )。而在第 48 組 RMSD 值與對應組合編碼中，才開始出現編碼 8，組合 情形與 RMSD 值的情形為 1245678 (0.466767Å )。這可清楚說明，若這兩個點座標進 行幾何圖形的結構疊合時，RMSD 值便會明顯變大。因此，演算法的疊合與判斷的定義無誤，預測錯誤的原因則是受到演算法輸出參考編碼組合數量的限制所影響。

如圖 4.2、4.3 所示，兩個幾何圖形各別有 8 個點座標，此測試資料是設計其中編號 2 與 8 兩點在結構疊合時，需要排除的兩點，方可將其他 6 個點進行正確的疊合。

圖 4.2、幾何圖形示意圖，以 n=8、k=2 為例。兩圖形中編號 2 與 8 的點座標彼此之 間不相等(圖中標示兩點之 XYZ 點座標)，經過演算法判斷後，預期應該輸出剔除這兩點的結果。若將兩圖形的八個點全部進行結構疊合，則 RMSD 值為 0.8930 Å 。

圖 4.3、幾何圖形結構疊合示意圖，以 n=8、k=2 為例。剔除構形不適當的點而留下 其餘六個點進行結構疊合後，其 RMSD 值為 0.00068971Å ，顯示兩結構相同。

3 1 7

6 4

2 8

5

(5.925 ,11.744 ,5.193) (12.835 ,12.435 ,11.982)

7 3

6 4

5 2

(5.353 ,8.186 ,1.650)

8

(5.458 ,8.247 ,7.562)

1

3 1 7

4 6

5

(2) 測試資料未獲得 Maximum Outlier：在測試樣本範例中，Maximum Outlier 提供進一步輔助演算法做為剔除懷疑編碼的依據與參考，也就是當有需要猜測的懷疑編碼的情況時，演算法將再利用 Maximum Outlier 對應組合編碼，用來針對懷疑編碼出現的次數做累加計數。而在 Maximum Outlier 組合編碼中出現次數較多次的編碼，演算法就判定該編碼為應剔除的編碼，因此可提高演算法著準確性。若無 Maximum Outlier 的資訊，也是造成演算法失誤的原因之一。以上述例子來看，RMSD 最大的數值為 3.5222 Å ，但都未超過 Maximum Outlier 的範圍 4.3248 Å ，因而也無 法做出進一步的判斷，選出正確該被剔除的點座標。

上述這種錯誤發生的情況，在我們的測試資料中極為常見。因為缺少 Maximum Outlier 的候選者，藉以提供演算法針對懷疑編碼繼續做出進一步的判斷，所以出現了比預期還多的剔除點數之情形。

在文檔中中華大學碩士論文 (頁 43-46)

第 4 章 結果與討論

4.2 實驗結果

4.2.2 預測準確度

3

1 7

6 4

2 8

5

7 3

6 4

5 2

8

1

3

1 7

4 6

5

第 4 章結果與討論