五. 實驗與結果
5.1.3. 實驗結果
整體辨識結果
整體來說,如果我們對「無法辨識」的部分不去做額外的處理,則當訓練資料的 數目越多,辨識的正確性就越高;而在不同的訓練資料數目下,也會有不同的最佳分 群數目。
3,7,7
5,10,10 7,15,15
10,20,20
訓練資料數:5 訓練資料數:10
訓練資料數:20 0
10 20 30 40 50 60 70 80 90
辨識率
分群數目 訓練資料數目
訓練資料數:5 訓練資料數:10 訓練資料數:20
圖 5-13 不同訓練資料數目與分群數目下的辨識正確率
而不管什麼組合的設定,或多或少也都還是會有無法辨識的部份,其機率如下圖:
3,7,7 5,10,10
7,15,15 10,20,20
訓練資料數:5 訓練資料數:10 訓練資料數:20 0
5 10 15 20 25 30 35 40 45 50
無法 辨識率
分群數目
訓練資料數目 訓練資料數:5 訓練資料數:10 訓練資料數:20
圖 5-14 不同訓練資料數目與分群數目下的無法辨識機率
我們也可以發現,當訓練資料的量越少或者分群數目越多,無法辨識的資料量就會越 大;這是由於在這些情況下,觀察值沒有出現在訓練資料的機率會越高所造成的。
而如果使用本論文於「雜訊干擾下的資料辨識」所提出的三種容錯可能性計算方 法來辨識本來無法辨識的資料的話,在大部分的情形下,都能以一定程度的正確性,
將無法辨識的部份辨識出來,並使整體的辨識率提高到一定的程度;尤其是當訓練資 料較少,或分群數目設定不佳時,效果較為明顯。下表即為測試的結果(在同一訓練 資料數目下的四組數值,分別是分群數目為3, 7, 7、5, 10, 10、7, 15, 15、10, 20, 20 的 結果)。
0 10 20 30 40 50 60 70 80 90 100
5 5 5 5 10 10 10 10 20 20 20 20 訓練資料數
無法辨識的 機率
原始的辨識 率
以容錯相似 性辨識的最 佳結果
圖 5-15 以容錯可能性辨識的最佳結果
上述數值詳細如下:
不另作處理 以容錯可能性辨識資料的最佳結果 訓練資
料數目 分群數目
正確 無法辨識 錯誤 正確 無法辨識 錯誤
3,7,7 72.5 13.35 14.15 79.41 0 20.59
5,10,10 69.04 18.23 12.73 81.02 0 18.98
7,15,15 57.73 33.58 8.69 80.88 0.07 19.05 5
10,20,20 44.08 47.14 8.78 76.89 0 23.11
3,7,7 81.1 3.77 15.13 85.18 0 14.82
5,10,10 80.62 9.81 9.57 87.51 0 12.49
7,15,15 74.78 15 10.22 86.19 0 13.81
10
10,20,20 68.71 21.6 9.69 84.16 0 15.84
3,7,7 87.17 1.56 11.27 88.12 0 11.88
5,10,10 88.075 4.195 7.73 91.065 0 8.935 7,15,15 89.425 5.255 5.32 93.395 0 6.605 20
10,20,20 85.445 7.37 7.185 90.93 0 9.07 表格 10 辨識結果整體簡表
辨識結果細節
各種不同參數設定、辨識方法的辨識詳細結果如下列各表。列為不同的權重計算 方式,其代碼所代表的意義如下:
Uniform 不加權重
IW 各狀態獨立權重,每次計算 IWO 各狀態獨立權重,計算一次 SW 各狀態單一權重,每次計算 SWO 各狀態單一權重,計算一次
欄的部份,則是五種不同的辨識計算方式,其代碼代表意義如下:
None 不做額外處理
FeatureSkip 拋棄無法對應的部份觀察值(4.2.1)
StepFeatureSkip 拋棄權重小的部份觀察值(4.2.2)
TimeStataSkip 忽略無狀態轉移可能性的時刻(4.3.1)
Right 代表辨識正確、none 代表無法辨識、Wrong 代表辨識錯誤,反白的部份代表最 佳辨識率。而由於使用均勻分布當權種沒有辦法判斷各特徵的重要性,因此無法適用 於「拋棄權重小的部份觀察值」(StepFeatureSkip)這種方法。
None FeatureSkip StepFeatureSkip TimeStataSkip Right None Wrong Right None Wrong Right None Wrong Right None Wrong Uniform 72.5 13.35 14.1579.07 0 20.93 N/A 77.17 0 22.83 IW 72.26 12.4 15.3478.63 0 21.3778.31 0 21.6977.37 0 22.63 IWO 72.8 12.67 14.5379.41 0 20.5979.23 0 20.7777.46 0 22.54 SW 70.56 12.34 17.1 75.89 0 24.11 76.36 0 23.6474.82 0 25.18 SWO 72.12 13.2 14.6878.67 0 21.3378.92 0 21.0876.79 0 23.21
表格 11 訓練資料 5 筆,分群數目 3, 7, 7
None FeatureSkip StepFeatureSkip TimeStataSkip Right None Wrong Right None Wrong Right None Wrong Right None Wrong Uniform69.04 18.23 12.7380.45 0 19.55 N/A 77.96 0 22.04 IW 69.27 15.93 14.8 79.12 0 20.8879.330.01 20.6676.96 0 23.04 IWO 69.35 17.41 13.2480.61 0 19.39 80.2 0.01 19.7977.91 0 22.09 SW 68.86 17.55 13.5979.02 0 20.9879.21 0 20.7977.22 0 22.78 SWO 69.36 17.33 13.3180.57 0 19.4381.02 0 18.98 78.05 0 21.95
表格 12 訓練資料 5 筆,分群數目 5, 10, 10
None FeatureSkip StepFeatureSkip TimeStataSkip Right None Wrong Right None Wrong Right None Wrong Right None Wrong Uniform57.73 33.58 8.69 78.42 0 21.58 N/A 78.25 0 21.75 IW 58.84 31.72 9.44 80.27 0 19.73 80.88 0.07 19.05 78.25 0 21.75 IWO 58.06 32.98 8.96 79.22 0 20.78 80.6 0.32 19.08 78.14 0 21.86 SW 58.59 32.08 9.33 78.67 0 21.33 80.790.01 19.2 77.98 0 22.02 SWO 58.22 33.17 8.61 79.42 0 20.58 80.84 0 19.16 78.57 0 21.43
表格 13 訓練資料 5 筆,分群數目 7, 15, 15
None FeatureSkip StepFeatureSkip TimeStataSkip Right None Wrong Right None Wrong Right None Wrong Right None Wrong Uniform44.08 47.14 8.78 75.22 0 24.78 N/A 70.61 0 29.39 IW 44.87 45.51 9.62 76.89 0 23.11 76.470.23 23.3 70.68 0 29.32 IWO 44.13 46.34 9.53 76.75 0 23.2575.590.18 24.23 70.15 0 29.85 SW 44.15 45.76 10.0974.43 0 25.5776.24 0 23.76 70.01 0 29.99 SWO 44.09 46.78 9.13 76.69 0 23.3176.83 0 23.17 70.65 0 29.35
表格 14 訓練資料 5 筆,分群數目 10, 20, 20
None FeatureSkip StepFeatureSkip TimeStataSkip Right None Wrong Right None Wrong Right None Wrong Right None Wrong Uniform81.1 3.77 15.1383.75 0 16.25 N/A 82.97 0 17.03 IW 82.49 3.54 13.9785.18 0 14.8284.45 0 15.55 84.2 0 15.8 IWO 81.45 3.61 14.9484.33 0 15.6783.82 0 16.1883.37 0 16.63
SW 81.62 3.56 14.8284.17 0 15.83 84.1 0 15.9 83.18 0 16.82 SWO 80.81 3.72 15.4783.59 0 16.4183.44 0 16.5682.67 0 17.33
None FeatureSkip StepFeatureSkip TimeStataSkip Right None Wrong Right None Wrong Right None Wrong Right None Wrong Uniform80.62 9.81 9.57 87.37 0 12.63 N/A 85.36 0 14.64 IW 80.42 9.69 9.89 87.18 0 12.8287.45 0 12.5585.19 0 14.81 IWO 80.81 9.71 9.48 87.39 0 12.6187.51 0 12.49 85.73 0 14.27 SW 79.58 9.62 10.8 86.43 0 13.5786.95 0 13.0584.28 0 15.72 SWO 80.43 9.68 9.89 86.84 0 13.1687.21 0 12.7985.13 0 14.87
表格 16 訓練資料 10 筆,分群數目 5, 10, 10
None FeatureSkip StepFeatureSkip TimeStataSkip Right None Wrong Right None Wrong Right None Wrong Right None Wrong Uniform74.78 15 10.2284.23 0 15.77 N/A 84.07 0 15.93 IW 74.93 14.24 10.8385.25 0 14.7585.93 0 14.0783.31 0 16.69 IWO 74.97 15.02 10.0185.36 0 14.6486.19 0 13.8184.16 0 15.84 SW 74.05 14.43 11.52 84.29 0 15.7183.96 0 16.0482.81 0 17.19 SWO 74.61 15.17 10.2284.75 0 15.2584.36 0 15.6483.91 0 16.09
表格 17 訓練資料 10 筆,分群數目 7, 15, 15
None FeatureSkip StepFeatureSkip TimeStataSkip Right None Wrong Right None Wrong Right None Wrong Right None Wrong Uniform68.71 21.6 9.69 83.5 0 16.5 N/A 81.11 0 18.89 IW 69.01 20.96 10.0384.16 0 15.8482.880.16 16.9681.55 0 18.45 IWO 68.36 21.58 10.0683.79 0 16.2182.240.19 17.5780.89 0 19.11 SW 67.84 21.09 11.07 82.43 0 17.5781.61 0 18.3980.09 0 19.91 SWO 68.28 21.87 9.85 83.72 0 16.2882.34 0 17.6681.05 0 18.95
表格 18 訓練資料 10 筆,分群數目 10, 20, 20
None FeatureSkip StepFeatureSkip TimeStataSkip Right None Wrong Right None Wrong Right None Wrong Right None Wrong Uniform87.17 1.56 11.2788.12 0 11.88 N/A 87.87 0 12.13 IW 85.96 1.5 12.5486.94 0 13.0686.77 0 13.2386.58 0 13.42 IWO 86.44 1.42 12.1487.33 0 12.6787.31 0 12.6987.05 0 12.95 SW 83.73 1.51 14.7684.71 0 15.2984.78 0 15.2284.47 0 15.53 SWO 85.92 1.53 12.5586.88 0 13.1287.04 0 12.9686.63 0 13.37
表格 19 訓練資料 20 筆,分群數目 3, 7, 7
None FeatureSkip StepFeatureSkip TimeStataSkip Right None Wrong Right None Wrong Right None Wrong Right None Wrong Uniform 88.075 4.195 7.73 91.065 0 8.935 N/A 90.22 0 9.78
IW 87.55 4.295 8.155 90.59 0 9.41 90.6850.005 9.31 89.79 0 10.21 IWO 87.46 4.27 8.27 90.475 0 9.52590.795 0 9.205 89.585 0 10.415
SW 85.975 4.255 9.77 88.85 0 11.1589.015 0 10.98588.245 0 11.755 SWO 86.94 4.25 8.81 89.97 0 10.03 89.97 0 10.03 89.06 0 10.94
表格 20 訓練資料 20 筆,分群數目 5, 10, 10
None FeatureSkip StepFeatureSkip TimeStataSkip Right None Wrong Right None Wrong Right None Wrong Right None Wrong Uniform 89.425 5.255 5.32 93.235 0 6.765 N/A 92.155 0 7.845 IW 88.46 5.035 6.505 92.385 0 7.615 91.95 0 8.05 91.125 0 8.875 IWO 89.25 5.315 5.435 93.08 0 6.92 93.09 0 6.91 92.025 0 7.975 SW 86.79 5.08 8.13 90.33 0 9.67 90.925 0 9.07589.445 0 10.555 SWO 89.05 5.285 5.665 92.75 0 7.25 93.395 0 6.605 91.88 0 8.12
表格 21 訓練資料 20 筆,分群數目 7, 15, 15
None FeatureSkip StepFeatureSkip TimeStataSkip Right None Wrong Right None Wrong Right None Wrong Right None Wrong Uniform 85.445 7.37 7.185 90.89 0 9.11 N/A 89.485 0 10.515 IW 84.87 7.265 7.86590.265 0 9.73589.9150.00510.08 89 0 11 IWO 85.12 7.41 7.47 90.71 0 9.29 90.21 0.0059.785 89.205 0 10.795
SW 83.9 7.51 8.59 89.05 0 10.9589.195 0 10.805 88.08 0 11.92 SWO 85.165 7.495 7.34 90.66 0 9.34 90.93 0 9.07 89.325 0 10.675
表格 22 訓練資料 20 筆,分群數目 10, 20, 20
由上列各結果表格可知,實際上並沒有哪一種權重計算方式或辨識方法在任何情 形下都有較好的結果;而實際上,大部分的方法差異也都不是非常的大。
由於對於權重的計算都是以「提高模型與訓練資料的可能性」為前提、而非以「提 高模型間的差異性」來計算的(有經過實驗,有加入權重的模型的確可以得到更佳的 可能性);所以在某些情形下,不另行計算權重(均勻分布)反而會有更佳的鑑別性。
而以目前的權重計算方式來說,在訓練資料量較低的情況(訓練資料量5 或 10)下,
對於辨識的正確性較有益。
而對於相同權重方法,「每次計算」的辨識正確率大致都會比「計算一次」來的低;
這應該是由於「每次計算」會使模型的收斂程度沒有「計算一次」的模型來的高所造 成。
在辨識方法方面,三種方法大多都能把辨識率提高到一定的程度;而利用多觀察 值性質來找近似對應狀態的「忽略無狀態轉移可能性的時刻」、「拋棄權重小的部份觀 察值」兩種方法,在大部分的情形下,也都能得到最佳的辨識率。