第四章 實驗結果與討論
4.6 分群法、分類法、碰撞資訊、動態分類、Prototype等討論
本節中我們將依序進行“分群法比較”、“碰撞資訊的使用”、“分類法比較”、“動態 分類的使用”、以及“使用 Prototype 與否”五個主題之討論,希望透過各種方法的比較與 討論,找出最佳的分群方法和分類方法。
4.6.1 分群法比較
我們利用測資 1 進行各種分群方法之比較,如表 4-6 結果所示,“階層式分群演算法 配合 Average-link 合併公式”所得的分群結果為最佳。
表 4-6:測資 1 進行分群法之討論
[實驗採取:兩階段分群方法,搭配最小距離分類]
群組個數 分群法
C = 7 C = 10 C = 15 C = 20 ARI CVC ARI CVC ARI CVC ARI CVC
階層
式分 群演
算法
Single-link 0.130 0.442 0.108 0.496 0.261 0.690 0.304 0.744 Complete-link 0.401 0.651 0.403 0.729 0.334 0.783 0.306 0.853 Average-link 0.607 0.806 0.633 0.837 0.487 0.891 0.504 0.985 Ward 0.346 0.636 0.342 0.729 0.350 0.837 0.323 0.868 Hungarian method 0.513 0.760 0.454 0.814 0.439 0.930 0.339 0.930 METIS 0.293 0.589 0.236 0.643 0.195 0.682 0.112 0.659
4.6.2 碰撞資訊的使用
由 4.6.1 節中的實驗得知,階層式分群演算法配合 Average-link 合併公式為最佳的分 群方法,我們再加上串列間的時間資訊(碰撞資訊),使互相碰撞之串列無法合併,利 用測資 1 以及測資 2 來進行測試,所得結果分別為表 4-7、表 4-8。
透過以上兩組數據觀察,加上碰撞資訊後的分群結果將有明顯的提升,原因在於碰 撞資訊被採用前,階層式分群法過程中可能會有時間重疊之演員串列遭合併,若採用碰 撞資訊,則可避免這兩個不同演員之串列被併入同一群組中,因此,碰撞資訊的應用可 提升分群準確度。綜合以上兩個實驗,我們說“Average-link with Collision”為最佳的分群 方法。
表 4-8:測資 2 進行碰撞資訊使用之討論 [實驗採取:兩階段分群方法,搭配最小距離分類]
測資 2 Average-link Average-link with Collision
ARI CVC ARI CVC
C = 7 0.046 0.302 0.134 0.421 C = 10 0.068 0.334 0.124 0.434 C = 15 0.114 0.409 0.123 0.447 C = 20 0.114 0.449 0.171 0.551
表 4-7:測資 1 進行碰撞資訊使用之討論 [實驗採取:兩階段分群方法,搭配最小距離分類]
測資 1 Average-link Average-link with Collision
ARI CVC ARI CVC
C = 7 0.607 0.806 0.648 0.829 C = 10 0.633 0.837 0.633 0.837 C = 15 0.487 0.891 0.487 0.891 C = 20 0.504 0.985 0.504 0.985
4.6.3 分類法比較
此段落中,我們利用測資 1 與測資 2 探討最小距離分類、K-NN、以及 Modified K-NN 何者為兩階段分群方法中最佳的分類方法。由於 K=1 時三者皆為最小距離分類,因此表 4-9 中僅記錄 K 值大於 1 之比較數據。由結果數據的觀察我們發現 Modified K-NN 將帶 來比其他兩者較好的分類結果。分析三種分類方法,由於 Modified K-NN 具有整體性比 較之特性,因此不易受到 local minimum 影響,故優於其它兩方法。
表 4-9:測資 1 與測資 2 進行分類方法討論
Stage 1 Stage 2
(測資 1)Average-link with C=7 → K = 3
ARI CVC 最小距離分類 K-NN Modified K-NN
0.627 0.8
ARI CVC ARI CVC ARI CVC 0.607 0.806 0.613 0.809 0.624 0.814 (測資 1)Hungarian method with C=15 → K =3
0.456 0.945
0.439 0.93 0.441 0.92 0.463 0.946 (測資 1)“Average-link with Collision” with C=7 → K = 3
0.667 0.827
0.648 0.829 0.652 0.833 0.666 0.837 (測資 1)“Hungarian method with Collision” with C=7 → K = 3
0.516 0.727
0.528 0.736 0.535 0.739 0.543 0.744 (測資 2)“Hungarian method with Collision” with C=7 → K = 3
0.133 0.469
0.096 0.408 0.113 0.429 0.113 0.431
4.6.4 動態分類的使用
接下來,我們探討動態分類對於分類結果之影響,表 4-10 記錄測資在未採取動態 分類、以及採用動態分類之結果,由實驗結果得知,動態分類將有助於分類正確率之提 升。因此綜合以上兩個實驗,我們說“動態 Modified K-NN”為最佳的分類方法。
4.6.5 Prototype 的使用
最後,探討 Prototype 之使用對於整體分群之影響,除了兩階段分群方法搭配動態 Modified K-NN 分類,我們也進行另一種分群策略─所有串列一併進行分群,希望透過 更多策略的進行幫助我們觀察 Prototype 之特性。表 4-11 中記錄測資 2 進行 Prototype 探 討之結果。由實驗結果得知,Prototype 之使用並無法達到第 3.4.5 節中所說提升分群正 確率的假設,因此在之後的實驗中,我們將不進行 Prototype 之測試。
表 4-10:測資 2 進行動態分類應用之比較
Average-link
with Collision
Stage 1 Stage 2
(Modified K-NN)Modified K-NN
ARI CVC ARI CVC
C = 7
0.108 0.39
0.087 0.355
↓↓↓ Dynamic ↓↓↓
0.088 0.361
C = 10
0.131 0.452
0.106 0.405
↓↓↓ Dynamic ↓↓↓
0.107 0.416
C = 20
0.136 0.528
0.114 0.482
↓↓↓ Dynamic ↓↓↓
0.116 0.49
C = 30
0.151 0.587
0.126 0.541
↓↓↓ Dynamic ↓↓↓
0.133 0.556
截至目前為止,我們已經探討了投影基底及維度;人臉的前處理方式;同時也得知
“Average-link with Collision”為最佳的分群方法,另一方面,在兩階段分群方法中,“動 態 Modified K-NN”則是最佳的串列分類方法。而針對兩分群策略的優劣比較上,兩策略 間沒有明顯的優劣差距,因此在下一個討論議題實驗中,將同時採用兩分群策略之結 果。
表 4-11:測資 2 進行 Prototype 應用之比較 Average-link
with Collision
兩階段分群方法
所有串列一併分群
ARI CVC ARI CVC
C = 7
0.088 0.361 0.1 0.397
↓↓↓ Prototype ↓↓↓
0.097 0.38 0.073 0.361
C = 10
0.107 0.416 0.105 0.448
↓↓↓ Prototype ↓↓↓
0.103 0.423 0.12 0.452
C = 20
0.116 0.49 0.132 0.533
↓↓↓ Prototype ↓↓↓
0.118 0.501 0.109 0.463
C = 30
0.133 0.556 0.138 0.56
↓↓↓ Prototype ↓↓↓
0.12 0.558 0.118 0.507