數據比較

第五章實驗結果

5.8 數據比較

我們把[21]的數據與我們實驗的數據以 M1 的影片作比較，依照上面各個參數值數的趨勢，表5-4 為本實驗與[21]的效能以 ARI 的數據作比較，我們固定領導臉的選擇方式θ_dyn為0.2、θ 的範圍是 2~160、_rg θ_w為0.1、θ_agg為強凝聚法、θ_rat 是 1.0，每個群數 C 底下共有兩欄，左邊欄位是我們實驗中仿效[21]文中所敘述 的條件產生的效能，右邊欄位為本實驗的實驗結果，我們把依照不同的h 與σ的 組合比較[21]與本實驗的實驗數據，h 與σ的特性是，h 愈大則身體的權重值就愈大，而σ愈大則身體群權重值也愈大但上升的趨勢變小。

表5-4 與[21]數據比較表

Ｍ1 C C = 7 C = 10 C = 20 C = 30 h σ Su’s Wei’s Su’s Wei’s Su’s Wei’s Su’s Wei’s

h = 0.2

σ= 1500 0.566 0.558 0.448 0.482 0.466 0.521 0.426 0.451 σ= 3000 0.447 0.544 0.427 0.572 0.502 0.527 0.452 0.454 σ= 6500 0.375 0.485 0.465 0.412 0.485 0.455 0.414 0.42

h = 0.4

σ= 1500 0.463 0.507 0.419 0.458 0.452 0.462 0.339 0.391 σ= 3000 0.408 0.405 0.412 0.416 0.458 0.402 0.359 0.361 σ= 6500 0.255 0.447 0.358 0.447 0.375 0.382 0.346 0.378

h = 0.6

σ= 1500 0.306 0.412 0.414 0.383 0.452 0.425 0.333 0.344 σ= 3000 0.398 0.358 0.406 0.323 0.422 0.387 0.38 0.353 σ= 6500 0.262 0.316 0.331 0.316 0.357 0.388 0.319 0.359

首先，針對本實驗的效能而言，我們觀察h 對於效能的變化，不論是固定 σ 或是群數C，我們發現當 h 愈大則效能就降低，這是可理解的，因為 h 上升將會 提升身體的權重值，反倒抑制臉部影像對於結果的貢獻，而在人物分群中，最重要的資訊就是人臉特徵，其他的資訊不論是身體影像、場景資訊、相似度或是重疊資訊，都只是輔助分群的工具，因此三個h 值中以 0.2 表現最好的效能，這是 可以理解的，而h 也並非選擇小的就是好，因為如果沒有身體資訊那一切都只使 用臉部資訊來分群，又將回到人物分群的起始點，因此適當地使用身體資訊確實能幫助效能提升；同樣地，表格中，σ 愈大則效能愈低，這也是同樣的道理，只是數據的改變量沒有 h 那麼大，因此這也是為什麼我們實驗一開始就設定 h 為 0.2、σ 為 1500 的原因，而群數 C 對於效能的趨勢，就如同 5.3 節提到的，因為 不同的群數對於ARI 的計算影響很大，因此表中也以〝較接近實際群數 C 條件 擁有較高的效能〞的趨勢。

接下來，我們針對本實驗仿造[21]作法所呈現的效能，與加入叢集整合觀念的人物分群結果相比較，表格中紅色粗體字為本實驗優於[21]的情形，仔細觀察會發現，當 h 比較小時，σ 在小值的部分明顯優於[21]，且相差較大；h 比較大 時，儘管與[21]差距不大，但就是無法提升效能，這是因為兩個實驗的差異就在於，本實驗中加入叢集整合的相似度矩陣，而由於我們認為臉部向量是人物分群最重要的向量，因此我們以串列的領導臉向量作為產生叢集相似度矩陣的來源，

無非是想再次藉由臉部向量得到更可靠的資訊，因此在小 h 與小 σ 能有很好的 表現，全是因為在人物相似度矩陣中，身體的權重值偏大，再加上以身體影像為主要特徵的叢集整合相似度，兩者結合更能充分表達分群的特徵，達到提升效能的目的。

第六章結論與未來展望

本文使用了美國影集作為人物分群的實驗對象，它的場景轉換、背景雜亂、

變動的人物特徵以及衣服資訊等特性，使得人物分群困難度增加，因此我們不僅利用臉部影像，也納入身體影像輔助分群搭配串列時間軸產生的權重，以及分鏡資訊，產生人物相似度矩陣S ，另外加入叢集整合的概念作為輔助分群的資訊，_P 在這麼雜亂的環境中，ARI 的最好效果可以達到六成，這是由於凝聚法所使用的相似度矩陣S，不只包含演員串列特性的人物相似度矩陣，還增加了叢集整合相 似度矩陣S ，確實有助於提升分群效能。另外，針對叢集整合的參數使用，我_E 們會建議θ_dyn挑選接近0.3 的數值可取得效能與時間的平衡點，θ 則選較大的_rg 隨機範圍，θ_w可選0.1~0.3 之間作為輔助分群的資訊，θ_agg選擇兩階段強凝聚法，

θrat要視資料雜亂性而定，過於雜亂可往低數值挑選起，但是盡量不要低於0.5。

實驗中的效能符合我們所期待，而變數值也透漏更多思考的方向，在未來的時間裡，系統有些地方仍可以作加強，首先，我們知道從數據得知，加入S 有_E 助於提升效能，但是其影響結果的能力仍小於S ，因此若能增加_P S 的可靠度，_E 使得最佳效能的W 上升，勢必能提升最佳效能；第二，系統中嘗試許多變數的_E 數值，得到效能的某些規律以及結論，而我們可以更深入的探討每一個變數對於結果的穩定性以及敏感度，這樣將有助於系統評估變數值的好壞以及使用或取代；

第三，本文中除了根據文獻得到的觀點，也從數據的規律中得到結論，因此在未來若能發展一套讓系統對於影片本身的特性，自動產生或推測對於結果最有利的參數值，輔助系統找出最正確的分群結果，這樣有助於減少耗費在找尋規律性的時間成本；第四，在實驗中我們只知道當最終凝聚的群數接近真正演員個數時，

效能會提升，卻未對影片中人物個數產生預測，因此在未來的研究工作上可增加系統在群數的推測。最後，承如2.2 節提到的，影像的運算是很繁複的，如果辨識影像的系統能夠克服無法使用在高維度以及大型資料集的缺陷，那麼辨識系統將會被更廣泛地運用在日常生活中。

參考文獻

[1] W. Y. Zhao, R. Chellappa, P. J. Phillips, and A. Rosenfeld,“Face recognition: a literature survey,＂ACM Computing Surveys (CSUR), vol. 35, no. 4, pp. 399-458, 2003.

[2] J. Tao and Y. P. Tan,“Efficient clustering of face sequences with application to character-based movie browsing,＂Proc. IEEE International Conference on Image, pp.1708~1711, 2008.

[3] D. Ramanan, S. Baker, and S. Kakade,“Leveraging archival video for building face datasets,＂Proc. IEEE International Conference on Computer Vision, pp. 1-8, 2007.

[4] E. El-Khoury, C. Senac, and P. Joly, "Face-and-Clothing Based People Clustering in Video Content," Proc. International Multimedia Conference on Multimedia Information Retrieval, pp. 295-304, 2010.

[5] P. Huang, Y. Wang, and M. Shao, "A New Method for Multi-view Face Clustering in Video Sequence," Proc. IEEE International Conference on Data Mining Workshops, pp. 869-873, 2008.

[6] K. Yamamoto, O. Yamaguchi, and H. Aoki,“Fast face clustering based on shot similarity for browsing video,＂Progress in Informatics, pp. 53-62, 2010.

[7] A.L.N. Fred and A.K. Jain, “ Combining multiple clusterings using evidence accumulation,＂IEEE Transactions On Pattern Analysis And Machine Intelligence, vol. 27, no. 6, pp. b835-850, 2005.

[8] A. Strehl and J. Ghosh,“Cluster ensembles - a knowledge reuse framework for combing multiple partitions,＂J. Machine Learning Research, vol. 3, pp. 583-617, 2002.

[9] X.Z. Fern and C.E. Brodley, “ Random projection for high dimensional data clustering- a cluster ensemble approach, ＂ Proc. 20th Int’l Conf. Machine Learning(ICML), 2003.

[10] P. Hore, L. Hall, and D. Goldgof,“A cluster ensemble framework for large data sets,＂

Proc. 2006 IEEE Int’l. Conf. System, Man, and Cybernetics, pp. 3342-3347, 2006.

[11] P. Viswanath and K. Jayasurya,“A fast and efficient ensemble clustering method,＂

Proc. 2006 Int’l Conf. Pattern Recognition(ICPR), vol. 2, pp.720-723, 2006.

[12] B. Minaei-Bidgoli, A. Topchy and W. F. Punch,“Ensembles of partitions via data resampling,＂Proc. 2004 Int’l. Conf Information Technology, vol. 2, pp. 118-192, 2004.

[13] B. Fischer and J.M. Buhmann,“Bagging for path-based clustering,＂IEEE Trans.

Pattern Analysis Machine Intelligence, vol. 25^, no. 11, pp. 1411-1415, 2003.

[14] A.P. Topchy, M.H.C. Law, A.K. Jain, and A.L. Fred,“Analysis of consensus partition in cluster ensemble,＂Proc. 4th IEEE Int’l Conf. Data Mining(ICDM), pp. 225-232,

2004.

[15] H. Luo, F. Koug, and Y. Li,“Clustering mixed data based on evidence accumulation,＂

LNCS, vol. 4093, pp. 348-355, 2006.

[16] X. Wang, C. Yang, and J. Zhou,“Clustering aggregation by probability accumulation,＂

Pattern Recognition Letters, vol. 42, no. 5, pp. 668-675 , 2009.

[17] X.Z. Fern and C.E. Brodley,“Solving cluster ensemble problems by bipartite graph partitioning,＂Proc. 21th Int’l Conf. Machine Learning(ICML), ACM International Conference Proceeding Series, vol.69, pp.281-288, 2004.

[18] R.N. Dave, “ Characterization and detection of noise in clustering, ＂ Pattern Recognition Letters, vol. 12, no. 11, pp. 657-664, 1991.

[19] L. Hubert and P. Arabie,“Comparing partitions,＂Journal of Classification, vol. 2, no.

2-3, pp.193-218, 1985.

[20] K. Y. Yeung, W. L. Ruzzo,“Details of the Adjusted Rand index and clustering algorithms supplement to the paper “an empirical study on principal component analysis for clustering gene expression data”,＂vol. 17, no. 9, pp. 763-774, 2001.

[21] 蘇偉誌,“Video indexing by information of face images,＂交通大學多媒體工程研究所碩士論文, 2009.

[22] http://dvdvideosoft.com/download/FreeVideoToJPGConverter.exe [23] http://opencv.willowgarage.com/wiki/Welcome

[24] 洪詩祐,“Automatic skin detection using face information,＂交通大學多媒體工程研究所碩士論文, 2009.

在文檔中影片中人物分群方法之研究 (頁 52-56)

第五章 實驗結果

5.8 數據比較

第六章 結論與未來展望

參考文獻

第五章實驗結果

第六章結論與未來展望