第五章 實驗結果
5.8 數據比較
我們把[21]的數據與我們實驗的數據以 M1 的影片作比較,依照上面各個參 數值數的趨勢,表5-4 為本實驗與[21]的效能以 ARI 的數據作比較,我們固定領 導臉的選擇方式θdyn為0.2、θ 的範圍是 2~160、rg θw為0.1、θagg為強凝聚法、θrat 是 1.0,每個群數 C 底下共有兩欄,左邊欄位是我們實驗中仿效[21]文中所敘述 的條件產生的效能,右邊欄位為本實驗的實驗結果,我們把依照不同的h 與σ的 組合比較[21]與本實驗的實驗數據,h 與σ的特性是,h 愈大則身體的權重值就 愈大,而σ愈大則身體群權重值也愈大但上升的趨勢變小。
表5-4 與[21]數據比較表
M1 C C = 7 C = 10 C = 20 C = 30 h σ Su’s Wei’s Su’s Wei’s Su’s Wei’s Su’s Wei’s
h = 0.2
σ= 1500 0.566 0.558 0.448 0.482 0.466 0.521 0.426 0.451 σ= 3000 0.447 0.544 0.427 0.572 0.502 0.527 0.452 0.454 σ= 6500 0.375 0.485 0.465 0.412 0.485 0.455 0.414 0.42
h = 0.4
σ= 1500 0.463 0.507 0.419 0.458 0.452 0.462 0.339 0.391 σ= 3000 0.408 0.405 0.412 0.416 0.458 0.402 0.359 0.361 σ= 6500 0.255 0.447 0.358 0.447 0.375 0.382 0.346 0.378
h = 0.6
σ= 1500 0.306 0.412 0.414 0.383 0.452 0.425 0.333 0.344 σ= 3000 0.398 0.358 0.406 0.323 0.422 0.387 0.38 0.353 σ= 6500 0.262 0.316 0.331 0.316 0.357 0.388 0.319 0.359
首先,針對本實驗的效能而言,我們觀察h 對於效能的變化,不論是固定 σ 或是群數C,我們發現當 h 愈大則效能就降低,這是可理解的,因為 h 上升將會 提升身體的權重值,反倒抑制臉部影像對於結果的貢獻,而在人物分群中,最重 要的資訊就是人臉特徵,其他的資訊不論是身體影像、場景資訊、相似度或是重 疊資訊,都只是輔助分群的工具,因此三個h 值中以 0.2 表現最好的效能,這是 可以理解的,而h 也並非選擇小的就是好,因為如果沒有身體資訊那一切都只使 用臉部資訊來分群,又將回到人物分群的起始點,因此適當地使用身體資訊確實 能幫助效能提升;同樣地,表格中,σ 愈大則效能愈低,這也是同樣的道理,只 是數據的改變量沒有 h 那麼大,因此這也是為什麼我們實驗一開始就設定 h 為 0.2、σ 為 1500 的原因,而群數 C 對於效能的趨勢,就如同 5.3 節提到的,因為 不同的群數對於ARI 的計算影響很大,因此表中也以〝較接近實際群數 C 條件 擁有較高的效能〞的趨勢。
接下來,我們針對本實驗仿造[21]作法所呈現的效能,與加入叢集整合觀念 的人物分群結果相比較,表格中紅色粗體字為本實驗優於[21]的情形,仔細觀察 會發現,當 h 比較小時,σ 在小值的部分明顯優於[21],且相差較大;h 比較大 時,儘管與[21]差距不大,但就是無法提升效能,這是因為兩個實驗的差異就在 於,本實驗中加入叢集整合的相似度矩陣,而由於我們認為臉部向量是人物分群 最重要的向量,因此我們以串列的領導臉向量作為產生叢集相似度矩陣的來源,
無非是想再次藉由臉部向量得到更可靠的資訊,因此在小 h 與小 σ 能有很好的 表現,全是因為在人物相似度矩陣中,身體的權重值偏大,再加上以身體影像為 主要特徵的叢集整合相似度,兩者結合更能充分表達分群的特徵,達到提升效能 的目的。
第六章 結論與未來展望
本文使用了美國影集作為人物分群的實驗對象,它的場景轉換、背景雜亂、
變動的人物特徵以及衣服資訊等特性,使得人物分群困難度增加,因此我們不僅 利用臉部影像,也納入身體影像輔助分群搭配串列時間軸產生的權重,以及分鏡 資訊,產生人物相似度矩陣S ,另外加入叢集整合的概念作為輔助分群的資訊,P 在這麼雜亂的環境中,ARI 的最好效果可以達到六成,這是由於凝聚法所使用的 相似度矩陣S,不只包含演員串列特性的人物相似度矩陣,還增加了叢集整合相 似度矩陣S ,確實有助於提升分群效能。另外,針對叢集整合的參數使用,我E 們會建議θdyn挑選接近0.3 的數值可取得效能與時間的平衡點,θ 則選較大的rg 隨機範圍,θw可選0.1~0.3 之間作為輔助分群的資訊,θagg選擇兩階段強凝聚法,
θrat要視資料雜亂性而定,過於雜亂可往低數值挑選起,但是盡量不要低於0.5。
實驗中的效能符合我們所期待,而變數值也透漏更多思考的方向,在未來的 時間裡,系統有些地方仍可以作加強,首先,我們知道從數據得知,加入S 有E 助於提升效能,但是其影響結果的能力仍小於S ,因此若能增加P S 的可靠度,E 使得最佳效能的W 上升,勢必能提升最佳效能;第二,系統中嘗試許多變數的E 數值,得到效能的某些規律以及結論,而我們可以更深入的探討每一個變數對於 結果的穩定性以及敏感度,這樣將有助於系統評估變數值的好壞以及使用或取代;
第三,本文中除了根據文獻得到的觀點,也從數據的規律中得到結論,因此在未 來若能發展一套讓系統對於影片本身的特性,自動產生或推測對於結果最有利的 參數值,輔助系統找出最正確的分群結果,這樣有助於減少耗費在找尋規律性的 時間成本;第四,在實驗中我們只知道當最終凝聚的群數接近真正演員個數時,
效能會提升,卻未對影片中人物個數產生預測,因此在未來的研究工作上可增加 系統在群數的推測。最後,承如2.2 節提到的,影像的運算是很繁複的,如果辨 識影像的系統能夠克服無法使用在高維度以及大型資料集的缺陷,那麼辨識系統 將會被更廣泛地運用在日常生活中。
參考文獻
[1] W. Y. Zhao, R. Chellappa, P. J. Phillips, and A. Rosenfeld,“Face recognition: a literature survey,"ACM Computing Surveys (CSUR), vol. 35, no. 4, pp. 399-458, 2003.
[2] J. Tao and Y. P. Tan,“Efficient clustering of face sequences with application to character-based movie browsing,"Proc. IEEE International Conference on Image, pp.1708~1711, 2008.
[3] D. Ramanan, S. Baker, and S. Kakade,“Leveraging archival video for building face datasets,"Proc. IEEE International Conference on Computer Vision, pp. 1-8, 2007.
[4] E. El-Khoury, C. Senac, and P. Joly, "Face-and-Clothing Based People Clustering in Video Content," Proc. International Multimedia Conference on Multimedia Information Retrieval, pp. 295-304, 2010.
[5] P. Huang, Y. Wang, and M. Shao, "A New Method for Multi-view Face Clustering in Video Sequence," Proc. IEEE International Conference on Data Mining Workshops, pp. 869-873, 2008.
[6] K. Yamamoto, O. Yamaguchi, and H. Aoki,“Fast face clustering based on shot similarity for browsing video,"Progress in Informatics, pp. 53-62, 2010.
[7] A.L.N. Fred and A.K. Jain, “ Combining multiple clusterings using evidence accumulation,"IEEE Transactions On Pattern Analysis And Machine Intelligence, vol. 27, no. 6, pp. b835-850, 2005.
[8] A. Strehl and J. Ghosh,“Cluster ensembles - a knowledge reuse framework for combing multiple partitions,"J. Machine Learning Research, vol. 3, pp. 583-617, 2002.
[9] X.Z. Fern and C.E. Brodley, “ Random projection for high dimensional data clustering- a cluster ensemble approach, " Proc. 20th Int’l Conf. Machine Learning(ICML), 2003.
[10] P. Hore, L. Hall, and D. Goldgof,“A cluster ensemble framework for large data sets,"
Proc. 2006 IEEE Int’l. Conf. System, Man, and Cybernetics, pp. 3342-3347, 2006.
[11] P. Viswanath and K. Jayasurya,“A fast and efficient ensemble clustering method,"
Proc. 2006 Int’l Conf. Pattern Recognition(ICPR), vol. 2, pp.720-723, 2006.
[12] B. Minaei-Bidgoli, A. Topchy and W. F. Punch,“Ensembles of partitions via data resampling,"Proc. 2004 Int’l. Conf Information Technology, vol. 2, pp. 118-192, 2004.
[13] B. Fischer and J.M. Buhmann,“Bagging for path-based clustering,"IEEE Trans.
Pattern Analysis Machine Intelligence, vol. 25, no. 11, pp. 1411-1415, 2003.
[14] A.P. Topchy, M.H.C. Law, A.K. Jain, and A.L. Fred,“Analysis of consensus partition in cluster ensemble,"Proc. 4th IEEE Int’l Conf. Data Mining(ICDM), pp. 225-232,
2004.
[15] H. Luo, F. Koug, and Y. Li,“Clustering mixed data based on evidence accumulation,"
LNCS, vol. 4093, pp. 348-355, 2006.
[16] X. Wang, C. Yang, and J. Zhou,“Clustering aggregation by probability accumulation,"
Pattern Recognition Letters, vol. 42, no. 5, pp. 668-675 , 2009.
[17] X.Z. Fern and C.E. Brodley,“Solving cluster ensemble problems by bipartite graph partitioning,"Proc. 21th Int’l Conf. Machine Learning(ICML), ACM International Conference Proceeding Series, vol.69, pp.281-288, 2004.
[18] R.N. Dave, “ Characterization and detection of noise in clustering, " Pattern Recognition Letters, vol. 12, no. 11, pp. 657-664, 1991.
[19] L. Hubert and P. Arabie,“Comparing partitions,"Journal of Classification, vol. 2, no.
2-3, pp.193-218, 1985.
[20] K. Y. Yeung, W. L. Ruzzo,“Details of the Adjusted Rand index and clustering algorithms supplement to the paper “an empirical study on principal component analysis for clustering gene expression data”,"vol. 17, no. 9, pp. 763-774, 2001.
[21] 蘇偉誌,“Video indexing by information of face images,"交通大學多媒體工程研 究所碩士論文, 2009.
[22] http://dvdvideosoft.com/download/FreeVideoToJPGConverter.exe [23] http://opencv.willowgarage.com/wiki/Welcome
[24] 洪詩祐,“Automatic skin detection using face information,"交通大學多媒體工程 研究所碩士論文, 2009.