第五章 實驗結果
5.7 θ dyn 之效能
θdyn的值從0 到 1 之間,在 4.1 節中就提到,它直接影響了選出的領導臉以 及領導臉的個數,這個參數設置的用意,是在於〝利用較少的領導臉代表整個串 列,而能使效能保持在一定的水準,運算量卻大大降低〞,以下我們以三個方面 來討論θdyn,5.7.1 是觀察θdyn與領導臉個數的關係,5.7.2 是以時間的觀點觀察
θdyn的變化,5.7.3 則是以效能的觀點觀察θdyn。
5.7.1
θ
dyn與領導臉個數在這一小節中,我們要觀察的是θdyn與領導臉個數的關係,在相異度矩陣 ( dissimilarity matrix )中,當θdyn愈大領導臉的個數就愈少,也愈接近〝one face〞
的情況,但領導臉的個數與θdyn的數值並非是嚴格正比的關係,下圖5-5 是 M1 的串列1 在不同θdyn情況下的領導臉數量,圖中當θdyn為0 時,演員串列擁有最 多的48 個領導臉,也就是〝all face〞;當θdyn為0.9 與 1 時,演員串列僅有一個
領導臉,即為〝one face〞的情況。圖 5-5 中,當θdyn下降時領導臉個數也隨之
下降,但下降的趨勢逐漸平緩,θdyn在0.4 之後領導臉個數的變化就不大,此時 我們也應當要注意,當領導臉的個數愈來愈少時,計算量也愈小,但是分群效能 是否能維持在一定水準呢?另外還有穩定性的問題,我們將在5.7.2 來討論。
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
θ
dyn1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0
圖5-5 串列對θdyn的領導臉比例曲線
5.7.2
θ
dyn與時間、效能當初在設計θdyn這個參數主要就是因為,影片會擷取許多影像,而影像的 運算也很繁瑣,因此運算量頗大,若輸入的資料是多個合併的影片時,運算量會 爆增,因此我們希望能以最簡化的運算達到不錯的效能。但若只追求運算快速,
而不顧效能也是本末倒置,因此速度以及效能之間我們想取得一個平衡點,而效
能是我們優先考慮的因素,圖5-6 是 M1~M6 對θdyn的效能曲線,圖中的六條效 能曲線的趨勢並非很一致,因此我們無法下很斬斬釘截鐵的結論,只能發現當
θdyn愈大時,曲線變動範圍很大的機率就愈大,換句話說,愈大的θdyn,穩定性 就比較不足,我們愈無法掌控效能的變化,圖5-5 中是以θdyn為0.4 為界線θdyn比 0.4 大,變動幅度較大的趨勢就慢慢浮現,而這情況又以單一影片的 M1~M3 最 為明顯,因為在M1~M3 每個資料中串列彼此的平均相似度比 M4~M6 高,一旦 我們調整θdyn的數值,直接影響領導臉的個數,計算相似度也不再如此細膩,因 此好壞落差較大,但反觀M4~M6,由於串列間的平均相似沒那麼高,改變領導 臉個數的落差就沒M1~M3 大,因此顯現比較平穩的曲線變化。
0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
θ
dynARI
圖5-6 M1~M6 對θdyn的效能曲線
擁有好的效能之後,再來是考慮運算量的問題,由於輸入的資料未知,有可
能是單一影片資料、或許是漫長的影片資料,又或者是多個影片合併的資料,不 論怎樣,它們的運算量都不容小覷,因為這是讓使用者耗費相當大時間成本的關 鍵。4.1 節提到,改變θdyn數值直接影響領導臉的個數,也間接影響運算量,因 此我們希望以效能為第一考量點之後,減少領導臉的個數以達到〝利用些微的效 能換取更多的時間成本〞為目標,實驗中以執行k-medoid 的時間最為漫長,圖 5-7 是使用 M1 影片,調整θdyn的數值改變串列中領導臉的個數,並執行隨機100 次的k-medoid 的平均耗費時間比值。
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
θ
dyn1.0 0.95 0.9 0.85 0.8 0.75 0.7
ARI
圖5-7 在 M1 底下θdyn的效耗費時間比值
由於k-medoid 初始化 ( initialization ) 的條件不同,因此曲線並為很平滑,
但仍能看出θdyn對於時間的影響,θdyn為1 造成「one face」的情形,因此有效 地降低時間成本。把圖5-6 與 5-7 相互對照下,θdyn在0~0.3 之間的效能穩定性
較高,而較低的θdyn值可以降低時間成本,因此我們會建議使用θdyn時可以選擇 較接近0.3 的數值,如此可以取得效能與時間的平衡。