Similarity Comparison [univ_07-coates]
4.4 畫面分類結果
4.5.4 時間軸配對結果
在圖 4.3我們展示 coates 片段的配對結果在時間軸與投影片編號的關係,圖中
綠色線段是實際錄影畫面依序對應相對的投影片編號,紅色線段則是本研究的方法找 出的結果,紫色線段是本研究對於每個辨識結果的一致性 (Consistence)。附錄最後 附上另外兩個資料片段的時間軸配對結果於圖 A.8、圖 A.9,及按時間順序得到的縮 略圖 A.5供參考。
4.6 時間及儲存空間分析
在時間部分我們將最費時的特徵點截取及匹配兩個階段的時間做統計於圖 4.4, 並且估計如果不採用前處理需要額外花費的時間,由於匹配過程的複雜度大大影響了 處理時間,因此執行時間大約佔了全部的 89%。而空間的部分如圖 4.5,因為實驗過 程需要不斷讀取特徵、畫面等資料,因此我們需要了解記憶體的使用情形,從圖中可 以發現特徵佔了近六成的資料量,且即使錄影檔案不大 (chaves),但是仍然可以產生
近 1.3GB 的特徵資料,從這裡也可以說明前處理的重要性,如果沒有減少前處理的
資料量,這裡可能需要更多不必要的記憶體空間。
20406080100120140160
Ca nd ida te ID
Ar ea , to p5 0, me an re su lt ( Co ate s)
v_atm_ansgndv_atm_conf 0.00.20.40.60.81.0Con fide nce
20406080100120140160
Ca nd ida te ID
Ar ea , to p5 0, me an , ra nsa c, an d i nv erse re su lt ( Co ate s)
v_atmri_ansgndv_atmri_conf 0.00.20.40.60.81.0Con fide nce
Co nfi de nc e V S R ec og nit ion re su lts
圖4.3:投影片與錄影畫面在時間軸的配對結果(coates片段),紅色三角形為辨識結果,綠色實線為實際值,藍色虛線為 辨識結果的一致性。上下圖為分別使用不同特徵辨識得到的結果。以這個片段來看採用「區域比值」、「匹配點平均」、「前 50相似匹配點平均」有較好的辨識結果。10.4%
Features(00:00:40) 89.6%
Matches(00:05:44)
chaves (00:06:24)
Features(00:02:34)9.3%
90.7%
Matches(00:24:56)
coates (00:27:30)
14.5%
Features(00:03:11) 85.5%
Matches(00:18:41)
rozenblit (00:21:52)
10.4%
All_Features(01:16:47) 89.6%
All_Matching(10:58:08)
chaves (12:14:55)
All_Features(04:48:27)9.3%
90.7%
All_Matching(46:42:01)
coates (51:30:28)
14.5%
All_Features(10:35:15) 85.5%
All_Matching(62:17:34)
rozenblit (72:52:49)
圖 4.4: 為和其他工作比較,我們僅列出類比方法所需時間 (單位為 -時:分:秒),
chaves (1771)
0.0%
Features(1282) 57.9%
Matches(97) 4.4%0.0%7.7%1.8% Preprocess(170)Slides(40)
Video(627) 28.3%
coates (2216)
Classifier(2)
rozenblit (2414)
圖 4.5: 三個資料片段之儲存空間分析 (數量單位為 MB),圖中畫面特徵 (Fea-tures)、輸入影片 (Video)、前處理的畫面資料 (Preprocess) 佔了大部分的儲存空 間使用量
第五章 結論
本研究提出投影片匹配錄影畫面的方法是參考 [20, 24, 36] 的簡化實作,主要在 候選畫面的取得及分類「無投影片」畫面辨識的方法不同,以單應性映射的面積比率 當作門檻值過濾代替原本是用 SVM 做背景分類的方法不但大幅簡化計算過程,且仍 保有 100% 的靈敏度;此外,本研究簡化「有投影片」的辨識方法,採用較簡單的匹 配距離等單應性投影特徵投票決定取代需 HMM 訓練機率模型的計算量,同時將準 確度維持在一定水準;但在一般應用只要找切換時間點的場合中,可以找出 96% 的 正確投影片畫面切換點。
但本研究仍有需要改善之處,為了簡化流程,降低計算量,我們犧牲了投影片前 後差異較小的情形,也就是說,如果投影片是分段出現,或者內容極為相近,就容易 產生誤判;如果要基於本研究來改善這個問題,又希望能維持架構的簡化,比較好的 方式可能從前後出現的投影片機率來改善結果,或者是想辦法提升配對結果的相似度 差異,並且加入局部配對的判斷。