第五章 實驗與結果比較 實驗與結果比較 實驗與結果比較 實驗與結果比較
5.2 訓練與測試影像資料庫 訓練與測試影像資料庫 訓練與測試影像資料庫 訓練與測試影像資料庫
5.2.1 靜態資料庫 靜態資料庫 靜態資料庫 靜態資料庫
我們的實驗選用 CBCL 與 CVC 資料庫,如表 5.2 表示。CBCL 資料庫的行人影像 姿態較為單純,只有正面與背面姿態,並且沒有提供非行人樣本,因此我們使用 INIRA 資料庫的非人形影像做為負樣本;CVC 資料庫的正樣本集提供了較多的側面站姿的行 人影像,並且每張圖片有對應的水平翻轉圖,以及一張上下位移圖與翻轉的位移圖,負 樣本集提供 640x480 解析度的 2048 張無人的街道背景圖。
而我們手動切割 CVC 資料庫的負樣本影像,每一張無人街道背景圖皆隨機選取兩 個不同的位置切割出 2 張負樣本,共 4096 張。
表 5.2 靜態影像資料庫
5.2.2 動態資料庫 動態資料庫 動態資料庫 動態資料庫
我們選用 Caviar、2007 AVSS 及我們自己拍攝的影片進行動態資料庫的實驗。由 於動態資料庫皆沒有提供訓練樣本,所以我們由該資料庫場景其他影片片段並找出不同 於測試影片的人物自行切割正負樣本。訓練及測試樣本數量相關資訊如表 5.3 所示。
59
表 5.3 動態影像資料庫相關資訊
Caviar 資料庫的測試場景選於百貨公司的走道,場景十分明亮,但是背景顏色容 易與經過的行人衣著顏色相混,部份背景區域偏向複雜,行人也會因為角度的關係而重 疊造成遮蔽。其場景畫面如圖 5-1。
圖 5-1 Caviar 資料庫測試場景
2007 AVSS 資料庫我們則選擇國外捷運站的監視器畫面影片做為測試場景,部份 背景亮度較昏暗且遮蔽物較多,背景物件也會因為捷運車輛出入站而造成變化。其場景 畫面如圖 5-2。
60
圖 5-2 2007 AVSS 資料庫測試場景
我們的動態資料庫則是實驗室外的學院走廊,光影變化較大,擁有較大範圍的複 雜背景,場景整體亮度偏暗。測試場景畫面如圖 5-3 所示。
圖 5-3 自行拍攝的資料庫測試場景
Caviar 資料庫共有 26 個影片,每一段影片長度由 15 秒至 1 分 50 秒不等,影片的 差異為出現的行人不同,並依照各個行人的行為將影片分段及命名。我們則是以 WalkByShop1cor.mpg 做為測試影片,其他影像資訊及訓練影像切割如表 5.4 所示。
AVSS 的行人影像資料庫則是分為三部影片,分別為 AVSS AB Easy、AVSS AB Medium 及 AVSS AB Hard,每一部影片約為 3 分鐘左右,AB 則是 Abandoned Baggage 的縮寫,主要用做於偵測遺棄行李行為辨識的影像資料庫。三部影片擁有辨識難度分級
61
的屬性,AVSS AB Easy 畫面中行人相互遮蔽少、能夠在廣闊的空間行走、除了行走姿 勢外其他姿勢較少且人形外觀完整,AVSS AB Medium 影片畫面中人數較多,行人相互 情形較為多數且因行李放置於地上而造成的障礙物遮蔽人行情形較為嚴重。AVSS AB Hard 影片則是擁有最多人數的影片,畫面中人形相互遮蔽情形非常嚴重且也有多種人 形姿勢。我們的測試影片則是以 AVSS AB Easy 畫面為主再進一步分為小段,訓練影像 則是由其餘兩部影片切割。
我們自己拍攝的資料庫是經由走廊攝影機紀錄畫面所擷取出來,測試影片分為兩 部,兩部影片分別為不同亮度的背景及不同的行人數量。AVSS 與我們的資料庫其詳細 資訊列於表 5.5 中。
62
表 5.4 Caviar 影片資料庫詳細資訊
63
表 5.5 AVSS 及我們的影片資料庫詳細資訊