於複雜背景影像中,區域特徵基礎的演算法往往因為缺乏語意(全域)特徵,例 如:頭部、腿部或軀幹輪廓等,容易受環境影響,使得誤判率增加。基於上述因 素,本研究主要概念是透過整合全域與區域資訊增加行人偵測的可靠度。我們使 用行人全身外觀輪廓作為全域特徵,並採用距離樣板比對(DT-Based Template Matching)[4]作為輪廓相似程度的衡量方法。而用來做為全域偵測器的判斷準則是 從實驗中獲得,首先以樣板比對計算訓練樣本的比對分數,統計正樣本與負樣本 的分數分布,最後決定出全域分類器之門檻值。
2.1 邊緣樣板
「行人」為呈現步行姿態之人類。在道路上行走之人形輪廓由於具有直立且 部分對稱的特性,因此能夠有效區別其他出現在道路上的物體,特別是車子、摩 托車、房子或是路樹,如圖 2.1。為了瞭解兩張影像的輪廓差異程度,尋找行人較 有代表性的外部輪廓特徵,因為 CBCL[30]資料庫是經過高度標準化行人資料庫,
我們從中挑選一定數量的行人影像,提取出對應的行人樣板,用以進行後續比對 工作。
圖 2.1、車道周邊不同的物件
以 CBCL 資料庫做為人形樣版建構之樣本,樣版產生流程如圖 2.3 所示。首先 從資料庫中選取四百張行人影像,如圖 2.2。把每張影像轉換成梯度(Gradient)影 像,再計算各自的梯度大小(Magnitude),最後將所有影像加總後平均後得到的行 人平均梯度大小影像(Average magnitude)。所建構之人形輪廓樣版,影像中亮度較
9
高之區域代表人行邊緣輪廓存在機率較高,可以區分出人類的頭肩、雙手與雙腳。
最後透過反向二值化處理,做為所產生之行人樣板(Template),如公式 2.1,當平 均梯度影像 大於門檻值時輸出 0,代表特徵點;反之則輸出 255,代表背 景。
AverageMag
I
10
old 0, if
( )
255,
AverageMag Mag
I Thresh
T I otherwise
⎧ >
= ⎨ ⎩
(2.1)圖 2.2、CBCL 資料庫
CBCL images
Gradient Magnitude Summation
Average Threshold
Template Average
Magnitude 圖 2.3、樣板產生流程
2.2 距離轉換
為估算行人樣板與行人影像之差異程度,我們引用距離轉換樣板比對的方法 [4],第一步是將二值化邊緣影像轉換為距離影像,如公式 2.2,i 為邊緣影像 Isobel
中的一點,j 是遮罩中的一點,遮罩如圖 2.4 表示,本系統使用由[5]所推導出最
接近歐幾里德距離的遮罩數值(Optimal Distance Transform) ,將遮罩數值套用 a = 1.369 與 b = 0.995 進行 DT 轉換。為了將數位圖片輸出做為說明,在本章節中範 例與圖片的遮罩數值使用 a = 1 與 b = 1(City Block Measure)進行轉換。min d 則是 代表計算特徵點與遮罩的最小距離,經過數回合的計算,二值化的輸入影像將轉 變為距離轉換影像(DT Image)。
( ) min
,( , )
Sobel
i I j mask
DT i d i j
∈ ∈
=
(2.2)+b +a +b
+a 0 +a
+b +a +b 圖 2.4、距離轉換遮罩
圖 2.5 是距離轉換流程示意圖,左上圖白色部分代表特徵點,當我們進行距離 轉換,遮罩參數設定 a = 1 與 b = 1,經過四回合的計算可得到距離轉換圖,原本 是特徵點的位置都以 0 來取代,而距離特徵點一個像素的位置則以 1 來取代,從 特徵點向外延展,距離越遠則數值越大。圖 2.6 每張影像分別代表距離轉換的各個 階段,從原始影像轉為二值化邊緣影像,再轉換為距離轉換影像。
圖 2.5、距離轉換流程
11
圖 2.6、原始影像、二值化邊緣影像、距離轉換影像
2.3 樣板比對
當建立完標準樣板,即可馬上進行樣板比對,樣板比對流程如圖 2.7,這個流 程會將測試影像經過邊緣提取與二值化處理後,轉換為距離影像,再與全身行人 樣板做比對。算式 2.3 是計算比對分數,Iorigin為待測影像,經過邊緣提取與距離轉 換後得到距離影像 I,T 是已訓練好的行人樣板影像,t 則是樣板影像中的一點,以 查表的方式取得對應位置的數值,累加後得到比對分數。
opt
( , )
I( )
t T
D T I d t
∈
= ∑
(2.3)T
Iorigin Edge I
Matching Score Mapping Summation
圖 2.7、樣板比對流程圖
以圖 2.8 為例,2.8(a)是標準樣板,2.8(b)則是待測影像,我們希望用比對分數
12
來評估兩者的差異程度,待測影像先做距離轉換如 2.8(c),再與樣板影像做比對,
Pos
Template Neg
圖 2.9、樣板比對實驗
統計結果如圖 2.10,橫軸為比對分數,每格為 100,縱軸為影像張數,行人影 像(Pos)分布以藍色線條表示,非行人影像(Neg) 分布以紅色線條表示,我們可以 觀察到兩個趨勢,行人影像大多分布在 400 到 2500 分之間,而非行人影像則是接 近單一分布(uniform distribution),沒有顯著的峰值,全域分類器的門檻值訂於兩條 線段交會處 1400 分的位置,分類標準如公式 2.4 表示,樣板比對結果小於等於門
檻值
T
global就歸類為行人;相反地,若是大於T
global則歸類為非行人。0 20 40 60 80
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 Matching score
Num of images
Pos Neg
圖 2.10、樣板比對分數分布圖
, if ( , ) 1400 GlobalResult
- ,
opt global
Human D T I T Non Human otherwise
≤ =
= ⎨ ⎧
⎩
(2.4)14