6.1 結論
近年來由於資訊科技蓬勃發展,加上數位科技產品的價格降低,各種先進的 數位監控器材日益普及,已不再是富人的專利。這些數位攝影器材使用非常方 便,且也很方便直接連接電腦做後續處理,可提供各種豐富的視訊影像資訊。然 而目前影像資訊卻尚未被充分利用,大多數數位監測應用(如:行人計數)仍採用 半人工或以全手動的方式來進行。因此,本研究提出一個以電腦視覺方法取代人 工進行行人計數的系統,以便能取代傳統的非自動化或精確度不高的行人計數系 統。
在行人計數的相關研究中,幾乎無可避免兩大問題,分別是前景區塊的擷取 以及擷取後的行人區塊追蹤問題。本研究把俯視型行人計數系統架構主要分成行 人偵測和行人計數兩個部分,行人偵測主要目的是找出影像中的行人,進行前景 區塊的擷取,而行人計數為針對的擷取後的行人區塊進行追蹤,以便計算進出場 景的人數。
行人偵測中,我們使用單一攝影機,藉由兩張連續影像來得到前景物 。此 方法避免了傳統前景擷取方法中前景區塊容易碎裂或不完整且容易受到光影影 響的區塊,導致前景偵測不準確的缺點。既然此方法較不受光影變化的影響,它 可以應用到各種不同的變化的場景,且適用於不同類型的攝影機。
在取得前景物件後,我們使用粒子濾波器來實作多個行人追蹤的部份。粒子
濾波器是一種以 Bayesian estimation model 為基礎的方法,可適用於追蹤非線性、
非高斯模型的濾波器,其特點是利用一定數量隨機樣本粒子來表示近似任意函數 的事後機率分佈,透過系統的期望值當作的估測結果。在連續影像中,單一行人 產生的前景區塊,因為前景偵測錯誤而分裂為數個行人區塊,或者是場景中有雜 訊影響時(如:戶外雨天場景),粒子濾波器皆能有較強的容錯性。
在計數方面,本研究提出了一個雙向行人計數的方法。首先利用兩條偵測線 將場景的影像分成三個區域,以定義場景的內部與外部,以及如何算進入或離開 場景。依行人追蹤的結果,判斷行人是否跨越兩條偵測線及跨越偵測線時其所位 於的場景區域,並利用行人進出狀態之間的轉換,判定何時需進行統計人數。
6.2 未來方向
在未來工作中,考慮到本系統為行人計數系統,行人才是系統偵測的焦點,
希望未來階段可以增加行人判定的工作。所謂的行人判定即是使用已經建立好的 人物模型在影像中進行比對,以判斷所追蹤的前景區塊是否為行人。另外藉由人 物模型的部份輪廓,更可以將數個行人合併在一起的區塊,判斷該區塊包含多少 個行人,以提升系統準確度。
我們可以用建立好的 3D 行人模型(圖 6.1)經由多重視角(multiple-view)(附錄
C)作 2D 投影(圖 6.2),產生行人樣版影像(圖 6.3),再利用分類演算法(如:K-mean) 找出具有代表性的行人樣板,以去除多餘的樣版,加快比對時間。當進行行人追
蹤的時候,我們使用 Chamfer distance matching 針對行人區塊的邊界(boundary) 與行人樣版的作比較,而 Chamfer distance matching 共需做兩次,一次是以行人 區塊的邊界與行人樣版的 Chamfer distance 作比較,另一次是以行人樣版的邊界 與行人區塊的 Chamfer distance 作比較,若兩次差異總和小於一定門檻值,則可 判定該行人區塊為行人(圖 6.4)。不過這邊必須注意到如果使用魚眼型攝影機必 須考慮到影像座標與場景座標之間的對應轉換才能樣版與行人影像進行比對。
圖 6.1、3D 人物模型
圖 6.2、多面體投影示意圖
圖 6.3、所得到之二維投影(a)視角一(b)視角二
圖 6.4、Chamfer distance matching 示意圖