第二章 文獻探討
2.1 物體偵測的方法
現今,電腦視覺研究已有許多成果,在偵測、追蹤和辨識方面已有長足的發 展,這些研究成果可以應用在許多地方,例如在監控系統、汽車駕駛安全、虛擬 實境等,我們在此分為靜態攝影機以及動態攝影機兩種情況。
2.1.1 動態攝影機
非靜態攝影機在不用建立背景模型的情況下,Wren 等人提出一套針對人的 即時追蹤系統 Pfinder [5],Pfinder 使用色彩和外型的多重統計模型來分離前景物 和背景。並能於大範圍的區域持續追蹤人的頭部和軀體。以不考慮行人重疊的問 題,目前也有人使用 HOG 加上 SVM 進行行人的偵測[6],而行人偵測是一項很 困難的研究,因此加上機器學習(machine learning)的機制加強準確率。
非靜態攝影機背景模型也是目前監控系統的一個研究方向,把受監控的完整 環境建構成一大全景背景模型,全景影像取得方法主要有兩種:1.使用廣角的攝 影機,不過由於價錢昂貴,在遠離焦點的部分影像失真情況嚴重,因此通常比較 少被使用。2.使用普通攝影機擷取的影像,經過處理建立全景影像,如此一來,
5
解析度高而且不會發生失真的狀況,這樣的特性可以滿足影像處理的各個應用,
S. E. Chen et al. [13]架設固定位置的攝影機,以不同的側擺(panning)角度拍攝,利 用軟體的方法比對建立 360 度的全景影像。另外 Y. Ren et al. [14]使用空間上的 高斯分佈(spatial distribution of Gaussian)處理攝影機受到風吹的微小震動。
2.1.2 靜態攝影機 O(L log L);B. Shoushtarian et al. [8]比較了三種非遞迴式建立背景影像的方法,分 別為非前景像素更新法(selective update using non-foreground pixels)、時間軸上的 平均值法(selective update using temporal averaging)與時間軸上的中間值法
(selective update using temporal median),其中非前景像素更新法(selective update using non-foreground pixels)就是前景偵測後得到的背景像素更新為新的背景 像素,其餘前景像素部分則用之前的背景像素替代,此法在戶外環境效果會比較 不理想,因為戶外光線變化劇烈時,此更新法會使得背景影像無法隨著光線變化 更新成符合現狀的背景影像;時間軸上的平均值法(selective update using temporal averaging)取滑動視窗中的像素值的平均值,以此值作為新的背景像素值,
6 正確的背景像素以更新目前的參數,具代表性的方法為 Kalman Filter,此方法是 一個追蹤移動物體的遞迴式方法,目前有許多以 Kalman Filter 為中心建立背景模 型的方法,C. Wren et al. [9]就是其中很經典的例子。
現在要說明的高斯混合模型(Mixture of Gaussians Model,GMM)也是遞迴的 方法,GMM 不同於 Kalman Filter 地方在於 GMM 可以同時追蹤多個高斯分布, 高的估測 (expected sufficient statistics),可以建立一個穩固的基礎,到達指定的
7
時間後,使用較不花運算時間的估測方式,如此一來可以有效改善[11]的運算時 間與增加背景參數的準確度。