物體偵測的方法

第二章文獻探討

2.1 物體偵測的方法

現今，電腦視覺研究已有許多成果，在偵測、追蹤和辨識方面已有長足的發展，這些研究成果可以應用在許多地方，例如在監控系統、汽車駕駛安全、虛擬實境等，我們在此分為靜態攝影機以及動態攝影機兩種情況。

2.1.1 動態攝影機

非靜態攝影機在不用建立背景模型的情況下，Wren 等人提出一套針對人的即時追蹤系統 Pfinder [5]，Pfinder 使用色彩和外型的多重統計模型來分離前景物和背景。並能於大範圍的區域持續追蹤人的頭部和軀體。以不考慮行人重疊的問題，目前也有人使用 HOG 加上 SVM 進行行人的偵測[6]，而行人偵測是一項很困難的研究，因此加上機器學習(machine learning)的機制加強準確率。

非靜態攝影機背景模型也是目前監控系統的一個研究方向，把受監控的完整環境建構成一大全景背景模型，全景影像取得方法主要有兩種：1.使用廣角的攝影機，不過由於價錢昂貴，在遠離焦點的部分影像失真情況嚴重，因此通常比較少被使用。2.使用普通攝影機擷取的影像，經過處理建立全景影像，如此一來，

解析度高而且不會發生失真的狀況，這樣的特性可以滿足影像處理的各個應用，

S. E. Chen et al. [13]架設固定位置的攝影機，以不同的側擺(panning)角度拍攝，利用軟體的方法比對建立 360 度的全景影像。另外 Y. Ren et al. [14]使用空間上的高斯分佈(spatial distribution of Gaussian)處理攝影機受到風吹的微小震動。

2.1.2 靜態攝影機 O(L log L)；B. Shoushtarian et al. [8]比較了三種非遞迴式建立背景影像的方法，分別為非前景像素更新法(selective update using non-foreground pixels)、時間軸上的平均值法(selective update using temporal averaging)與時間軸上的中間值法

(selective update using temporal median)，其中非前景像素更新法(selective update using non-foreground pixels)就是前景偵測後得到的背景像素更新為新的背景像素，其餘前景像素部分則用之前的背景像素替代，此法在戶外環境效果會比較不理想，因為戶外光線變化劇烈時，此更新法會使得背景影像無法隨著光線變化更新成符合現狀的背景影像；時間軸上的平均值法(selective update using temporal averaging)取滑動視窗中的像素值的平均值，以此值作為新的背景像素值，

6 正確的背景像素以更新目前的參數，具代表性的方法為 Kalman Filter，此方法是一個追蹤移動物體的遞迴式方法，目前有許多以 Kalman Filter 為中心建立背景模型的方法，C. Wren et al. [9]就是其中很經典的例子。

現在要說明的高斯混合模型(Mixture of Gaussians Model，GMM)也是遞迴的方法，GMM 不同於 Kalman Filter 地方在於 GMM 可以同時追蹤多個高斯分布，高的估測 (expected sufficient statistics)，可以建立一個穩固的基礎，到達指定的

時間後，使用較不花運算時間的估測方式，如此一來可以有效改善[11]的運算時間與增加背景參數的準確度。

在文檔中基於高斯混合模型之課堂舉手辨識研究 (頁 11-14)

第二章 文獻探討

2.1 物體偵測的方法

第二章文獻探討