動態攝影機下的前景背景分割

(1)

國

立

交

通

大

學

資訊科學與工程研究所

碩

士

論

文

動態攝影機下的前景背景分割

Separation of Foreground and Background for Dynamic

Cameras

研究生：邱永昌

指導教授：莊仁輝教授

(2)

Separation of Foreground and Background for Dynamic Cameras

研究生：邱永昌 Student：Yung-Chang Chiu

指導教授：莊仁輝 Advisor：Jen-Hui Chuang

國立交通大學

資訊科學與工程研究所

碩士論文

A Thesis

Submitted to Institute of Computer Science and Engineering College of Computer Science

National Chiao Tung University in partial Fulfillment of the Requirements

for the Degree of Master

in

Computer Science June 2009

Hsinchu, Taiwan, Republic of China

(3)

I

動態攝影機下之前景背景分割

學生：邱永昌指導教授：莊仁輝教授

國立交通大學

資訊科學與工程研究所

摘要

在本篇論文中，我們提出一個方法，能在動態式攝影機拍攝影像中偵測前景物體。本方法一開始會需要一張或數張單純只有背景物的影像以建立背景高斯混合模型，之後再利用此高斯混合模型所提供的背景影像建立以顏色為基礎的像素群組、以邊線（edge）所切割出的區塊以及用角點偵測器所獲得之角點。當有新進的影像須要做前景物偵測時，以同樣方式對該新進影像建立對應的群組、區塊以及角點，接著藉由配對上述三種背景影像與新進影像的對應特徵，便可以估算兩張影像間的移動向量。接著根據此移動向量，將背景高斯混合模型移動到正確的位置，意即我們對齊背景高斯混合模型與新進影像，然後才進行前景背景的分割，之後再進一步地消除雜訊以及攝影機些微旋轉的影響，以得到最後的前背景分割結果。從實驗結果中可以看到，在背景景深差異不是太大的前提下，即使兩張影像間的移動量並不是十分的小，我們的方法仍可以成功地切割出前景物。

(4)

II

Separation of Foreground and Background for Dynamic Cameras Student：Yung-Chang Chiu Advisor：Jen-Hui Chuang

Institutes of Computer Science and Engineering National Chiao Tung University

ABSTRACT

In this thesis, we propose an algorithm to detect foreground objects in an image sequence obtained with dynamic cameras. The algorithm needs one or several initial images containing pure background environment to establish its Gaussian mixture model. Then, we establish color-based pixel clusters, edge-secluded image blocks, and corners of image regions from the background image supported by such a Gaussian mixture model. In order to detect moving objects inside an upcoming input image, the above three types of image features are extracted. By matching these features between the background image and the input image, the motion vector between the background image and the input image can be estimated. Such a process corresponds to an alignment between the Gaussian mixture model and the input image, and the moving objects can be detected using aligned Gaussian mixture model. After removing some noise and partly eliminating the effect due to small camera rotation, the final foreground separation result can be obtained. According to the experiment results, even when the displacement between two consecutive images is not very small, the proposed algorithm can still detect moving objects if the background has a small range of depth.

(5)

III

致謝

本篇論文得以完成，中間經歷了許多的困難，從問題的發現到解決、器材的選擇、演算法的測試、場地的設定以及論文內容的撰寫與修正，深深地讓我體會到原來做研究真的要投資許多的時間與勞力。但是，從研究的過程中也讓我獲益良多，另外，我衷心地感謝我的指導教授莊仁輝博士，他對電腦視覺領域精闢的見解與廣博的見識往往是我遇到瓶頸時候最大的幫助，尤其是他對研究的熱忱與認真的態度更是讓我印象深刻，也感謝我的口試委員王聖智教授、顏嗣鈞教授與雷欽隆教授在口試時給我寶貴的意見，讓我的論文能夠更加地完善。同時我也要感謝實驗室博士班學長林泓宏與羅國華對我熱心的指導，讓我在研究中遇到瓶頸的時候有了新的方向。另外，我也要感謝尚一、維辰、宣良、世旻、聖中以及邦展，讓我在研究所的生涯中得到的不只是學術上的知識，還有彼此之間的鼓勵以及幫助，讓我了解到友情的可貴以及朋友的重要。最後我要感謝我的家人，因為有他們對我的支持，才能讓我沒有後顧之憂地全力攻讀碩士學位，感謝所有曾經幫助過我的人。

(6)

IV

目錄

摘要…...I ABSTRACT…...II 致謝…...III 目錄 …...IV 圖目錄…...V 表目錄…...VI 一、緒論...1 1.1 研究動機...1 1.2 相關研究...4 1.3 系統流程...10 1.4 各章簡介...12 二、建立用於影像對齊之重建的背景影像...13 2.1 高斯混合模型...13 2.2 建立重建的背景影像...16 三、三種可用於影像對齊之影像特徵擷取...18 3.1 以顏色為基礎的群組...18 3.2 用邊線所切割出的區塊...22

3.3 Harris Corner Detector與角點配對...24

四、影像對齊與前景背景分割...30 4.1 尋找影像間之候選移動量...30 4.2 找出最佳移動量...33 4.3 影像對齊與前景背景分割...36 4.4 新進與移出的背景像素之處理...38 五、實驗結果與討論...40 六、結論與未來展望...49 參考文獻...51

(7)

V

圖目錄

圖1.1 本論文之想法示意圖。...3 圖1.2 背景移動超過兩個像素對文獻[1]的影響。...6 圖1.3 本論文所提出的動態攝影機下前景背景分割法的流程圖。...11 圖2.1 一個高斯模型的例子。...14 圖2.2 GMM提供的背景影像。...17 圖3.1 群組的結果。...21 圖3.2 群組模型顏色值有無更新對群組模型結果的影響。...21

圖3.3 sobel edge detector。...22

圖3.4 用邊線所切割出的區塊的結果。...23 圖3.5 群組可以成功地切出區域但區塊卻不行的例子。...24 圖3.6 不同的R值所得到的角點偵測結果。...27 圖3.7 消除角點群聚現象的結果。...28 圖4.1 差異值與總數值的計算範圍。...34 圖4.2 不準確的移動量對差異值和總數的影響。...35 圖4.3 有無濾除雜訊的結果。...37 圖4.4 有無消除攝影機旋轉影響的結果。...37 圖4.5 有無強制設定背景，對新進影像與背景影像的同步的影響。...38 圖5.1 模擬影像的測試結果。...40 圖5.2 出錯後又回復正常的過程。...41 圖5.3 靜態式攝影機下的實驗結果。...42 圖5.4 動態式攝影機下的實驗結果。...43 圖5.5 動態式攝影機下的第二個實驗結果。...44 圖5.6 動態式攝影機下的第三個實驗結果。...45

(8)

VI

表目錄

表1 本論文所引用的相關文獻與本論文之間的優缺點比較。...10 表2 群組、區塊以及角點的效率比較。...48 表3 群組、區塊以及角點的穩定性比較。...48

(9)

1

一、緒論

1.1 研究動機 在電腦視覺的領域中，為了達到減少計算量的目的，許多的方法希望能先在影像中找出需要做進一步處理的區域，再作接下來的處理。例如在安全監控相關應用下的監視系統，就需要做人體姿態的辨識，以判斷監視場景中存在的人物是否有可疑的行為。但是企圖在整張影像中作人體姿態辨識容易有很高的false alarm，更會大大地增加所需的計算時間。因此如果能事先提供一個精準的方法，過濾掉與前景物（例如人體）不相關的背景區域，僅僅留下前景物所在的像素，讓整個辨識的方法只需要專注在切割出來的前景物，而非連背景環境也一起加入考慮，如此便能為接下來的辨識過程省去極為可觀的時間。對於靜態的攝影機，現今之高斯混合模型已經能夠有效率地處理前景背景分割的問題，但前提是攝影機必須要是靜態的，如此才能夠正確地切割出前景物，即使攝影機只稍微移動了一段很短的距離，也足以造成嚴重的錯誤。由於這個條件大大地限制了整個前景背景分割的實用性，因此我們希望發展一個能被應用於動態式攝影機的前景背景分割方法。此方法之一種可能的應用是指定物體的追蹤，而且追蹤的範圍非常大，超過一台靜態式攝影機可以拍攝的範圍，因此追蹤的工具由靜態式攝影機轉變成動態式攝影機，甚至是裝設在自動車上的攝影機。在這種應用下，一個常見的問題是被追蹤物體本身的位置在兩張連續的影像中有可能差非常多，有些假設被追蹤物體在連續影像中不可移動過多的方法，例如[1]，自然就無法處理這樣的問題。另有一種可行的方法為在影像中找出與被追蹤物體具有相似特徵的區塊，這些特徵可能是顏色或是形狀等資訊，再進一步地判斷該區塊是被追蹤物的可能性有多高，或是特徵有多相似，最後再找出一個最可能或是最相似的區塊，將其當成被追蹤的物體。這樣的追蹤法，例如[2]，必須要在

(10)

2 整張影像中尋找特徵點，才有辦法做進一步的判斷，但是尋找特徵點這一步必然會花費非常多的時間，且接下來的特徵點配對一樣是非常花費時間的步驟，因為其特徵點來自於整張影像。所以針對這種問題，最好能夠事先提供一個有效的動態式攝影機下的前景背景分割法，先過濾出前景物出現的區域，讓追蹤的方法需要檢視的可能特徵點存在區域減到最少，以增進整體追蹤方法的效率。有鑑於以上的需求，本論文希望藉由維護一張純粹只有背景環境的背景影像（在本論文中稱此背景影像為重建的背景影像，且此重建的背景影像由背景高斯混合模型提供），之後當有新進影像要做前景背景分割時，先找出新進影像與重建的背景影像之間的移動向量，之後利用此移動向量將背景高斯混合模型對齊新進影像，再進一步地找出哪些像素是原來就存在且沒有移動過的背景像素，以及哪些像素是有移動過的前景像素。如此，在能夠對齊高斯混合模型與新進影像的情況下，就能夠達到動態式攝影機下前景背景分割的目的。至於找出移動向量的方法，可以藉由配對新進影像與重建的背景影像之間重複出現的區域或是特徵點（例如角點），來計算移動向量。圖1.1表示藉由配對區域與角點以對齊影像，再切割出前景物的想法。圖1.1(a)為一重建的背景影像，圖1.1(b)為一新進影像，我們在重建的背景影像中找出區域和角點，如圖1.1(c)中紅色的圈圈和矩形分別表示一個重建的背景影像中的角點和區域，而該角點和區域的質心座標分別為（144, 28）、（169, 76），同時我們也在新進影像中找出區域和角點，如圖1.1(d) 表示一個在新進影像中找到的角點和區域，該角點和區域的質心座標為（66, 106）、（91, 154），之後將這兩個角點的座標相減或是兩個區域的質心座標相減就可得到重建的背景影像相對於新進影像的移動向量（-78, 78）。接著將重建的背景影像根據找到的移動向量移動到正確的位置以對齊新進影像，意即我們將重建的背景影像（即圖1.1(a)）往左移動78個像素後再往下移動78個像素，移動後的結果如圖1.1(e)所示，其中黑色的區域表示原來不存在重建的背景影像中的區域，因此新進影像位在黑色區域的部分將無從判斷是否有前景物，本論文將該部分的新進影像通通視為背景。在對齊新進影像和重建的背景影像後，就可以利用任何一

(11)

個靜齊重圖1 像素背景另外數個像與圖1. 中的動向靜態式攝影重建的背景 .1(f)所示。素填滿，讓重景影像，如外因為錯誤個可能的候與重建的背 .1 本論文之的角點和區域向量移動到正影機下的前景景影像與新進最後再將重重建的背景如圖1.1(g)所示誤地配對區域候選移動向量背景影像間最之想法示意圖域，(d) 新進正確的位置景背景分割進影像後的重建的背景景影像能夠跟示，這樣就域或角點的量，因此我們最佳的移動 (a) (c) (e) 圖。(a) 重建進影像中的角，(f) 前景背 3 割法切割出前的前背景分割景影像中黑色跟最新的背就能夠繼續的影響，會在們需要過濾動向量。 (g) 建的背景影像角點和區域，背景分割的結前景物（本割），而整個色的部分用背景環境同步續做下一張新在新進影像與濾這些候選移 (b) (d) (f) 像，(b) 新進影，(e) 將重建結果，(g) 新本論文利用G 個前景背景用新進影像中步，成為一新進影像的與重建的背移動向量，影像，(c) 重建的背景影像新的重建的背 GMM來達到景分割的結果中相同位置一張新的重建的前背景分割背景影像間找以找出新進重建的背景影像根據找到的背景影像。到對果如置的建的割。找出進影影像的移

(12)

4 但是因為將影像間的運動僅用一個移動向量來表示，所以本論文的方法不適合應用在攝影機有前進後退、透式投影的影響強烈以及像素間景深差異太大的情況，因為以上三種情況會造成影像間的運動無法僅用一個移動向量來表示，因此本論文所提出的方法就不能夠有效的解決這三種情況。本論文提出的方法除了解決攝影機移動的問題外，同時也加入了Gaussian Mixture Models的觀念（即高斯混合模型，以下簡稱GMM），以處理場景中有規律運動現象的背景物，例如吊鐘的鐘擺、較規律的樹影晃動或甚至是其他更複雜但有規律的運動。且GMM亦可解決光影變化的問題，對真實環境下場景因光影變化造成影像不穩定時做前景背景分割的幫助相當大。但GMM的缺點是無法直接應用在動態式攝影機的環境下，因此我們希望藉由估算出重建的背景影像相對於新進影像（由於加入了GMM，所以重建的背景影像就來自於GMM，詳細的方法請參考2.2節）的移動向量，再利用此移動向量對齊GMM與新進影像，達到前景背景分割的目的。 1.2 相關研究 前景背景分割根據其應用環境的不同，可以區分為靜態式以及動態式攝影機下的前景背景分割兩個領域，其中靜態式攝影機下的領域已經有了相當不錯的研究結果，例如文獻[3]。文獻[3]中提及，我們將每個像素都用數個高斯模型來模擬該像素過去曾經出現過的顏色，即完成背景模型之建構。對於後續的新進影像，我們把每個新進影像中像素的顏色值，與位在該像素位置的數個高斯模型做比較，看看是否有可以配對成功的模型存在。然後再判斷這些配對成功的模型是否屬於背景模型。如果以上的兩個條件成立，將該像素視為背景，反之則視為前景。我們可以根據使用者提供的參數來更新每個模型的平均值、變異數以及權重。文獻[3]提出的方法，在靜態的環境下已經能夠很穩定地達成前景背景分割的目

(13)

5 的，但是這個方法的缺點是沒有辦法應用在動態式攝影機的環境下，因為若是攝影機有稍稍的偏移，我們將無從判斷像素與高斯模型之間的空間對應關係。因此要是沒有提供一個對齊的機制，則新進影像中的像素將會對應到不正確的高斯模型，整體的結果就會因為沒有對齊而切割出許多的前景物。儘管這個問題在一段時間後，會因為該方法本身隨著時間新增模型以及更新模型參數的特性而消失，但是這段時間內因為沒有對齊高斯模型而被誤認為前景物的背景像素，與真正進入場景中的前景物，將無從區別。對於動態式攝影機，因為背景環境是會移動的，因此需要一套機制來區分移動中的像素究竟是屬於前景物還是背景環境。在這種需求下，有兩種領域可以解決移動中的背景像素所產生的問題，一個是不需要對齊影像的追蹤法，例如文獻[2][4]，另一個則是需要對齊影像的前景背景分割法。至於需要對齊的影像，通常是新進影像跟上一個影格的影像，例如文獻[5][6][7]，或者是維護一個純粹只有背景的影像，例如文獻[1]與本論文所提出的方法，再對齊新進影像與該純背景影像。對於不需要對齊影像的追蹤法，例如文獻[4]，雖然其功能在於追蹤一個指定的前景物，但最終目的則與本論文一樣，都是希望能夠準確地定位出有興趣的區域，只不過追蹤法有興趣的區域是一開始就指定好的區域，例如一個人，而本論文則是對會移動的區域有興趣。文獻[4]整體的方法大致是：記住前景物（或說被追蹤物）過去曾經出現過的位置，利用一個固定的移動向量計算模型以及一些亂數，以估測前景物在下一個影格（frame）中可能的位置。但是因為需要提供一個固定的移動向量計算模型來模擬前景物的移動行為，若是前景物出現在場景中的位置較無規律，造成其移動行為無法以提供的移動向量計算模型來模擬時，文獻[4]就無法成功地找出該前景物，因此不適合被應用在需要準確區分前景背景的情況。至於需要對齊影像的文獻[1][5][6][7]，就需要提出一個對齊的機制，例如文獻[1]是一個在動態式攝影機下切割出前景物的方法，且與本論文所提出的方法一樣地，都需要一張純背景影像作為前景背景分割的依據。當要對新進影像做前

(14)

背景間上設攝像素功，制了過了的實果，們希的移像素圖1. 見文的前景分割時，同上相連的像攝影機的移素，以5×5的，則將該新了攝影機的了這個限制實用性，圖，在這個例希望將新進移動向量超素誤判為前 .2 背景移動文獻[1]無法處前景背景分割同樣也跟本像素組成一個移動不會超過的範圍內作新進影像像素的移動向量只制，這個方法圖1.2表示文例子中背景影進影像中的腳超過了上下左前景物。 (a) (c) 動超過兩個像處理影像移動割結果，(c) 本論文所提出個群組，但過上下左右作新進影像像素判斷為背只有上下左法就會發生文獻[1]處理攝影像相對於腳踏車騎士左右各最多像素對文獻[1 動向量超過上第2個影格 6 出的方法一但是接下來的右各兩個像素像素與背景背景，反之則左右最多各兩生嚴重的錯誤攝影機移動於第一張新進士切割出來，多兩個像素的 1]的影響。白上下左右各，(d) (c)的前一樣地，將背的過程就與素，所以對接景影像群組的則判斷成前兩個像素，一誤，這個限動向量超過上進影像的移但是因為新的限制，因白色區域表示各兩個像素的前景背景分割背景影像中與本論文不同接下來新進的配對，如前景。文獻[ 一旦攝影機限制大大地降上下左右各移動向量是新進影像相因此文獻[1]將 (b) (d) 示切割出來的的問題。(a) 第割結果。中顏色相近且同。文獻[1 進影像中的每如果可以配對 1]的缺點是機的移動向量降低了文獻各兩個像素的（-78, 78）相對於背景影將很多的背的前景，由此第1個影格，( 且空 ]假每個對成是限量超獻[1] 的結，我影像背景此可 (b) (a)

(15)

7 文獻[5][6][7]雖然與文獻[1]和本論文一樣，都需要對齊影像才能進行前景背景的分割，但是文獻[5][6][7]是對齊新進影像與上一個影格的影像，而非維護一個純背景影像。例如文獻[5]介紹了一個在動態式攝影機下找出移動中行人的方法，然而該方法需要有特殊的儀器提供攝影機的旋轉跟移動向量，才能夠找出前後兩張影像之間的關係，再進一步地切割出正在移動的前景物件。但是就算有了攝影機的旋轉跟移動向量，該方法仍然遇到一個問題，那就是沒有影像中像素的深度資訊，因為計算一個像素在旋轉移動後的位置需要有深度的資訊。對此，該方法建議事先測量出攝影機所有可能拍攝的深度範圍，接著對這個範圍做量化，再把這些量化後的深度資訊當作一個像素可能的深度，這意味著一個像素會有很多個可能的深度值。因此往後當該方法欲計算上一張影像的像素在下一張影像的位置時，便需要考慮所有量化後的深度，這會造成一個像素在下一張影像中會有很多個可能的位置。該方法建議只要在這些可能的位置中有一個能夠跟下一張影像中相同位置的像素相似，則該下一張影像中的同位置像素便可以歸類成背景。因此這個方法的問題為深度量化的不精準性，以及容易將前景物誤判為背景物。文獻[6]為一動態式攝影機下切割出移動前景物的方法，該方法跟文獻[5]一樣，需要由機器輸入特定的參數，如果是移動式的攝影機則輸入攝影機的移動向量，但如果是旋轉式攝影機則輸入攝影機的旋轉量，之後當要從輸入影像切割出前景物時，本方法將上一個影格的輸入影像根據機器提供的移動或旋轉量來做移動或是旋轉，意即與本方法一樣地，先對齊兩張影像，接著再將這兩張對齊後的影像相減，得到移動中的區域。但是相減後得到的移動中區域有兩種可能：第一個是在上一張影像中為背景但在下一張影像中有前景物出現的區域，第二個是在上一張影像中為前景但在下一張影像中因為前景物離開而再次露出來的背景區域。為了消除因為第二種現象而出現的移動中區域，文獻[6]建議對輸入影像尋找影像中所有的邊線，之後對每一個像素判斷其是否為同時為邊線和移動中區域，如果是則表示該像素屬於移動中前景物的輪廓，如此便可以找出影像中所有移動前景物的輪廓。但是也因為限制一個前景物像素必須要同時屬於邊線和移動中區

(16)

8 域，導致文獻[6]只能切割出前景物的輪廓而已，而非完整的前景物像素區域。文獻[6]與本論文提出的方法相較下有兩個缺點：第一個是需要由機器輸入特定的參數，第二個是對於前景物，文獻[6]只能切出該前景物的輪廓，無法跟本論文提出的方法一樣地找出完整的移動中前景物。文獻[7]為一個在動態式攝影機下判斷是否有行人的方法，該方法一開始先找出移動中的前景物，接著將找出的前景物交與一個訓練好的TDNN（Time Delay Neuron Network）分類器來判斷該前景物是否為移動中的行人。與本論文所提出的方法一樣，該方法要求第一張影格須為純背景的影像，接著指定一個數字N表示影像中有多少個顏色相似且空間上相鄰的區塊，再將影像中的像素根據其顏色和位置分類到這N個不同的區塊。當之後有新進影像要做前景背景分割時，試著 將新進影像中所有的像素根據其顏色分類進這N個區塊中，如果像素可以成功地 被分類進這N個區塊中，表示該像素為背景物，否則將該像素判斷為前景物。此 方法的缺點是N必須手動指定，無法自動化判斷，且藉由將像素分類進N個區塊 以判斷該像素是否為前景物的步驟僅僅考慮像素與區塊顏色上的關係，並沒有考慮到像素與區塊空間上的關係，這是因為攝影機是會移動的，如此將會造成新進影像中的像素與區塊間的空間關係無法決定，因此如果新進前景物與N個區塊中 的其中一個區塊顏色相似，則該新進前景物將全部被誤判成背景。而本論文只有在前景物經過顏色相似的背景區域時，才會將前景物誤判成背景。其他還有一些可以發展成為動態式攝影機下前景背景分割法的方法，例如文獻[8][9]，文獻[8]原本是一個計算兩張影像間每個區塊的移動向量的方法，因此我們只需要將移動向量跟其他區塊特別不一樣的區塊找出，便可以將該區塊判斷為移動中的前景物。文獻[8]一開始先將影像切割成數個區塊（block），接著計算這些區塊各自的移動向量（motion vector），要是發現有一個區塊的移動向量跟其他區塊的移動向量差異非常多，該區塊就有可能是前景物。套用此方法，前景和背景可以很輕易的被分割出來，甚至可以結合文獻[3]，成為一個更穩定且更能容忍雜訊的方法。但其缺點在於移動向量的計算是先將影像分割成數個區

(17)

9 塊，再對每一個區塊，先從小的移動向量開始判斷是否為該區塊合適的移動向量，若否，則慢慢加大移動向量，直到找到該區塊合適的移動向量為止。一但一個區塊找到了合適的移動向量，該區塊傳遞自己的移動向量給附近的區塊，讓附近的區塊確認該移動向量是否也是適合自己的移動向量。若是，則繼續傳遞該移動向量給其他鄰近的區塊，讓鄰近的區塊免於費時地尋找移動向量，以達到加速的目的。這個方法適合小範圍的影像移動，若遇到較劇烈的影像移動，其花費的時間將會非常可觀。文獻[9]為一個對齊兩張影像間角點的方法，如果我們跟文獻[1]一樣維護一張純背景的影像，且利用文獻[9]來對齊新進影像與純背景影像間的角點，則所有在新進影像中無法在背景影像中找到對應點的角點便可歸類為前景物角點。文獻[9]一開始先從兩張影像中找出角點，之後粗略地配對這些角點再利用八點演算法以求出影像之間可能的基本矩陣（fundamental matrix）。由於考慮到不準確的角點配對，在測試基本矩陣是否夠準確的過程中利用極線幾何（epipolar geometry）來測試在一張影像中的角點在另外一張影像上的極線是否亦有角點存在，如果有則認為該角點能夠藉由該基本矩陣成功地找到在另外一張影像中的對應點。如果大部分的角點都能利用該基本矩陣成功地找出對應的角點，則認定該基本矩陣為兩張影像間最準確的基本矩陣，反之則需另外選擇其他八個粗略配對的角點，再求出新的基本矩陣，重複上述的步驟，直到大部分的角點都能利用該基本矩陣成功地找出對應的角點為止。文獻[9]與本論文所提出的方法相比下有一個缺點：利用文獻[9]所找出的前景物僅僅是角點而以，並無法像本論文所提出的方法一樣完整地找出所有前景物所在的像素，因此若要使用文獻[9]來切割前景物，必須要解決這個問題才行。表1整理出以上所列出的相關文獻與本論文之間的優缺點比較，以方便了解各個方法相對於本論文的優缺點。

(18)

10 表1 本論文所引用的相關文獻與本論文之間的優缺點比較。相對於本論文的優缺點文獻[1] 攝影機的最大移動向量有限，僅有上下左右各兩個像素文獻[2] 需要提供前景物的移動模型、尋找特徵點費時文獻[3] 只適用於靜態式攝影機文獻[4] 需要提供前景物的移動模型文獻[5] 需要輸入攝影機移動的參數，容易將前景物誤判成背景物文獻[6] 需要輸入攝影機移動的參數，僅能找出前景物的輪廓文獻[7] 需要手動指定影像中區塊的數目，容易將前景物誤判為背景文獻[8] 計算非常費時文獻[9] 只能找出前景物的角點本論文無法處理太複雜的背景運動 1.3 系統流程 圖1.3為本論文所提出的動態攝影機下前景背景分割法的流程圖，在流程圖的頂端為新進影像以及重建的背景影像，其中新進影像為我們想要找出移動前景物的目標影像，而重建的背景影像則是由高斯混合模型則所提供的純背景影像，因此至少第一個影格需要是單純背景的影像，用以建立純背景高斯混合模型。有了重建的背景影像後，才能建立以顏色為基礎之純背景群組、用邊線所切割出之純背景區塊以及背景角點，其中一個群組或區塊代表影像中顏色相似且空間上相連的區域，而角點則是在影像中x與y軸顏色差異度都很大的像素。在取得了新進 影像後，同樣對該新進影像建立群組、區塊及角點。接著藉由配對重建的背景影像與新進影像的群組、區塊以及角點以計算出重建的背景影像與新進影像間所有可能的候選移動向量，之後再找出能提供重建的背景影像與新進影像最小差異度的候選移動向量為最佳的移動向量。在取得了最佳移動向量後便可以將高斯混合模型移動到正確的位置，意即我們對齊高斯混合模型以及新進影像，接著執行前景背景分割。在得到切割完的結果後，把面積過小的前景物視為雜訊刪除，只留下面積夠大的前景區域，再消除攝影機些微旋轉對影像造成的影響，就是本方法最終的結果。最後更新高斯混合模型的位置，使其能與新進影像中的背景同步。

(19)

11 重建的背景影像更新背景 GMM 更新背景 GMM 圖1.3 本論文所提出的動態攝影機下前景背景分割法的流程圖。建立重建的背景影像群組、區塊以及角點建立新進影像群組、區塊以及角點配對群組、區塊及角點以計算出所有可能的候選移動向量根據最佳移動向量移動背景GMM並作前景背景分割最理想的前景背景分割結果濾除雜訊及消除攝影機些微旋轉對影像造成的影響找出能提供重建的背景影像與新進影像最小差異度的候選移動量為最佳移動向量輸入新進影像

(20)

12 1.4 各章簡介 本論文共分成六章，除了本章緒論之外，我們將在第二章介紹高斯混合模型的原理，以達到在高斯混合模型以及新進影像已經對齊的前提下，完成前景背景分割的目的，同時利用高斯混合模型建立重建的背景影像，以提供對齊高斯混合模型與下一個新進影像的依據。第三章將介紹在影像中擷取特徵的三個方法，分別為以顏色為基礎建立群組的方法、在影像中尋找邊線以建立用邊線所切割出的區塊的方法、在影像中尋找角點以及配對角點的方法。第四章說明了如何藉由配對群組、區塊以估算候選移動向量，再根據每個候選移動向量找出能提供重建的背景影像與新進影像最小差異度的候選移動向量為最佳移動向量，之後利用該最佳移動向量將背景高斯混合模型移動到正確的位置以對齊新進影像，再作前景背景的分割，接著再消除面積過小的雜訊，並試著將剩下仍被判斷成前景的像素與背景高斯混合模型中相對應位置像素的鄰近像素的模型做配對，以消除攝影機些微旋轉對影像造成的影響。第五章顯示本方法的實驗結果，第六章則說明未來可能的研究方向。

(21)

13

二、建立用於影像對齊之重建的背景影像

在本章中，我們在2.1節介紹高斯混合模型如何在新進影像已經對齊高斯混合模型的前提下，達成前景背景分割的目的。並在2.2節中介紹如何利用高斯混合模型來建立對齊高斯混合模型與新進影像所需的重建的背景影像，在有了重建的背景影像之後，才能建立對齊所需要的以顏色為基礎的群組、用邊線所切割出的區塊以及用角點偵測器所獲得之角點。 2.1 高斯混合模型

Grimson[1]在1999年所提出的Gaussian Mixture Model（GMM），由於其對光影變化以及背景規律性運動現象的處理能力優秀，已經成為靜態式攝影機下前景背景分割的重要方法。因此本論文亦想借重其能力，讓前景背景分割的結果更加地穩定。 GMM的精神為對每一個像素建立數個高斯模型，代表該像素曾經出現過的顏色，例如在樹影搖曳的環境下，一個正好處在樹葉跟樹枝擺盪之間的像素就會有代表綠色樹葉以及褐色樹枝的兩個高斯模型，如圖2.1所示（值得一提的是， Grimson提出來的方法主要是利用強度（intensity）來建立高斯模型，因此在這裡說綠色跟褐色的高斯模型其實並不精準，但我們可以對GMM做一點修改，將其維度從一維的強度增加至三維的RGB，使其亦能處理彩色的狀況）。而這數個高斯模型又有各自的權重，一個權重可以被理解為其對應的高斯模型的出現頻率，越常出現的高斯模型其權重會越高，表示其出現頻率高。假設一個像素已經有了數個高斯模型，在新的影像進來後，我們想判斷在新進影像中該位置的像素是否為新出現的前景，對每一個該像素所擁有的高斯模

(22)

14 (a) (b) (c) 圖2.1 一個高斯模型的例子。(a)與(b)為樹影搖曳的圖片，其中位於紅點的像素的高斯混合模型如(c)所示。型，以下式判斷該像素是否能夠配對（match）到該高斯模型（i－μt）2 ≦2.5×σ （2.1）其中i為像素的強度，μt為該高斯模型的平均強度，σ為該高斯模型的標準差，如 果可以配對則以式子（2.2）、式子（2.3）和式子（2.4）更新該模型的權重、平均強度以及變異量（variance） ωk,t ＝（1－α）ωk,t-1＋α （2.2） μt ＝（1－ρ）μt-1＋ρXt （2.3）

(23)

15 σt ＝（1－ρ）σt-1＋ρ（Xt－μt）2 （2.4）其中α以及ρ分別為指定的更新速度，Xt為該新進影像像素的強度，但如果無法配對到該高斯模型，則以下式更新該模型的權重即可 ωk,t ＝（1－α）ωk,t-1 （2.5）無需更新該模型的平均強度以及變異量。在每個高斯模型都測試完畢後，正規化每個高斯模型的權重，使其總合為固定數值。接著我們選出B個權重除以變異量 最大的高斯模型，使其權重合小於等於指定的閥值T，而這B個高斯模型就代表 該像素最有可能的背景模型。選擇權重除以變異量最大的模型的理由是因為這樣的模型必然有著很大的權重或是很小的變異量，很大的權重表示該模型常出現，因此會是背景的機率較大；而很小的變異量表示該模型的顏色很穩定，穩定的模型會是背景的機率也較大。最後我們判斷該新進像素的強度是否至少能夠配對到這B個模型的其中一個，如果是，則表示該像素為背景，否則為前景。 考慮到在真實的應用下我們不可能給每一個像素無限制數量的高斯模型，因此通常我們會指定一個數目K，表示一個像素至多只能有K個高斯模型。因此 若發現一個新進像素無法配對到任何一個已經存在的高斯模型（如此則該新進像素必然為前景，因為無法配對到任何一個已經存在的模型，自然也不會配對到上一個段落中最後提到的B個最有可能的背景模型），我們需要為該新進像素建立 一個高斯模型。如果已經存在的高斯模型數量少於K，則我們直接新增一個新的 高斯模型，其強度為該新進像素的強度，但是權重和變異量則需要手動指定一個初始值，因為我們無法僅靠一個樣本算出變異量。但若已經存在了K個高斯模型， 則我們刪除權重除以變異量最小的高斯模型。選擇權重除以變異量最小的模型的理由是因為這樣的模型必然有著很小的權重或是很大的變異量，很小的權重表示該模型不常出現，通常是過去曾經出現過的前景，但是出現的次數很少，或是很

(24)

16 久沒再出現過了，因此可以推論其不會是背景的機率很大，所以在必須要刪除一個模型的要求下，我們選擇刪除這樣的模型，而很大的變異量表示該模型的顏色很不穩定，不穩定的模型通常也不會是背景，因此也可以刪除之。在刪除了一個最不可能代表背景的高斯模型後，我們新增一個強度為該新進像素的強度，但是權重和變異量為手動指定的高斯模型。在真正讓GMM處理前景背景分割的工作前，最好讓GMM先在純背景的環境下執行一段時間，這樣才可以讓每一個像素建立出所有可能代表該像素的背景高斯模型，以及計算出每個高斯模型各自的變異量。例如在上述樹枝擺盪的例子中，我們需要足夠數目的影格，讓這些影格足以包含到樹葉和樹枝晃動的情況，使位在其中的像素可以有機會建立代表綠色樹葉與褐色樹枝的高斯模型。 2.2 建立重建的背景影像 由於我們的方法需要利用GMM來做前景背景的分割，所以為了將GMM整合進我們的方法，需要對GMM做一點修改。第一個需要修改的地方是之前提過的，將一維的強度推廣到三維的RGB，讓GMM能夠處理彩色的影像。修改的方法很簡單，對於每一個高斯模型，我們僅需將代表強度的數值重複三份，並將每一份數值的意義分別改成RGB，而當測試一個像素能否配對到該高斯模型時，將式子（2.1）分別對RGB三個色頻做測試，唯有當三個色頻都能配對成功的時候，該像素才能被視為配對成功，否則為配對失敗。至於平均顏色與變異量的更新則對RGB三個色頻分別更新即可。另外在第三章中需要每一個背景像素都提供自己的背景顏色，以建立如圖1.1(a)與圖1.1(g)的重建的背景影像，如此才能利用該重建的背景影像來建立背景群組、區塊以及角點。如果我們真正拿每個像素的B個最能代表背景的高斯模型的顏色來做排列組合，以求出所有可能的群組和區塊，這樣的計算量會十分龐大，因此我們限制一個像素在提供背景顏色的時候，只提

(25)

供最的顏景分上本移出的背的群圖2. 了G 影像最可能代表顏色。以圖2.2為分割後，得到本論文建議出的背景像背景影像可群組、用邊 .2 GMM提供 GMM本身的像。表背景的高斯為例子，當到的結果如議的強制設定像素之處理）可以在下一張邊線所切割出供的重建的背的更新機制以斯模型的顏當圖2.2(a)的如圖2.2(b)所定背景模型），可得到張新進影像出的區塊以 (a) 背景影像。( 以及本論文建 17 顏色，即權重的新進影像在所示。之後除型法（詳細的到如圖2.2(c)所像要做前景背以及用角點偵 (c) (a) 新進影像建議的強制設重除以變異量在經由本論除了GMM本的過程與說所示的重建背景分割時偵測器所獲像，(b) (a)的設定背景模型量最大的高論文所提出的本身的更新說明請參考4 建的背景影時，提供建立獲得之角點的 (b) 的前背景分割型法，所得到高斯模型所擁的方法做前新機制外，再 4.4節：新進影像，而該重立以顏色為基的依據。割結果，(c) 結到的重建的背擁有前背再加進與重建基礎結合背景

(26)

18

三、三種可用於影像對齊之影像特徵擷取

由於本論文的主要精神為先找出重建的背景影像（由GMM提供）與新進影像間的最佳移動向量，之後再將背景GMM根據此最佳移動向量移動到新的位置，意即我們對齊GMM與新進影像，最後利用GMM達到前景背景分割的目的，因此我們需要提供可行的方法來尋找GMM與新進影像間的最佳移動向量，如此才能對齊GMM與新進影像。第一個可行的方法為找出重建的背景影像與新進影像中顏色相似且空間上相連的區域，如圖1.1(c)與(d)中紅色矩形所包住的人行道上的磁磚，接著計算這兩個區域各自的質心座標，最後將這兩個區域的質心座標相減，就是重建的背景影像與新進影像之間一個可能的移動向量。對此本論文提出兩個不同的方法來尋找影像中的區域：以顏色為基礎的群組以及用邊線所切割出的區塊，3.1節將介紹以顏色為基礎的群組方法，而3.2節將介紹如何找出用邊線所切割出的區塊。第二個可行的方法為找出重建的背景影像與新進影像之間的角點，如圖1.1(c)與(d)中紅色圓圈所包住的窗戶角落，之後將這兩個角點的座標相減，同樣也是一個重建的背景影像與新進影像之間可能的移動向量，3.3節將介紹尋找角點以及配對角點的方法。 3.1 以顏色為基礎的群組 第一個可行的移動向量尋找方法為對重建的背景影像（由背景GMM提供）與新進影像建立各自的顏色相近群組模型，再利用附錄1的連通物件搜尋法將空間上不相鄰的群組模型分開成獨立的群組，如此群組所代表的意義就是影像中顏色相近且空間上相連的區域，接著配對新進影像與重建的背景影像的群組，最後將所有配對成功的群組的質心座標相減，以估算出所有可能的候選移動向量。因

(27)

19 此在本節我們介紹對重建的背景影像以及前景影像中的每個物件（即相連在一起的相似顏色的區域）建立以顏色為基礎的群組模型，之後再利用附錄1的連通物件搜尋法建立以顏色為基礎的群組。我們利用區域之間顏色不同的特性，設計了一個群組影像區域的方法。建立的步驟如下：首先將影像中位置為（0, 0）的像素建立成第一個群組模型，這個群組模型中有該像素的RGB三個顏色值，但在往後的過程中，這三個顏色值會一直被更新，其代表的意義便成為所有屬於該群組模型的像素之平均顏色值。接下來對影像中所有的像素，逐一判斷該像素能不能配對到任何一個已經存在的群組模型。判斷的方法直接採用下式 ｜（IR－VR）｜＜ T1 且｜（IG－VG）｜＜ T1 且｜（IB－VB）｜＜ T1 （3.1）其中IR表示該像素的紅色值，VR表示該群組模型的紅色值，IG表示該像素的綠色值，VG表示該群組模型的綠色值，IB表示該像素的藍色值，VB表示該群組模型的藍色值，T1為一個閥值，經由實驗發現，若T1設為10能得到較好的群組模型結果。如果RGB三個色頻都可以滿足式子（3.1），表示該像素與該群組模型可以成功配對。若該像素只配對到一個群組模型，則我們將該像素分類到該群組模型，並且更新該群組模型的顏色值，更新的方法為對RGB三個色頻各自採用下式

Vupdated ＝（1－σ）×Vold＋σ×I （3.2）

其中V為群組模型的顏色值，I為新進像素的顏色值，σ為更新速度，經由實驗發

現，將σ設為0.1能得到較好的群組模型結果。但若該像素無法配對到任何一個已

經存在的群組模型，那麼我們就為這個像素建立一個新的群組模型，而該新建立的群組模型的顏色值則指定成該像素的顏色。若該像素同時配對到數個已經存在

(28)

20 的群組模型，我們選出最適合該像素的群組模型當作該像素所屬的群組模型，選擇的依據採用下式 R ＝（IR－VR）2＋（IG－VG）2＋（IB－VB）2 （3.3）因為最小的R值表示該群組模型和該像素最為接近，所以我們選擇能提供最小R 值之群組模型為最適合該像素的群組模型，並將該像素歸類給該群組模型，最後同樣以式子（3.2）更新該群組模型的RGB值，如此一來影像中只要是顏色相近的像素都會被歸類到同一個群組模型。圖3.1(a)為一原始影像，影像中有多個不同顏色的物體，也有顏色相同的物體。圖3.1(b)則為圖3.1(a)經由以上介紹的方法處理過後的結果，我們對每一個群組模型給定隨機的顏色，因此不同顏色的像素代表被分在不同的群組模型裡，方便視覺驗證。注意到在圖3.1(a)中的兩顆黑球在圖3.1(b)中被歸類到同一個群組模型，但是我們希望能夠將這兩顆黑球歸類到不同的群組，因為若將空間上不相連的像素分類到一個群組，很多資訊都將變得毫無意義，例如群組的質心以及x與y軸方 向的變異量。且有可能在原來的影像中存在兩個或多個不相連但顏色相似的區域，我們把它們歸類成一個群組模型，並且計算其質心、面積以及x與y軸的變異量， 但在接下來的影格，因為攝影機移動的關係，導致其中一個區域消失，因此利用剩下來的區域所計算出來的質心、面積以及x與y軸的變異量將變得與之前算出來 的完全不同，而無法利用。由此可知，將空間上不相連的區域分成不同的群組是必須的，這樣當我們希望利用群組的質心、面積以及x與y軸的變異量來配對兩個 群組時，才能將出錯的機率降到最低。對此我們利用附錄1的連通物件搜尋法將空間上不相鄰但屬於同一個群組模型的區域分開成兩個群組，而分開後的結果如圖3.1(c)所示。

(29)

圖3. 連通況下的群為第影影型顏圖3. 機的果， .1 群組的結通物件搜尋群組模型下，建立出的群組模型會第一個建立影響下會變顏色值在有 .2 群組模型的顏色來達到 (c) 不更新 (a) 結果。(a) 原始尋法後的結果型顏色值更的群組模型會比有更新的立該群組模型變化地非常劇有更新及無更型顏色值有無到視覺化驗證新群組模型顏始影像，(b) 果。更新與否對整型較能符合人的結果更細型的像素顏劇烈，而且更新的情況 (b) 無更新對群組證的目的。( 顏色值的群組 21 (b) ) (a)用群組模整體群組模人眼對區域細碎，而且因顏色值，這樣且也很容易受況下，建立出 (a) 組模型結果的 (a) 重建的背組模型結果模型來模擬空模型的結果影域的認知，若因為群組模型樣的情況將使受到雜訊的出的群組模 (c) 的影響。我們背景影像，(b 。 (c) 空間的顏色分影響很大，若沒有更新型一開始的使得群組模的干擾。圖3 模型差異。們透過給予每 b) σ＝0.1的背 分佈，(c) (b 在有更新的新，則建立出的顏色值被設模型在稍為有 3.2顯示群組每個群組模型背景群組模型 b)做的情出來設定有光組模型隨型結

(30)

22 3.2 用邊線所切割出的區塊 有鑑於3.1節所介紹的以顏色為基礎的群組在真實環境下受到光影變化的影響太大，我們提出第二個尋找影像中區域的方法。此方法先利用邊線偵測器（edge detector）找出影像中所有的邊線，接著再利用附錄1所介紹的連通物件搜尋法找出用邊線切割出的區塊（或說被邊線所包圍的區塊）。在本論文中，我們選擇使用文獻[10]中第三章第七節所介紹的Sobel edge detector來尋找邊線。Sobel

edge detector的作法為：對於影像中的每一個像素，如圖3.3中所示的Z5，以下式判斷該像素是否為邊線上的像素（3.4）其中為圖3.3(a)與圖3.3(b)做點對點相乘後相加的結果，為圖3.3(a)與圖3.3(c) 做點對點相乘後相加的結果，為一個閥值。經由實驗發現，若T設為40能得到 較好的邊線偵測結果，如果該式成立，則代表Z5為一個邊線像素。如此找完了一張影像上所有的邊線像素後，再利用附錄1所介紹的連通物件搜尋法，找出所有用邊線切割出來的區塊。這些用邊線切割出來的區塊，與3.1節所介紹的以顏色為基礎的群組一樣，都可以提供新進影像與背景GMM間可能的移動向量。 (a) (b) (c)

圖3.3 Sobel edge detector。(a) 像素的索引(index)，其中Z5為要測試是否為邊線像素的像

素，(b) 測試是否為水平邊線像素的mask，(c) 測試是否為垂直邊線像素的mask。 Z1 Z2 Z3 Z4 Z5 Z6 Z7 Z8 Z9 -1 0 1 -2 2 -1 0 1 0 -1 -2 -1 0 0 0 1 2 1

(31)

利用件搜目的圖3. 來的較於況。切割三章模糊圖3.4為用用Sobel edg 搜尋法所找的。 .4 用邊線所的邊線，(c) 在大部分於群組模型例如我們曾割出來的區章以顏色為糊的關係，存用邊線所切 ge detector所找出的區塊， (b) 所切割出的區利用附錄1的分的情況下，區塊對光曾經發現攝區塊就有可能為基礎的群組存在兩個顏切割出的區塊所找出來的邊我們透過給區塊的結果。的連通物件下，用邊線所光影變化的容攝影機拍出來能會跟從重組模型就可顏色差異頗大 23 塊的結果，邊線，圖3 給予每個區 (a) 。(a) 輸入影件搜尋法所找所切割出來容忍度相當來的影像會重建的背景影可以發揮其作大的區域，圖3.4(a)為 .4(c)為圖3. 區塊隨機的顏影像，(b) 利用找出的區塊來的區塊都有當高，但是偶會突然變模糊影像切割出作用。原因是中間是以模為一輸入影像 .4(b)利用附顏色來達到 (c) 用Sobel edge 。有不錯的穩偶爾還是會糊，這樣邊線出來的區塊差是：假設現模糊的漸層像，圖3.4(b 附錄1的連通到視覺化驗證 e detector所找穩定性，因為會遇到失敗的線就會不明差很多，這時現在因為影像層相連，這個 b)為通物證的找出為相的情明顯，時第像變個時

(32)

候S 這個以避當由該群將另圖3. 來的 (c) 以及新進 3 本論每個可以動向果有 Sobel edge d 個漸層內找避免將這兩由其中一個群組模型的另一個區域 .5 群組可以的區塊，其中使用群組後至此我們及用邊線所進影像間的 .3 Harris C 第三個可論文中我們個偵測出來以視為同一向量時，將重有任兩個角 detector會因找出一條邊線兩個區域分在個區域所建立的顏色更新速域也一起併入 (a) 以成功地切出中白色的像素後的結果，右們已經能夠對所切割出的區的群組和區塊 Corner Det 可行的對齊方們利用文獻[ 來的角點建立一個角點。因重建的背景角點能配對成因為該模糊漸線將這兩個在同一個群立出來的群速度趕不上入該群組模出區域但區塊素表示邊線像右上角的窗戶對重建的背區塊，在第四塊來找出所 tector與角點 方法為配對 11]所提出的立各自的描因此當我們想景影像中所有成功，則將該 24 漸層內相鄰個區域切開。群組模型，因群組模型想繼上漸層顏色的模型。圖3.5顯 (b) 塊卻不行的例像素，注意到戶成功地被分背景影像跟新四章中我們所有可能的候 點配對 對影像中的角的Harris cor 描述子，以利想要估測重有的角點與該新進影像鄰的像素顏。但是以顏色因為群組模型繼續往另外的變化速度顯示這個現例子。(a) 原到右上角的兩分開。新進影像建們將說明如何候選移動向角點以估測 rner detecto 利判斷在兩張重建的背景影與新進影像中像中角點的座顏色太過於相色為基礎的型的顏色是外一個區域擴度，而停在該現象。 (c) 原始影像，(b 兩個窗戶同建立以顏色為何配對重建向量。測影像間的 or來偵測角張不同影像影像相對於中所有的角座標減掉配相似，而無法的群組模型就是漸漸地更新擴張時，會因該漸層上，不 ) 利用邊線切同屬於一個區色為基礎的群建的背景影像的移動向量，角點，之後再像中的角點是於前景影像的角點做配對配對成功的重法在就可新，因為不會切出區塊，群組像及，在再對是否的移，如重建

(33)

25

的背景影像中的角點座標，即為一個可能的候選移動向量。

由於本論文應用了Harris corner detector來尋找影像中的角點，因此我們將在本段中介紹Harris corner detector的運作方式，並且將其作一點修改，使其能夠處理彩色的影像。當我們想判斷影像中一個像素是否為角點時，對該像素的RGB 計算各自的x與y方向的梯度，x方向的梯度可用下式計算 ∂I／∂x ＝ I ⊗（－1, 0, 1）（3.5） 其中I表示像素的顏色值，⊗表示旋積運算子（convolution），而y方向的梯度則用 下式計算 ∂I／∂y ＝ I ⊗（－1, 0, 1）T （3.6）之後再進一步對該像素的RGB色頻各自建立一個2×2的對稱矩陣如下其中、、定義如下 ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ 其中表示以該像素為中心的一個矩形範圍，在本論文中將W設定為以該像素為 中心的九宮格。接下來以下式對該像素的RGB色頻各自計算一個R值

(34)

26 R ＝ Det（ ）－k ‧[Tr（）] 2 （3.7）其中 Det（）＝ － 2 Tr（）＝＋ 當任一個色頻的R為一個夠大的正數時，表示該像素為一個角點。在本論文中， 將常數k設定為0.04，因此式子（3.7）代入k並且展開後可以改寫如下式 R ＝ 0.92 － 2 －0.04（ 2＋ 2）（3.8）根據實驗得到的結果，將R大於109的像素判斷為角點能夠得到比較合理的角點偵測結果，我們將不同的R值所得到的角點偵測結果整理於圖3.6，從圖中可以看出 過小的R值會找出過多的角點，而太大的R值則會造成找出的角點數量太少。

由於Harris corner detector對一個影像中的角落所偵測出來的角點往往不只一個，而是一群角點圍繞著該角落，這會造成影像中偵測出的角點太多，使得在做角點配對的時候會需要過多的時間，而且圍繞在一個角落周圍的角點彼此間的鑑別度不高，這會造成許多錯誤的配對，而使得找出的候選移動向量的數目大增，關於角點配對的詳細方法，我們將在本節的最後兩段說明。為了消除角點群聚的現象以及維持角點必須在角落上的要求，我們利用附錄1的連通物件搜尋法將所有相連在一起的角點找出，之後對每一群相連在一起的角點選出R值最大的角點 為真正的角點，如此便可大大地減少角點的數量，進而增加角點配的效率以及降低錯誤配對的機率。圖3.7(a)為一個將R值設為109所得到的角點偵測結果，圖3.7(b) 為消除角點群聚現象後的結果。

(35)

圖3. 107 .6 不同的R值 ，(e) R＝108 值所得到的角 8_{，(f) R＝10} (a) (c) (e) (g) 角點偵測結 09_{，(g) R＝2} 27 結果。(a) R＝ 2×109_{，(h) R} (b (d (f (h) ＝104_{，(b) R＝} R＝3×109_。 b) d) f) ) ＝105_{，(c) R} R＝106_{，(d) R}_R＝

(36)

圖3. 聚現 .7 消除角點現象後的結果點群聚現象的果。的結果。(a) R 28 (a) (b) R值為109_所得_{得到的角點}_{點偵測結果，(b) 消除角點}_點群

(37)

29 在找完了一張影像所有的角點後，我們對每個角點建立各自的描述子，當做之後配對角點的依據。本論文建立描述子的方法很簡單且直覺，我們使用以該角點為中心且面積為7×7的正方形內所有像素正規化後的顏色值為該角點的描述子，由於一個像素有RGB三個色頻，因此每個角點的描述子都會有7×7×3個數值。其中正規化的方法為先對RGB三個色頻各自算出在7×7正方形內所有像素的平均顏色值，再將該7×7正方形內所有的顏色值減掉這個平均值，即為正規化後的顏色值。正規化的目的是希望能夠降低光影變化對描述子造成的影響，因為突然的光影變化會造成一個描述子內所有的顏色值都加上或減掉一個數值，但是這些數值之間的差異並沒有改變，因此加上正規化的步驟則可以抵銷因為光影變化所造成的加上或減掉一個數值的影響。之後當要判斷兩個來自於不同影像的角點是否為同一個角點時，我們判斷兩個角點描述子內相同顏色值的像素個數是否有超過一個指定的數目，如果有即可判斷兩個角點配對成功，意即可視為同一個角點，反之不為同一個角點。經由實驗發現，將判斷兩個顏色值是否相同的條件設為RGB三個正規化後的色頻差值皆須小於30，且兩個角點描述子內相同顏色值的像素數目須大於描述子內像素數目的三分之二才可將兩個角點視為同一個角點（由於本論文中一個描述子有7×7 ＝49個像素，因此兩個角點的描述子至少需要有33或34個相同顏色值的像素，才會被視為同一個角點），能夠得到較穩定的配對結果。最後再將每一組配對成功的兩個角點的座標值相減，就是重建的背景影像與新進影像間可能的候選移動向量。

(38)

30

四、影像對齊與前景背景分割

在3.1節與3.2節中說明了如何建立新進影像與重建的背景影像的以顏色為基礎的群組與用邊線所切割出的區塊，下一個步驟是藉由配對這些群組與區塊來尋找新進影像與重建的背景影像間的候選移動向量，這個部分我們將在4.1節中介紹。在找出了利用4.1節的方法與3.3節的方法所得到的候選移動向量後，我們需要從這些候選移動向量中找出最佳移動向量，當作對齊新進影像與背景GMM 的依據，4.2節將介紹如何找出最佳移動向量。4.3節介紹在有了最佳移動向量後，我們對齊新進影像與背景GMM，以達到前景背景分割的目的，並試著消除雜訊與攝影機些微旋轉對前景背景分割造成的影響。最後，我們在4.4節中說明如何處理新進與移出的背景像素，以建立新的重建的背景影像，讓下一張新進影像能有對齊的依據。 4.1 尋找影像間之候選移動量 當要對一張攝影機擷取到的影像作前景背景分割時，依照3.1節、3.2節及3.3 節所介紹的方法，對新進影像建立群組、區塊以及角點，同時對GMM亦要求其提供最能代表每個背景像素的顏色，以建立重建的背景影像，再對此重建的背景影像建立群組、區塊以及角點。現在，我們有兩組群組、兩組區塊以及兩組角點，分別來自於新進影像與重建的背景影像。利用角點來尋找候選移動向量的方法已於3.3節中介紹過，因此在這裡就不再重複敘述，下面我們將介紹如何藉由各自配對群組及區塊，以求出所有可能的候選移動向量。依照人眼對於移動向量的計算方式，要判斷下一個影像相對於上一個影像移動了多少，人眼會找出影像中幾乎一模一樣的部分，進而判斷出相對

(39)

31 的移動向量，本章節的步驟也是遵循這樣的想法。而且在真實的應用上，給定的影像往往是時間上相鄰的，這意味著兩張影像之間至少有部分場景是重複出現的，而非截然不同的場景，所以可以假設這兩個影像所建立出來的群組、區塊或角點至少有一個是重複出現的，且在面積、形狀及顏色上變化很小。因此我們對新進影像跟重建的背景影像所建立出的群組以及區塊，先刪除面積過小的群組和區塊，再以顏色差異、面積差異以及x跟y軸的變異量差異判斷新進影像與重建的背景影 像中的兩個群組是否可以視為同一個群組，或兩個區塊是否可以視為同一個區塊，判斷的方法為式子（4.1）、式子（4.2）以及式子（4.3）都需要成立 （IR－VR）< T2 且（IG－VG）< T2 且（IB－VB）< T2 （4.1） |（Sb－Sf）| < T3 （4.2）

Varb(x) ＝ Varf(x) 且 Varb(y) ＝ Varf(y) （4.3）

其中IR表示重建的背景影像的群組或區塊的平均紅色值，VR表示新進影像的群組或區塊的平均紅色值,，IG表示重建的背景影像的群組或區塊的平均綠色值，VG 表示新進影像的群組或區塊的平均綠色值,，IB表示重建的背景影像的群組或區塊的平均藍色值，VB表示新進影像的群組或區塊的平均藍色值，T2為一個閥值，Sb 為重建的背景影像的群組或區塊的面積，Sf為新進影像的群組或區塊的面積，T3 為一個閥值，Varb(x)為重建的背景影像的群組或區塊的x變異量，Varf(x)為新進 影像的群組或區塊的x變異量，Varb(y)為重建的背景影像的群組或區塊的y變異量， Varf(y)為新進影像的群組或區塊的y變異量。式子（4.1）表示兩個群組或區塊之 間的顏色差異不能太大，式子（4.2）則表示兩個群組或區塊之間的面積差異也不能過大，式子（4.3）則規定兩個群組或區塊在形狀上必須有一定程度的相似性。

(40)

32 若兩個群組被判斷為同一個群組，或是兩個區塊被判斷為同一個區塊，則計算面積差異值v1，計算的方法為直接將兩個群組或區塊的面積相減，再取絕對值。對於算出來的兩個群組的面積差異v1，將此差異值除以該兩個群組中面積較大的群組的面積，再乘上100，得到一個值v2；而對於兩個區塊的的面積差異v1，同樣將此差異值除以該兩個區塊中面積較大的區塊的面積，再乘上100，得到一個值v2。v2代表的意義可以視為該群組或區塊在新進影像以及重建的背景影像間的面積變化比例，因此v2必然小於等於100。若v2等於0表示該群組或區塊在新進影像與重建的背景影像中幾乎沒有變化，因此很有可能可以提供準確的移動向量，而把兩個群組或區塊的質心座標相減就是一個可能的候選移動向量。 在對所有的群組以及區塊做完以上的計算後，可以得到許多v2，但我們只注意數值小的v2，最理想的情況為0，這樣表示該v2是從非常穩定的群組或區塊所得到的結果。在本論文的實驗中，我們將所有v2小於等於5的群組或區塊所提供的移動向量當成可能的移動向量，因此會得到數個候選移動向量。在真實環境不穩定的考量下，藉由群組或區塊的質心相減所得到的候選移動向量可能無法十分精準，為了得到最準確的移動向量，建議可以對每個找出來的候選移動向量上下左右各擴大兩個像素，亦即一個候選移動向量會衍生出25 個候選移動向量。例如目前有一個候選移動向量其值為（100, 50），表示重建的背景影像相對於新進影像在x方向移動了100，且在y方向移動了50，我們對其上 下左右各擴大兩個像素，因此除了（100, 50）這個候選移動向量，會另外新增（98, 48）、（99, 48）、（100, 48）、（101, 48）、（102, 48）、（98, 49）、（99, 49）、（100, 49）、（101, 49）、（102, 49）、（98, 50）、（99, 50）、（101, 50）、（102, 50）、（98, 51）、（99, 51）、（100, 51）、（101, 51）、（102, 51）、（98, 52）、（99, 52）、（100, 52）、（101, 52）、（102, 52）這24個候選移動向量。

(41)

33 4.2 找出最佳移動向量 接著我們對4.1節中所找出來的候選移動向量各自作統計，找出能提供新進影像與重建的背景影像間最小差異度的候選移動向量為最佳移動向量。首先對每一個候選移動向量，將原來的重建的背景影像根據該候選移動向量移動到新的位置，意即我們根據該候選移動向量對齊重建的背景影像與新進影像，並且計算一個差異值跟一個總數值，差異值表示新進影像與重建的背景影像的差異度，總數值表示同時存在於新進影像與重建的背景影像的像素數目，也就是有重疊或重複出現的像素數目。差異值與總數值一開始為0，接下來對新進影像中每個像素，先以該候選移動向量判斷該像素是否有在重建的背景影像的範圍內，若不在重建的背景影像的範圍內則跳過該像素，繼續處理下一個像素；但若是在重建的背景影像的範圍內則將總數值加一，再依據下式計算差異值

D ＝ ∑x∑y｜Rb（x, y）－ Rf（x, y）｜＋｜Gb（x, y）－ Gf（x, y）｜＋｜Bb

（x, y）－ Bf（x, y）｜（4.4）

其中D表示差異值，Rb（x, y）表示重建的背景影像中座標為（x, y）的像素的紅

色值，Rf（x, y）表示新進影像中座標為（x, y）的像素的紅色值，Gb（x, y）表示

重建的背景影像中座標為（x, y）的像素的綠色值，Gf（x, y）表示新進影像中座

標為（x, y）的像素的綠色值，Bb（x, y）表示重建的背景影像中座標為（x, y）的

像素的藍色值，Bf（x, y）表示新進影像中座標為（x, y）的像素的藍色值。至於

式子（4.4）所包含的範圍則如圖4.1中黑色矩形所包含的所有像素，為將圖1.1(a) 與圖1.1(b)對齊後的示意圖，其中黑色的矩形表示同時存在於圖1.1(a)與圖1.1(b) 的像素，因此差異值所代表的意義即為黑色矩形中圖1.1(a)與圖1.1(b)的差異度，而總合值則代表該矩形的面積。

(42)

34 圖4.1 差異值與總數值的計算範圍。在計算完所有候選移動向量各自的差異值以及總數值後，將差異值除以總數值，即代表在一個候選移動向量下，每個像素在新進影像與重建的背景影像的平均差異度。我們選擇能提供最小平均差異度的候選移動向量為真正的移動向量。這樣的理由是對於錯誤的候選移動向量，因為無法對齊重建的背景影像到新進影像，將會導致原來該對應到新進影像中某個位置的背景像素被移動到其他的位置，使得新進影像中該位置的像素會被對應到錯誤的背景像素，這意味著新進影像中的像素與對應到的背景像素的顏色可能會差非常多，因為它們可能分別屬於場景中不同的物件，進而造成式子（4.4）中絕對值內的差值變得很大，使得差異值也會變大很多。因此對於錯誤的候選移動向量，其差異值一定會大於最佳移動向量所計算出來的差異值。圖4.2表示不準確的移動向量對差異值和總數值的影響，圖4.2(a)為重建的背景影像，圖4.2(b)為新進影像，且重建的背景影像相對於新進影像的移動向量為（-78, 78），圖4.2(c)～圖4.2(f)中左邊的圖示表示重建的背景影像根據不同的候選移動向量移到相對應位置的結果，而右邊的圖示表示不同的候選移動向量造成移動後的重建的背景影像和新進影像的對齊結果，其中藍色的像素表示式子（4.4）

(43)

（x 表示圖4. (c) （-7 的背形面 , y）｜超過 示重建的背 .2 不準確的移動向量（ 78, 78）造成至於將差背景影像與面積也會很過30的像素背景影像與新的移動向量對 0, 0）造成的成的結果，(f 差異值除上總與新進影像之很小，結果最，由圖4.2( 新進影像之 (a) 對差異值和總的結果，(d) f) 移動向量總數值，是之間的重疊最後的差異值 35 (e)可知最準之間的對齊越 (c) (d) (e) (f) 總數的影響。移動向量量（-80, 78）是為了避免大疊區域太小值反而會小準確的移動向越精準。 (b) 。(a) 重建的（-50, -50）造造成的結果大的候選移，因此式子小於小的候選向量有最少的背景影像，造成的結果果。移動向量可子（4.4）所需選移動向量少的藍色像 (b) 新進影像果，(e) 移動向可能會造成重需要計算的量所算出來的像素，像，向量重建的矩的差

(44)

36 異，因為小的候選移動向量表示重建的背景影像與新進影像之間重疊的區域很大，因此式子（4.4）所需要計算的矩形面積就會很大，進而造成差異值變得很大。所以我們需要正規化差異值，將選擇最佳移動向量的依據定義為對重建的背景影像與新進影像，能夠提供每一個像素最小平均差異度的候選移動向量。例如圖4.2(c)為移動向量（0, 0）造成的結果，其差異值為10333264，總數值為60480，平均差異度為170，圖4.2(d)為移動向量（-50, -50）造成的結果，其差異值為8057424，總數值為37530，平均差異度為214，圖4.2(e)為移動向量（-78, 78）造成的結果，其差異值為109456，總數值為26862，平均差異度為4，圖4.2(f) 為移動向量（-80, 78）造成的結果，其差異值為1046480，總數值為26640，平均差異度為39，由此可知最準確的移動向量能夠提供最小的平均差異度。 4.3 影像對齊與前景背景分割 在有了最佳移動向量後，將背景GMM根據此最佳移動向量移動到新的位置，再處理新進影像中每個像素，進而判斷出每個新進像素為前景或背景。在處理完所有的像素後，得到一張二值化影像，其值只有0或1，0表示為背景，而1表示前景，我們再利用附錄1介紹的連通物件搜尋法將此二值化影像中所有相連的前景區域（即值為1的像素）找出，並且計算其面積大小，若面積過小，則表示該前景區域可能為雜訊，因此須將這塊區域視為背景。刪除完所有面積過小的前景區域後，最後留下來的是面積夠大的前景物件。圖4.3顯示在有應用此步驟的情況下，能得到較不受雜訊影響的結果。為了處理攝影機些微旋轉對影像造成的影響，我們將在上一個消除雜訊步驟後所剩下的前景像素，與在重建的背景影像中相對應位置一定範圍內的GMM 做配對，若有一個GMM能夠成功的配對到該像素，便將該像素視為背景。這個步驟的代價是若前景物像素與相對應位置附近的GMM有顏色相似的情況，則該

動態攝影機下的前景背景分割

國

立

交

通

大

學

資訊科學與工程研究所

碩

士

論

文

動 態 攝 影 機 下 的 前 景 背 景 分 割

Separation of Foreground and Background for Dynamic

Cameras

研 究 生：邱永昌

指導教授：莊仁輝 教授

Separation of Foreground and Background for Dynamic Cameras

研 究 生：邱永昌 Student：Yung-Chang Chiu

指導教授：莊仁輝 Advisor：Jen-Hui Chuang

國 立 交 通 大 學

資 訊 科 學 與 工 程 研 究 所

碩 士 論 文

動態攝影機下之前景背景分割

學生：邱永昌 指導教授：莊仁輝 教授

國立交通大學

資訊科學與工程研究所

摘要

ABSTRACT

致謝

目錄

圖目錄

表目錄

一、 緒論

二、 建立用於影像對齊之重建的背景影像

三、 三種可用於影像對齊之影像特徵擷取

四、 影像對齊與前景背景分割

動態攝影機下的前景背景分割

研究生：邱永昌

指導教授：莊仁輝教授

研究生：邱永昌 Student：Yung-Chang Chiu

國立交通大學

資訊科學與工程研究所

碩士論文

學生：邱永昌指導教授：莊仁輝教授

一、緒論

二、建立用於影像對齊之重建的背景影像

三、三種可用於影像對齊之影像特徵擷取

四、影像對齊與前景背景分割