前景與背景之訊切割與壓縮的相關研究探討

針對單一畫面中物體之切割，已經有許多方法被提出，這些方法可以根據不同的影像特徵（如顏色、紋理、灰階強度），切出符合這些特徵的物體，然而切割結果的穩定度相依於影像的特性而有好壞之分。在視訊檔案之中，單獨使用空間資訊所產生的切割結果略顯薄弱，如果可以加入時間域上的資訊（如運動資訊），便可增加切割的強固性。

3.1 利用空間的資訊對靜態影像做切割

一種常見的方法則是以區域為基礎（如Region Growing）[12]，找出空間上特徵相同的區域，但此方法對於邊界的切割較不穩定，因為對於臨界值的選取亦較困難。為了切割出物體的輪廓，Snake Model[13]亦經常被使用。Snake Model 的缺點是必須要先以人工的方式，在物體的周圍圈出一個初始輪廓，然後根據Snake Model 的內部力與外部力去逼近物體的輪廓。另外 Snake Model 也常常需要調整內部力與外部力的權重參數，以便適應不同特徵的影像。另外分水嶺演算法（Watershed algorithms）[14]亦經常被使用，分水嶺演算法是利用注水原理，從低處的像素開使用高處成長，而高處的地方通常是影像中的物體邊界，因此在物體邊緣處停止注水可以找到物體的切割。J. Malik 提出了使用 Normalized Cuts[15]來切割影像，主要的觀念是把一張畫面建構成一個加權圖，每個像素與像素之間會依照其相似關係而有一個權重。在切割的時候，一次的切割會切出兩群物體，其考慮的依據是去掉加權較小的邊並使同一群內的物體有最大的加權，

如此一來比較相似的像素會被切割在一起，然而使用Normalized Cuts 切割影像的時候，同一個物體有可能被切成幾個破碎的部分。

3.2 利用時空的資訊對視訊影像做切割

為了切割視訊影像，時域上的資料是非常有用的資訊，畫面中的物體運動是最常被拿來使用的。針對攝影機為固定的情況下，切割的方法會比攝影機在運動的情況簡單，最常使用的方法是連續兩張畫面的相減，用此可以偵測出畫面中有物體運動的區域，做為初步切割的結果。[16] [17]同樣是利用了兩張畫面間的差異對物體做切割，為了增加可靠性，[16] [17]會累多張積畫面的差異資訊再做切割。[18][19]推導了機率函數，將影片中相似的位置、顏色、運動等，判斷出相似的部分作群集，對不同特性的物體作切割。而[20]同樣是使用Normalized Cuts 的方法，只是在建構加權圖時，考慮了運動的資訊做權重。

在攝影機不為靜止的狀況，對視訊畫面切割最為困難，[21]使用了物體追蹤與圖形識別的方法來切割運動的物體，此方法的好處是在物體有變形或者遮蔽時，仍然可已有不錯的切割效果，但是第一次步驟必須先用另外的方法做一個初始的切割，之後才可以使用物體追蹤的方式。[21]中並沒有提到一個強固的初始切割方法，而初始切割的好壞大大的影響了後續切割的結果，這一部分是仍需要改進的地方。[22]使用了仿射模型（Affine Model）來估測物體的運動，他的做法是每塊區域估計一組仿射參數，之後再合併仿射參數較像的鄰近區域。但是實際合併區域的時候，有可能屬於同一個物體卻不會被合併情況發生，因此造成同一個物體會被切割成許多的區塊。[23]同樣也利用了運動的資訊作為運動物體之切割，為了增加運動資訊的強固性，[23]所提出的方法必須要累積數張畫面間的運動資訊。接下來，求出具有不同運動之物體個數，並給每一個物體設定一組初始的仿射參數，來代表每一個物體。最後，推導出一個機率函數，函數所定義的是每一個像素屬於某個物體的機率，因此可以把每一個像素分類，對不同的物體作切割。[23]所提出的方法中，初始仿射參數的設定是一個重要的部分，另外，

具有不同運動的物體個數之求得也相當重要，由於這一方面的方法不穩定，造成有些的運動物體並沒有被切割出來。

3.3 視訊壓縮的相關探討

與壓縮效能相關的研究有可調式編碼（Rate Control Coding）[24]，在編碼時所考慮了的應用環境因素來調整編碼的效果，也就是彈性的使用多種編碼方式，再依據當時的一些條件，如: 頻寬、解析度等等的要求來進行編碼控制，這類方法著重在原來標準內的編碼工具的功能調整。另外在 MPEG4 包含了 Sprite Coding[25]的編碼技術，目的是對於每個畫面中重複出現的部分只做一次處理，

進而減少重複編碼的情況產生，如此一來，便可以減少整體的壓縮時間與壓縮後的資料量，當每個畫面間的重複部分越大時，壓縮的資料量更會明顯的減少。然而在進行Sprite Coding 時，必須要有每張畫面切割好的遮罩當作輸入以做為輔助的編碼工具，如此壓縮的資料量與畫面的品質才會好，因此對於 Sprite Coding 的壓縮技巧上，視訊切割是一個重要的步驟。[26]提出了對I 畫面的預測模式做改善，可以在畫面品質沒有大量減少與資料量沒有大量增加的情況下減少I 畫面的壓縮時間；與[26]所提出的方法不同的是，本論文所提出的方法是針對 P、B 畫面的區塊選擇作改善，以減少壓縮的時間。

在本章，我們介紹了不同的切割方法與其在壓縮上的應用，本論文亦提出了一套視訊切割與壓縮的方法，並利用在現今視訊壓縮標準H.264 上，其最後的目的希望能夠提升壓縮資料的訊號雜訊比（PSNR）、降低位元率（Biterate）與加快編碼速度（Coding Speed）。

第四章 H.264 壓縮工具之分析、壓縮效能

在文檔中利用階層分解之視訊壓縮 (頁 20-23)