視覺導向錯誤補償之硬體架構設計

三、研究方法及成果

3.3 視覺導向錯誤補償之硬體架構設計

本計畫之系統架設在無線網路上，需要做大量資訊傳輸。但受限於無線網路的頻寬有限，因此資料壓縮是不可或缺的。以現階段而言，H.264 是最有效率的壓縮工具，能以最小的頻寬傳輸品質最好的影片(video)。然而，無線網路很容易受到雜訊的干擾，而 H.264 標準中的 entropy-coding，intra/inter prediction 機制，會使傳輸中的影片很容易因為一個位元產生的錯誤，而擴散出去，對人眼視覺感覺不適。現階段而言，解決方法大致可分成以下三種: 1. 重傳(Retransmission):也就是重新傳輸發現是錯誤的封包。2. 錯誤更正碼(FEC)或多餘封包(redundancy packets):這類的方法是藉由加入多餘的資訊在封包中，使錯誤產生時還有可能更正回正確的封包。FEC 就是在封包的開頭加上錯誤更正碼，當封包中的某些位元產生錯誤時有發現甚至有一定改正的能力。 Redundancy packets 可以使得在某些封包遺失下還能還原。舉例來說，原本一個影片只需要七個封包就可以包含所有資訊，但我們可以加入額外三個封包，這樣在接收端我們只要收到這十個封包其中的七個就可以還原正確的影片。3.錯誤補償(Error concealment):雖然傳輸的過程中產生的錯誤會造成一些資訊的遺失，但可以利用正確接收的到部份來補償，包括空間(spatial)和時間(temporal)上的資訊。其中空間上的資訊指的是同一張影像(frame)上

的正確部份，而時間上的資訊是指前面幾張影像的正確部份。因為錯誤的部份跟鄰近影像有很大的相關性，所以可以利用周圍的資訊來補償錯誤的部份。以上三種方法，前兩種都會對本來就已經擁擠的無線網路造成更大的負擔，但在解碼器端的錯誤補償法卻不會，因此最後我們選擇錯誤補償法來處理傳輸過程中封包遺失或錯誤發生的情況。

3.3.2 文獻探討

現今已經有很多人提出錯誤補償相關的演算法，大致可分成空間錯誤補償(spatial error concealment) 、時間錯誤補償 (temporal error concealment)以及同時使用上述兩者的空間時間補償法。

空間錯誤補償通常用來補償壓縮後的 I 影像 (intra-frame) 或者是當場景轉移 (scene change)的時候，因為 I 影像沒有移動向量 (motion vector)，沒有辦法直接跟前一張作對應，而場景轉移則代表前一張影像跟目前這張影像相似性不高，所以只能利用空間上的關聯性。而時間錯誤補償通常能得到比較好的效果，但是需要很好的去預測遺失的移動向量，

通常使用在 P or B 影像上。若有時前一張影像也不見得能找到好的對應，所以就有所謂空間時間的補償法，來在兩者之間取得平衡。在這篇 paper 裡，我們主要是針對處理 I-frame 的演算法來做探討。

首先是Wang et al. [26]所提出的演算法，

也是目前應用在H.264上的方法。作者利用錯誤的區塊 (Macroblock)周圍正確的像素值來內插遺失的資訊，其權重反比於其與遺失位置的距離。Xu and Zhou提出使用具有方向性的內插法，使得遺失區塊的方向性可以被還原 [27]。Agrafiotis et al.把周圍區塊邊界的角度分成八個方向，計算角度分布的亂度，若亂度太大則為避免延伸出錯誤的邊界反而使缺陷更加明顯，就不會使用方向性的內插法[28]。

在[29][30]兩篇論文中，周圍區塊會先依據像素值的分佈分類，然後會選擇適合的演算法來補償某一類的區塊。然而，以上這些演算法只能處理小範圍的遺失區塊，但都沒有讓大範圍的遺失區塊達到使人眼接受的程度。所以我們使用一個在電腦視覺領域發展多時的影像補償法，也就是＂image inpainting＂。

圖十六 Image inpainting 說明

這種演算法已經被很多相關論文證實錯誤區塊經過補償後，觀看者很難一眼辨認出錯誤的區域在哪裡。如同圖十六所示，對一張影像來說，Ω (圖十六中的黃色部份)是錯誤區塊所在的區域；∂Ω(橘色部份) 是Ω 的邊界；θ ( 白色部份 ) 是正確區塊所在的區域。在 exemplar-based image inpainting演算法一開始必須要決定每個邊界點的先後次序(priority, P(p))，利用以下公式:

P(p) = C(p) × D(p) (1) 其中C(p)代表可靠度，是p點周圍點可靠度的平均值。對於正確區塊來說，其中每一點可靠度都起始為1，而錯誤區塊點可靠度則設為0。

D(p)是與周圍點分布有關的條件，和周圍邊緣 (edge)強弱成正比。簡單來說，若周圍的邊緣越明顯，則D(p)會比較大。Patch(Ψ )是這演算法的基礎運算元，其大小(patch size)由使用者來定義。它是以上的點為中心，張出長寬皆等於patch size的正方形。然後這個邊界點的

先後次序就是由這個小正方形裡頭的點來決定。每個邊界點所張出的patch的順位都決定好後，就由最高的開始補起找一個在正確區域裡 最接近的patch。如同圖十六， pΨ 有最大的次 序值因為有一個很明顯邊緣在附近，而 qΨ 是在定義好的搜索範圍之中，與它最接近的 patch。用式子表示如下:

其中 d(.)是兩個 patch 間的距離函數，定義為兩者像素相減絕對值的累加 (SAD, sum of absolute difference)。最後，Ψ 就會貼到 pq Ψ 範圍裡，並取代那些本來是錯誤的像素。並且會 把那些位置的點之可靠度設成 pΨ 內所有點可靠度的平均值。同樣的步驟重複不斷的運作直到沒有任何沒有像素值的點就可以完成這個演算法，更多的細節可參照[31][32]兩篇論文。

3.3.3 研究目的

雖然 image inpainting 這個演算法能大幅改進錯誤補償的效果，但是卻無法滿足每秒三十張影像的即時運算需求(現在的演算法做一張影像需要的時間至少也要數秒，錯誤區域若比較大甚至要耗費數分鐘的時間)，因此需要硬體的加速。但原本的演算法要做成硬體卻會造成以下兩個問題:

1. 需要大量記憶體，成本太高 2. 執行時間和次數是不可預測的

這兩點使得硬體的設計極為困難，為此我們提出了一個以一個個區塊為基準的演算法，來降低記憶體的使用並把執行時間和次數控制在一定的數量上。重點是，也不會降低補償影像的品質。所以本研究的目的就是提出一個適於硬體的image inpainting演算法，使得錯誤補償即時運算的需求能被滿足，同時補償的結果能比現有的演算法使人眼更舒服。

3.3.4 研究方法

圖十七是提出演算法的流程圖。由論文 [33] ，可知道如何預測錯誤區域的結構性 (structure)對於錯誤補償是非常重要的。所以一開始我們提出了一個延長邊緣的機制，依據周圍正確區域的邊緣的方向性和強度來預測錯誤區域的邊緣並延伸出來。舉例來說，圖十八中的黑色點代表的就是依據周圍已存在的邊緣(實線)延伸出的邊緣點。有了這些結構性的資訊，就可以預先知道要先補那些點來維持結構性，所以公式(1) 中的D(p)就可以被省略簡化為公式(3):

其中| p|是 pΨ 的面積。此外，為了更加減少硬體成本，image inpainting的流程不在是以整個錯誤區域為整體，而是分割成一個個區塊來處

理。這樣的話，晶片內的記憶體就只需要存目前處理區塊附近一定範圍的資訊，而且運算所支援的遞迴也只需要支援一個小區塊的完成，比原先來得容易控制得多。

圖十七我們提出之演算法流程圖

此外，為了維持邊緣的連續性，第二步動態決定目前要補償的區塊是不可或缺的。如同圖十八所示,只要我們從號碼較小的區塊補到號碼較大的區塊，並在每個區塊的補償過程中先從那些延伸出去的邊緣點開始，那麼這些邊

緣的連續性就可以像原本的演算法壓一樣連接起來。選擇完要補的區塊後，會開始spatial image inpainting 或 mixed spatial-temporal image inpainting依據前一個影像是否存在或有場景轉移的情況發生。但這張I影像是整個影片的第一張或者發現前一張影像跟這一張沒有什麼關聯性。也就是場景轉移產生時，會選擇spatial image inpainting，只會利用到目前影像的資訊來補償，反之則進入mixed spatial -temporal image inpainting，也就是同時利用空間和時間上的資訊。關於各項機制細節如下所述:

圖十八邊緣延長.

1. 邊緣延長 Edge Extension

這個機制的目的是延長正確區塊內的邊緣到錯誤區塊中來得到結構資訊。由論文[34]

我們可以得知，邊緣的強度和方向性可由 Sobel邊緣偵測器計算出來。然後在正確區塊和錯誤區快交界處，強度在3 x 3範圍內最大的點會沿著原本邊緣方向被延長到錯誤區塊內，延伸長度正比於其強度。

2. 動態區塊次序 Dynamic Order Decision 補償次序並不是依照 raster-scan 的次序，因為那樣無法保證邊緣的延續。選擇區塊的方式改變為由有最強邊緣經過的區塊開始且最接近正確的區塊。以下是一些依循的規則:

(1) 找出最靠近正確區塊的那一列 (2) 計算這一列裡每個區塊的次序值 (3) 選擇次序值最高的區塊

次序值按照以下條件來決定: 若那區塊只有延伸至正確區塊會以補償區塊的邊緣會最先處理；若有來自錯誤區塊延伸邊緣的區塊則會等周圍補完再補。若條件一樣，則以區塊裡面的邊緣點較多者優先。

3. Spatial Image Inpainting

這個機制是要在沒有前一張影像的資訊下補償區塊的方法。首先，patch的長寬和搜索範圍要先定義，這部分會依據周圍區塊的特性而動態調整。舉例來說，當周圍的區域很平坦，

邊緣不多時，長寬就可以設大一點，搜索範圍也可以小一點。反之，當周圍的特性很複雜，

如細緻的花紋，這時長寬就要小一點來保存材質的特性。再來，為了要保持連續性和類似性，補償的流程會切分成三層。第一步會先從延伸出去的邊緣點開始找尋對應的patch，在來才是所有的邊界點，不過要貼上去之前會先檢查相減絕對值的平均值是否小於某個標準，否

在文檔中適用於異質無線網路環境之前瞻MoIP手持裝置SoC設計(1/3) (頁 12-17)

三、 研究方法及成果

3.3 視覺導向錯誤補償之硬體架構設計

三、研究方法及成果