National Sun Yat-sen University Institutional Repository:Item 987654321/30060

(1)

行政院國家科學委員會專題研究計畫成果報告

建立於形態補償的視訊壓縮

Video compression by shape compensation

計畫編號： NSC 89-2213-E-110-023

執行期限： 88 年 08 月 01 日至 89 年 07 月 31 日

主持人：周本生中山大學電機系副教授

一、中文摘要 形態學是將影像中的物體當成一個集合，在數位形態學中的集合可明顯的表現出黑白或灰階影像的形狀。在形態學運算中，主要是由影像本身及結構元素兩者作運算。綜觀形態濾波器的特色在於改變形狀及運算簡單快速。在動態影像壓縮中，還原影像因為量化之程序可能會產生失真及變形，於是我們提出了在動態影像壓縮後，再對影像做形態補償 [1]，以改善影像品質。最後經由實驗證明，形態補償確實能達到改進影像品質之效果。 關鍵詞：位移補償 ;形態補償 ;形態濾 波器 Ab st r a ct

The shape transformation in this project is coded by the kinds of morphological operations to be applied. This processing is a type of operation by which the spatial form or structure of objects within an image are modified. A simplified gray morphological operation by finding the extreme value in the masked neighborhood is proposed for the shape compensation operation. The advantage of mask operation is thus kept for our gray image processing. In dynamic image compression, the error can be introduced in the quantization process. We suggest to do the morphological compensation after finishing the motion compensation in order to get the best morphological filter for the best compensation that is the purpose of the plan.

K eywor d s:motion compensation,

motion compensation, morphological operator 二、緣由與目的 隨著通訊事業的蓬勃發展，對於動態影像我們不僅要求要有高的壓縮率，也希望同時有高的視訊品質，我們希望在動態影像壓縮處理內加入少許資訊後，即使在相同的壓縮率下亦能達到更好的視訊品質。形態學 (morphology) 這個詞通常是指研究動物，以及設備的形狀和結構的述物學的一個分支。而數學形態學是抽取對表示和描述區域形狀有用的影像分量的一種工具。在實際運用上形態影像處理對於抓出形狀特徵，如角、邊或細化圖形得到簡單的骨幹線條特別有效，所以已成功地應用在工業檢測 [2]上。又由於其處理形狀變化的特長，也廣泛的應用到醫學影像如細胞的個數，心室的變化 [3,4]。 “ 位移補償 ” [5,6] 的原理來壓縮連續影像在時間上的多餘資訊。我們以區塊為單位，藉著位移估測在參考畫面中相對位置的某一範圍內找尋出最相近的區塊，並記錄此位移向量，還原時即可透過這些位移向量從參考畫面中找到對應的區塊。但因為往往還原之後影像變形、扭曲、或者我們希望還原影像能夠得到更好的品質，因此我們就提出了 “ 形態補償 ” 的觀念，利用形態濾波器來修飾

(2)

2 還原後的影像。再者，在動態影像壓縮處理過程中，因一般動態影像標準皆在位移估測之後，再對誤差資訊進行 DCT 轉換及量化。而經過量化的程序後，再解碼還原所得的影像會造成失真與變形，嚴重的程度端視量化時的粗糙精細與否。在本計畫中，我們在做完 DCT 轉換與量化後再加上形態濾波器，目的是為了消除量化後的失真，以求影像的盡善盡美。 三、研究方法 形態濾波器的特色決定在其核心 (kernel)，但核心太多且複雜，所以需對核心去做簡化基底 (basis)[7]．然而對於灰階影像，灰階權重視窗的值包含 0∼ 255，其結構元素太複雜且選民的決定並不容易，我們以切片方法來解決選民問題。 ( 1 )一種簡單的灰階形態濾波器 我們先由灰階擴張運算看起，擴張運算可表為下式： ) 1 . 3 ( } ) , ( ; ) ( ), ( | ) , ( ) , ( max{ ) , )( ( Λ Λ B A x y D D y t x s y x B y t x s A t s B A ∈ ∈ − − + − − = ⊕ 我們發現只要令 B(x,y)為下式的話 = ) , (x y B 0,-a<x<a,-b<y<b -∞ ,otherwise ，則 (3.1)式就可變為 ) 2 . 3 ( } ) , ( ; ) ( ), ( | ) , ( max{ ) , )( ( Λ Λ Λ Λ B A x y D D y t x s y t x s A t s B A ∈ ∈ − − − − = ⊕ 式 (3.2)正好是遮罩運算，所以在灰階形態補償時，我們均採用上式的特例。現在以一個實際例子來說明式 (3.2)如何進行遮罩運算。【例】擴張運算：輸入視窗被遮罩罩到之點取其最大值為輸出點。 97 98 99 100 101 102 103 104 105 1 0 1 1 1 0 0 0 1

I

♁A

=105

( 2 )以切片方法解決選民問題 由於灰階影像可以是為一連串二階影像的集合，故我們就想到了利用切片的方法來解決因為複雜的輸入視窗造成選民決定不易的問題，以下即為我們的做法：從 0 開始取基準點，在 3×3 之輸入視窗內之點，大於基準點則視為 1，反之為 0，而目標點也是一樣，如此一來我們就可以得到跟二階影像相同之選民及其喜好的關係。做完一個基準點之後即將基準點加 1 並重複上面的做法一直到基準點等於 255 為止。如此，我們便建立一個灰階影像的機率表，而且還可選出最佳濾波器而不必對現有之二階系統做大幅更動，利用上面的做法，必須對每一輸入視窗及目標點作 256 次切片。 (3)灰階切片之理論證明 要證明集合及函數之相通性，我們證明了 (3.3)式成立。定義 D(f,g)=max{g_x+ f(x):x∈D_f} 對任何之信號 f 和 g ， ) 3 . 3 ( ]) [ ], [ ( [ ) , (f g S D U f U g Λ Λ Λ Λ D = ) 上式的 D 是代表灰階之擃張運算，而 U 就是 unbra transform [8](U[f]={(x,y)|x∈D_f,y≤ f(x)})， S 則代表 −1 U 。 接下來說明為何灰階切片是正確 的。假設 f 及 g 為兩灰階函式， ] [f U 及U[g]分別為 f 及 g 的 unbra transform，由於U[f]已為集合形式，故可以為它作抽樣，在這裡我們用的是切片的觀念對U[f]抽樣，假設所有切片為 (X1,X2,X3,...)，所以U[f]= .... 3 2 1∪X ∪X ∪ X ，U[g]為所使用之遮罩濾波器，則 D(X1,U[g])， ]) [ , 2 (X U g D ， D(X3,U[g])… 就可視為對每一切片作擴張運算之結果，所以 ) 4 . 3 ( ]) [ ], [ ( ]) [ , 3 2 1 ( ]) [ , 3 ( ] [ , 2 ( ]) [ , 1 ( Λ Λ Λ Λ Λ Λ Λ Λ Λ Κ Κ g U f U D g U X X X D g U X D g U X D g U X D = ∪ ∪ ∪ = ∪ ∪ ∪ 式 (3.4) 說明了所有切片分別跟結構元素 U[g] 作擴張運算之後再取聯集，所得之結果會跟U[f]直接跟U[g] 作擴張運算一樣，證明了切片之做法 mask

(3)

是正確的。在 (5.3) 式中，我們可以發現，若集合形式之結構元素U[g]跟 ] [f U 作擴張運算為最佳之結果，則其 反轉換 g 及 f 作擴張運算也為最佳之 結果，這也證明由切片所建機率表選出之濾波器確實為最佳的。最後，我們就對灰階建機率表之過程作一整理： 四、實驗結果 我們對 150 張打桌球 (stennis) 作測試，對其做 MPEG 編碼和加入我們的方法作比較，其結果如下：整體平均： (1)Motion MAE/pix el=7 SNR=27.9 (2)Motion+Shape MAE/pix el=6.54 SNR=28.53 由實驗結果知，在加上形態補償後，我們的方法有比 MPEG 還要好。由於在選擇濾波器上佔掉了編碼許多時間並且提出了減少濾波器的方法，在這裡可以做個驗證，以下即為結果。濾波器數目 MAE/pixel SNR/pixel (db) 花費時間 (sec) 285 4.202 33.23 175 64 4.205 33.23 135 32 4.219 33.21 130 16 4.233 33.19 127 表 4.1 不同數目濾波器之統計結果 (ste nnis) 在壓縮率面：灰階函式 Unbra transform 二維集合集合抽樣 (選民) 機率表 (選民的分布) 切片圖 4.1(上)原始影像：stennis.74.yuv (中)經由位移補償後之還原影像 Motion Motion+shape 0 5 0 1 0 0 1 5 0 4 5 6 7 8 9 1 0 1 1 M A E p e r p ix e l 圖 4.2 全程的 MAE/pixel 曲線分布(stennis) Motion Motion+shape 0 5 0 1 0 0 1 5 0 2 4 2 5 2 6 2 7 2 8 2 9 3 0 3 1 3 2 S N R 圖 4.3 全程的 SNR 曲線分布(stennis)

(4)

4 在全像素和半像素方面： 五、結論 由於動態影像壓縮的位移補償、 DCT 及量化會對影像造成失真，在我們加入形態補償後，以改善這些失真，使影像品質更好。由實驗知，在低品質之影像，形態補償之效果較高品質之影像為佳，我們可以由兩種參數看起：一是 PQSCALE 的大小，二為使用全像素或半項素搜尋。 PQSCALE 越大時壓縮率高，但相對的失真跟變形狀況也會增加，此時形態補償正好可以發揮其改進形狀的優點，修正變形影像；相反的在 PQSCALE 越小時，由於還原影像品質已經非常好，改善之空間不大，所以形態補償雖然有改進，但幅度就沒有那麼高。全像素搜尋改善幅度較半像素搜尋高的理由也是一樣，故不再重複。在圖 4.5 之壓縮率與 MAE/pixel 的關係曲線中，32 組濾波器與 285 組濾波器之曲線幾乎為重合，這表示濾波器較少，誤差就會增大，但是由於資料量少所以壓縮率就會較高；相反的，濾波器數量較多，誤差就會減低，但壓縮率較低。可是濾波器少還有一項優點，那就是時間的減少，所以在應用上 32 組濾波器是較為實用的。 六、參考文獻 [ 1 ] R a fa e l C . G o n z a l e z a n d R i c ha r d E . W o o d s , “M o r p h o l o g y”, D i g i t a l I ma g e P r o c e s s i n g I ma g e , C o p yr i g h t 1 9 9 2 b y Ad d i s o n W e s l e y P u b l i s h i n g C o mp a n y, I n c , p 5 1 8 -p 5 4 8 .

[2]Jain,A.K.Fundamentals of Digital Image Processing, Prentice-Hall,Englewood Cliffs,N,J,1989

.[3]Sperry R.H.and Parker K.J. “Segementation of speckle images based on levelcrossing statistics” J.Opt.Soc.AM.A/vol.8,No.3/March 1991, pp.490-498.

[4]Klinger J.W.,Vaughan,C.L.and Andrews L.T. “

Segmentation of echocardiographic images using mathematical morphology”, IEEE Trans.on Biomedical engineering , vol.35, NO.11, NOV. 1988, pp925-933

[5]Ram Srinivasan and K. R. Rao, "Rredictive Coding Based on Efficient Motion Estimation," IEEE Trans. On Commun., Vol. COM-33,No.8, pp.888-896, Aug.1985.

[6]S.Kappagantula and K. R. Rao,"Motion Compensated Interframe Image Predicition, " IEEE Trans. On Commun.,Vol.COM-33,No.9,pp. 1011-1015, Sep.1985. [ 7 ] C h a r l e s R . G i a r d i n a a n d E d wa r d R . D o u n g e r t y, “B a s i s fo r K e r n a l ”, M o r p h o l o g i c a l M e t h o d s i n I ma g e a n d S i g n a l P r o c e s s i n g , P r e n t i c e H a l l , E n g l e wo o d C l i ffs , N e w J e r s y 0 7 6 3 2 . p 1 4 2 -p 1 4 6 . [ 8 ] C h a r l e s R . G i a r d i n a a n d E d wa r d R . D o u n g e r t y, “U mb r a t r a n s fo r m”, M o r p h o l o g i c a l M e t h o d s i n I ma g e a n d S i g n a l P r o c e s s i n g , P r e n t i c e H a l l , E n g l e wo o d C l i ffs , N e w J e r s y 0 7 6 3 2 . p 1 7 4 -1 8 -1 . 2 0 4 0 6 0 8 0 1 0 0 1 2 0 1 4 0 1 6 0 4 4 .5 5 5 .5 6 6 .5 7 M A E p e r p ix e l M otion+Shape(285 filters) M otion+Shape(32 filters) M otion 圖 4.4 壓縮率與 MAE/pixel 的關係曲線 5.8 6 6.2 6.4 6.6 6.8 7 MAE/pixel(full) MAE/pixel(half) Motion+Shape(285 filters) Motion+Shape(32 filters) Motion 6.54 6.63 7 6.25 6.29 6.41 圖 4.5 全像素和半像素之比較

(5)

National Sun Yat-sen University Institutional Repository:Item 987654321/30060

行政院國家科學委員會專題研究計畫成果報告

建 立 於 形 態 補 償 的 視 訊 壓 縮

Video compression by shape compensation

計 畫 編 號 ： NSC 89-2213-E-110-023

執 行 期 限 ： 88 年 08 月 01 日 至 89 年 07 月 31 日

主 持 人 ： 周 本 生 中 山 大 學 電 機 系 副 教 授

I

♁A

=105

建立於形態補償的視訊壓縮

計畫編號： NSC 89-2213-E-110-023

執行期限： 88 年 08 月 01 日至 89 年 07 月 31 日

主持人：周本生中山大學電機系副教授