一個使用於移動估算的適應性非對稱樣本搜尋演算法
全文
(2) ⎧ ⎧1 ∪ 4 ⎪ X 軸( y = 0 ) ⎨ ⎩2 ∪ 3 ⎪ ⎪⎪ ⎧1 ∪ 2 P = ⎨ Y 軸( x = 0) ⎨ ⎩3 ∪ 4 ⎪ ⎪ p ⎪ ⎩⎪. 正移動向量相差在正負90度內的機率高達79.457% 至98.202%。此結果意味著我們不需採用完整的十 字型搜尋樣本,因此我們提出了一個以非對稱性樣 本 為 基 礎 的 演 算 法 稱 為 AAPS ( Adaptively Asymmetric Pattern Search)。經由我們的實驗顯示 在較動態的畫面中,AAPS較APRS提高了10~20% 移動估算的速度。本篇論文在第2章中將詳細介紹 本論文所提出的這個AAPS演算法。第3章將討論 AAPS整體效能評估結果。最後第4章則為本篇論文 之結論與我們未來的工作。. ,X > 0 ,X < 0 ,Y > 0 ,Y < 0. (1). ,p = 1,2,3,4. 表1 搜尋區域之測預區域命中率,經由full search 對所有標準測試樣本實驗結果 測試樣本 (Image sequence). 預測區域命中率(%). Coastguard. 0.92717. Container. 0.93743. Garden. 0.91820. Football. 0.79457. News. 0.94421. Salesman. 0.98202. ±90 度. 2. 適應性非對稱樣本搜尋演算法(AAPS) 2.1 搜尋樣本 AAPS演算法主要使用二種搜尋樣本:(1)適 應性非對稱樣本(Adaptively asymmetric pattern, AAP) , (2) 動 態 適 應 性 十 字 形 樣 本 (Dynamically adaptive rood pattern,DARP)。下面是這兩個搜尋 樣本的描述。 (1) 適應性非對稱樣本 AAP 也是一個具有適應性的搜尋樣本。比較 不同的是它為一非對稱性搜尋樣本,而且藉由選擇 特定的搜尋方向來減少搜尋的點數。如前所述,支 援區域Type D所提供目標預測移動向量與真正移 動向量相差在正負90度內的機率很高,根據此特性 我們可以使用一個非對稱十字形搜尋樣本來取代 完整十字形搜尋樣本,因此AAP根據目標預測移動 向量的象限來選擇所搜尋的方向。其中所選擇的方 向依相位分別有第1、2、3、4象限,以及第1∪2、 2∪3、3∪4、4∪1象限共八種,如圖2。此八種相 位根據目標預測移動向量的方向來決定,當目標移 動向量預測落在第1至4象限其一時,AAP則為一個 90度角搜尋範圍(圖3(a))。如果目標預測移動向量 落在水平之X軸或是垂直之Y軸上,則AAP為一個 180度角搜尋範圍(圖3(b))。AAP選擇相位P取決如 下式(1):. 圖2 AAP使用的八種搜尋區域. PreMV. Pattern size. (a)第1 象限 (b)第1∪2 象限 圖3 適應性非對稱樣本(AAP) 2.
(3) 試畫面所得實驗結果顯示,有52.76%~98.7%的移 動向量落在與中心距離為2的像素範圍內[15]。有 鑑於此,AAPS在畫面最左邊的巨集方塊使用一間 距為2的DARP。這將有利於快速地搜尋到水平或 垂直位置的向量。另外,位於畫面邊界的巨集方塊 大多屬於背景物件,它們通常有較小的移動距離, 所以亦不適宜採用較大的搜尋樣本。. AAP的大小則是根據目標預測向量座標的最 大值來定義AAP範圍長度 Γ : Γ = Max {MV Pr edicted ( x ) , MV Pr edicted ( y ) }. (2). 決定樣本的搜尋方向及大小後,便可建構出包含原 目標預測移動向量總共3個搜尋點做為AAP之搜尋 樣本。其中,假若目標預測移動向量剛好為0,則 此時只需搜尋中心點1個。圖2顯示出AAP與ARP 比較可節省1至2個搜尋點數。. 2.2 演算法 整個AAPS 步驟如下: 步驟1:首先判斷待搜尋巨集方塊是否為畫面之左 邊界巨方塊。若為左邊界巨集方塊則使用範 圍大小 Γ = 2 且含中心點共5個搜尋點的 DARP,找其最小方塊誤差(Minimum Block Distortion,MBD)位置後,跳至步驟3;若 非為畫面之左邊界巨集方塊則做步驟2。. (2) 動態適應性十字形搜尋樣本 一般情況下經過AAP第一次搜尋後,搜尋的 區域被帶到一個目標物件移動向量可能發生的區 域,為了能在本地區域找出一個最精確、誤差最小 的方塊,一個範圍較小且緊密的修正搜尋樣本是必 要的。相反地,面對畫面中物件鄰界的方塊或者變 動不定之物件,搜尋範圍有限的AAP有可能將搜尋 的區域帶到「錯誤」位置。此時如果使用一範圍較 小且大小固定之樣本,必會花費相當多的搜尋點數 才能找到最匹配的巨集方塊。為了將搜尋的區域快 速地帶回到正確的目標物件移動位置,必須利用一 個範圍大且稀疏的搜尋樣本來修正。為了因應這兩 種不同的考量,AAPS在第一回合搜尋後,便改用 了一個可動態變動大小的樣本DARP來繼續以後 的搜尋。DARP為一包含中心共5個點之對稱性十 字型樣本,其動態大小適應共分二種,(a)範圍大小 Γ = 1,(b)範圍大小 Γ = 2 ,如圖4。DARP適應範圍 大小 Γ 依預測修正係數(Predicted fixed coefficient) 改 變 , 如 式 (3) 。 其 中 預 測 修 正 係 數 ( Fixed _ Coef Pr edicteded )為支援區域Type D之DARP. 步驟2:根據目標預測移動向量,並參考式(1)及式 (2)來建構出所使用的AAP,並在此AAP 中 找出其MBD位置,然後做步驟3。 步驟3:此步驟使用一個DARP,依預測修正係數 ( Fixed _ Coef Pr edicteded )決定其範圍大小(如 為畫面左邊界方塊則預測修正係數為0),計 算其MBD。若其MBD 落於中心點,則此對 應向量為最佳匹配方塊位置之移動向量,並 記錄DARP 搜尋回合次數做為下一個巨集 方塊參考的預測修正係數;不然就將預測修 正係數減1 並重覆此步驟。. 搜尋回合數。 ⎧2,Fixed _ Coef Pr edicteded > 0 Γ=⎨ ⎩1,otherwise. (3). PreMV. (a)Pattern size = 1 (b)Pattern size = 2 圖4 動態適應性十字形搜尋樣本 此外由於在畫面編碼處理通常採列方塊優先 的循序計算方式(由左至右、由上至下),因此在畫 面中最左邊界方塊並沒有參考向量。根據真實世界 的畫面,巨集方塊的移動向量落於水平或垂直方向 的機率高於其它的位置[16],而且經過FS對許多測. 圖5 AAPS搜尋路徑圖例. 3.
(4) 較,整體效能改善率(SIR)提高了1.964%至19.170% 不等。這是由於在較靜態的畫面中,預測目標移動 向量大多為靜止或移動微小,此時對於AAP與ARP 這二種搜尋樣本之搜尋點數皆僅為原點1點,因此 AAPS選擇方向搜尋的AAP其優越性比起搜尋每個 方向的ARP並沒有太大的差異。相反地,在動態的 畫面中相鄰的巨集區塊經常有類似的移動方向,因 此AAP往往能在每個方塊中節省1個搜尋點,而且 一個可變的DARP亦能減少搜尋的回合數進而有 效提高搜尋效能。與DS比較起來其SIR亦提高了 56.448%至65.805%不等。另外與TSS比較,其SIR 更有提高61.214%至81.821%的高改善率。由效能 增益來看,AAPS與FS比較,有著105.60至189.10 大幅的改善,並同時維持少於0.08dB 誤差的重建 品質。 圖6至圖11分別為本實驗中六種測試樣本之 平均搜尋點數曲線圖。從圖中可看出本文提出的 AAPS 與ARPS比較,對於一些比較動態的畫面 如”Coastguard”、”Garden”、”Football”等有著較明 顯的效能改善率。. 圖5為一個AAPS搜尋路徑簡單圖例,其搜尋 視窗大小為15×15,搜尋方塊為非畫面中左邊界方 塊。其中1st step、2nd step,…,nth step代表移動估 計每一回合所搜尋的位置,而MVPre表示支援區塊 Type D中目標預測移動向量的位置(3,4),預測修 正係數( Fixed _ Coef Pr edicteded )為5,最後找到之移 動向量為(-2,2)。這個例子顯示一個方向預測錯誤 發生的情形,原目標預測移動向量位於第四象限, 但最後所搜尋的移動向量落於第三象限,由此可看 出一個動態的DARP是必須的。. 3. 實驗結果 在 本 文 實 驗 結 果 中 , 我 們 將 AAPS 應 用 於 MPEG-4編碼器上,所採用的所有標準測試樣本如 下表2,共6種。畫面編碼結構採取IPPP…IPPP,每 一 張 I 畫 面 間 隔 距 離 為 30 張 。 巨 集 方 塊 大 小 為 16×16,方塊搜尋範圍(Search range)為16(i.e.繞著中 心[-16,16]像素的搜尋視窗大小)。匹配準則在這 裡採用平均絕對值誤差(MAD)準則,因為它有比平 均 平 方 根 誤 差 (MSE) 準 則 有 更 小 的 計 算 複 雜 度 [10]。對於快速方塊匹配移動估算,其計算複雜度 則取決於每一個移動向量估計所需花費的平均搜 尋點數。 在此對本文所提出的AAPS分別與TSS、DS, 以及ARPS…等快速方塊匹配演算法比較。實驗結 果分別記錄在表3至表5中。其中表3為各種演算法 之方塊平均搜尋點數,表4則為搜尋效能增益之比 較,表5為重建後畫面之PSNR值。由表3顯示出方 塊平均搜尋點數AAPS<ARPS<DS<3SS<FS,本 論文所提出的AAPS與其它的演算法比起有最少的 平均搜尋點數。其中AAPS與效能較好的ARPS比. 表2 標準測試畫面樣本 測試樣本 解析度 (Image sequence) (Frame size) Coastguard 352×288 Container 352×288 Garden 352×240 Football 352×240 News 176×144 Salesman 176×144. 表3 方塊平均搜尋點數 Image sequence. FS. 3SS. DS. ARPS. AAPS. Coastguard Container Garden Football News Salesman. 1024.00 1024.00 1024.00 1024.00 1024.00 1024.00. 25.00 25.00 25.00 25.00 25.00 25.00. 20.34 13.29 21.40 22.26 13.47 13.09. 10.13 5.53 10.31 12.00 6.00 5.54. 8.39 5.42 9.05 9.70 5.70 5.43. 表4 搜尋效能增益 Image sequence. FS. 3SS. DS. ARPS. AAPS. Coastguard Container Garden Football News Salesman. 1.00 1.00 1.00 1.00 1.00 1.00. 40.96 40.96 40.96 40.96 40.96 40.96. 50.35 77.05 47.84 45.99 76.03 78.21. 101.08 185.18 99.28 85.36 170.59 184.79. 122.05 189.10 113.21 105.60 179.76 188.60. 4. 張數 (Length) 300 300 115 125 300 449.
(5) 表5 畫面平均PSNR(dB) Image sequence. FS. 3SS. DS. ARPS. AAPS. Coastguard Container Garden Football News Salesman. 31.31 33.94 28.96 29.56 33.28 33.07. 31.32 33.92 29.04 29.66 33.29 33.07. 31.33 33.92 28.96 29.66 33.28 33.07. 31.30 33.92 28.96 29.64 33.27 33.07. 31.30 33.92 28.95 29.64 33.27 33.07. 圖6 方塊平均搜尋點數(“Coastguard”). 圖7 方塊平均搜尋點數(“Container”). 5.
(6) 圖8 方塊平均搜尋點數(“Garden”). 圖9 方塊平均搜尋點數(“Football”). 圖10 方塊平均搜尋點數(“News”) 6.
(7) 圖11 方塊平均搜尋點數(“Salesman”). 4. 結論與未來工作. 參考文獻. 在這篇論文中,我們提出了一個新的快速方 塊匹配演算法,稱為適應性非對稱樣本搜尋演算法 (AAPS)。AAPS利用目標預測移動向量與目標移動 向量相差正負90度內的機率極高的特性,以選擇特 定搜尋方向的方式來減少搜尋的點數。在這種選擇 特定搜尋方向的方式來說,亦有預測錯誤或正確二 種情況。若目標移動向量落於選擇的相位上,對於 畫面中快速移動物件的方塊,DARP可依修正係數 來快速達到目標位置以加快搜尋效能或做精密的 搜尋。對於預測錯誤的情況發生時,使用DARP亦 能夠改善多餘的搜尋點數。由此可知道對於AAPS, DARP有其使用的重要性。目前我們已經將AAPS 應用在MPEG-4視訊編碼中,實驗的數據顯示証 明,相較於TSS、DS、ARPS,AAPS有較少的方塊 平均搜尋點數,而其所重建的影像亦有很高的 PSNR值,所以AAPS是一個相當有效率的快速方塊 匹配演算法。 近年來一些視訊的應用如影像電話、訪客對 講系統,以及隨選視訊服務(Video on demand,VOD) 如隨選影片(Movies on demand,MOD)[13]、遠距 教 學 服 務 (Distance learning)[6] 、 視 訊 會 議 服 務 (Video conference)[7]等等都必須經由壓縮的處理 來減少資料的儲存以及網路傳輸量。對於MPEG-4 這種以移動補償為基礎的視訊編碼技術標準,在方 塊匹配移動估算運用BMAs雖能加快編碼效能,但 是當視訊編碼對象為一現場直播的高解析度(如 640×480或1024×768)畫面時,以目前的PC或工作 站的機器對高解析度的影像進行壓縮,仍不足以達 到即時性的編碼。解決的方法可利用平行運算的技 術。我們未來將在計算叢集上設計與實現一個即時 性的MPEG-4平行編碼器[12][20]。. [1]. [2]. [3]. [4]. [5]. [6]. [7]. [8]. [9]. 7. “Information Technology—Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to About 1.5 Mbit/s: Video”, ISO/IEC 11 172-2 (MPEG-1 Video), 1993. “Information Technology—Generic Coding of Audio-Visual Objects” Part 2: Visual, ISO/IEC 14 496-2 (MPEG-4 Video), 1999. “Information Technology—Generic Coding of Moving Pictures and Associated Audio Information: Video”, ISO/IEC 13 818-2-ITU-T Rec. H.262(MPEG-2 Video), 1995. C. H. Cheung, L. M. Po, “A Novel Cross-Diamond Search Algorithm for Fast Block Motion Estimation”, Transactions on Circuits System for Video Technology, Vol. 12, No.12, Dec. 2002. pp.1168-1177. CCITT SGXV, “Description of reference model 8 (RM8)”, Document 525, Working Party XV/4, Specialists Group on Coding for Visual Telephony, June 1989. G. Bressan, R.M. Silveira and W.V. Ruggiero, “A Framework for Distance Learning Employing Video on Web Environment”, International Conference on Technology and Distance Education, Fort Lauderdale -Florida, June/1999. ITU-T Recommendation T.120. Introduced to Audiographics and Audiovisual Conferencing.1996. J.R. Jain and A.K. Jain, “Displacement measurement and its application in inter-frame image. Coding”, IEEE Transactions on Communication, Vol. COM-29, pp.1799-1806, Dec. 1981. L. M. Po, W. C. Ma, “A novel four-step search algorithm for fast block motion estimation”,.
(8) [10]. [11]. [12]. [13]. [14]. [15]. [16]. [17]. [18]. [19]. [20]. IEEE Transactions. Circuits System for Video Technology, Vol. 6, pp. 313–317, June 1996. Lai-Man Po, Chok-Kwan Cheung, “A new center-biased orthogonal search algorithm for fast block motion estimation”, TENCON ‘96. Proceedings. 1996 IEEE TENCON. Digital Signal Processing Applications, Vol. 2, 26-29 Nov. 1996 pp. 874 – 877 Vol. 2 M. Ghanbari, “The cross-search algorithm for motion estimation”, IEEE Transactions on Communications, 38 (7), 950–953, Aug. 1990. Miguel Ribeiro, Oliver Sinnen, Leonel Sousa,” MPEG-4 Natural Video Parallel Implementation on a Cluster”, Image and Video Coding, RECPAD2002, Page:3 P. Venkat Rangan, Harrick M. Vin, Srinivas Ramanathan. “Designing an On-Demand Multimedia Service.”, IEEE Communications, Vol 30, No. 7, July 1992. R. Li, B. Zeng, and M. L. Liou, “A new three-step search algorithm for block motion estimation”, IEEE Transaction. Circuits System for Video Technology, Vol. 4, pp. 438–442, Aug. 1994. S. Zhu and K.-K. Ma, “A new diamond search algorithm for fast block-matching motion estimation,” in Proc. 1997 Int. Conf. Information, Communications and Signal Processing (ICICS), Vol. 1, Sept.9–12, 1997, pp. 292–296. S. Zhu, K.-K. Ma, “A new star search algorithm for fast block-matching motion estimation”, in Proc. Workshop on Very Low Bitrate Coding (VLBV), Oct. 8–9, 1998, pp. 173–176. Standardization Sector of ITU, Video Coding for Low Bitrate Communication, ITU-T Rec. H.263, Mar. 1996. T. KOGA, K. IINUMA, A. HIRANO, Y. IIJIMA, T. ISHIGURO, “Motion-compensated interframe coding for video conferencing”, in Proc. NTC 81, pp. C9.6.1-9.6.5, New Orleans, LA, Nov. Dec. 1981. Yao Nie, Kai-Kuang Ma, “Adaptive rood pattern search for fast block-matching motion estimation”, IEEE Transactions on Image Processing, Vol. 11, Issue 12, Dec. 2002 pp. 1442 - 1449 Yong He, Ahmad, T., Liou, M.L., ”MPEG-4 based interactive video using parallel processing”, Proceedings. IEEE International Conference on Parallel Processing 1998, 10-14 Aug. 1998, pp.329 – 336. 8.
(9)
相關文件
• 我們通常用 nD/mD 來表示一個狀態 O(N^n) ,轉移 O(N^m) 的 dp 演算法. • 在做每題
• 一個簡單有效的 Hash function,又稱 RK 算法 (Rabin- Karp Algorithm/ Rabin fingerprint ).
• The abstraction shall have two units in terms o f which subclasses of Anatomical structure are defined: Cell and Organ.. • Other subclasses of Anatomical structure shall
西元 1998 年,G oogle 的創辦人之一賴利佩吉發表了網 頁排序的演算法,涵蓋 G oogle
“A Comprehensive Model for Assessing the Quality and Productivity of the Information System Function Toward a Theory for Information System Assessment.”,
F., “A neural network structure for vector quantizers”, IEEE International Sympoisum, Vol. et al., “Error surfaces for multi-layer perceptrons”, IEEE Transactions on
Muraoka, “A Real-time Beat Tracking System for Audio Signals,” in Proceedings of International Computer Music Conference, pp. Goto, “A Predominant-F0 Estimation Method for
Ahmad, A Variable Block Size Motion Estimation Algorithm for Real-time H.264 Video Encoding, Signal Processing: Image Communication,