• 沒有找到結果。

智慧型音視訊技術及多媒體應用─子計劃二 智慧型視訊處理及硬體架構設計(2/3)

N/A
N/A
Protected

Academic year: 2021

Share "智慧型音視訊技術及多媒體應用─子計劃二 智慧型視訊處理及硬體架構設計(2/3)"

Copied!
6
0
0

加載中.... (立即查看全文)

全文

(1)

行政院國家科學委員會專題研究計畫 期中進度報告

子計畫二:智慧型視訊處理及硬體架構設計(2/3)

計畫類別: 整合型計畫 計畫編號: NSC92-2219-E-002-017- 執行期間: 92 年 08 月 01 日至 93 年 07 月 31 日 執行單位: 國立臺灣大學電子工程學研究所 計畫主持人: 陳良基 計畫參與人員: 陳良基 報告類型: 精簡報告 處理方式: 本計畫可公開查詢

中 華 民 國 93 年 6 月 1 日

(2)

智慧型音視訊技術及多媒體應用

─子計劃二

智慧型視訊處理及硬體架構設計

(2/3)

Intelligent Video Signal Processing and Hardware Architecture Design

計劃編號:92-2219-E-002-017 執行期限:92/08/01∼93/07/31 子計劃主持人:陳良基 教授 Email: lgchen@cc.ee.ntu.edu.tw 執行機構:國立台灣大學電子工程學研究所 一、中文摘要 多媒體技術的演進,已經由原本以壓 縮技術為重心,逐漸轉為朝向傳輸、互動、 資料庫,及智財管理及保護等多方面發 展,而多媒體資料的處理,也由以往傳統 的以波形為基礎的處理轉變成以多媒體內 容為基礎的智慧型信號處理。本計畫將提 出一完整的智慧型視訊壓縯及傳送系統, 其內容包括了智慧型的前處理、智慧型的 視訊編碼、智慧型的通訊技術,以及能同 時兼顧高運算能力和彈性的硬體架構設 計,期能進而發展出一個適合智慧型處理 的硬體發展平台,從而提供一個從演算法 到硬體架構的整合解決方案。 ABSTRACT

Because of the development of large scale storage devices and broadband communication, the technology trend of multimedia signal processing is from compress technology to transmission, interactivity, database, and intellectual property management and protection, and from waveform based signal processing to intelligent signal processing. This trend is also the target of this project. In this project, a complete intelligent video compression and transmission system will be developed. It includes four main parts: intelligent preprocessing, intelligent video coding, intelligent video transmission, and platform-based hardware architecture of video coding system. The new techniques developed in this project can be the key and base technology of the future intelligent

multimedia processing. 二、緣由與目的 多媒體信號的編碼,已由早期以波形 為基礎的編碼,逐漸轉向以物件或是以模 型為基礎的編碼方式。而多媒體信號的處 理,也由儲存逐漸轉向多功能性方向、傳 輸、互動、資料庫、或是智財權管理及保 護的方向。也就是從傳統的壓縮技術不管 多媒體內容的處理方式,轉變成為先認知 多媒體內容進而加以處理的方式,也就是 所謂智慧型的處理,其中包括了智慧型的 編碼、資料存取、描述、保護,以提供使 用者更多的多媒體功能。而本研究計畫的 目的,就是建築在以往對於數位視訊技術 的演算法及硬體架構設計的基礎上,對於 智慧型多媒體處理中智慧型視訊技術的演 算法及硬體實現做深入的研究。本計畫的 重點,將放在視訊物件的前處理、編碼、 傳輸、及描述等較為前段的部分,也是在 智慧型視訊信號處理中,最重視即時性也 最為重要的基石。 三、研究方法與成果 本計畫將針對智慧型視訊處理中最為 重要也是最基礎的智慧型編碼和傳輸發展 其相關演算法及硬體架構。一個智慧型視 訊壓縮及傳送系統方塊圖如下圖所示。在 攝影機拍下視訊資料後,視訊物件前處理 單元會做切割及追蹤的動作,把視訊物件 切割出來,以利後級做以物件為基礎的智

(3)

慧型處理,包括了智慧型的編碼,以及利 用在編碼過程中獲得的相關物件資料做描 述,最後再把視訊物件傳送出去,而視訊 物件切割與追蹤、智慧型的視訊編碼及描 述、視訊物件的傳輸的相關演算法及硬體 架構設計就是本計畫即將要研究的課題。 Segmentation and Tracking Intellignet Video Coding Video Communication and Transmission 圖一、智慧型視訊壓縮及傳送系統方塊圖 此計畫所涵蓋的範圍,包括前級處理 的視訊切割與追蹤、使用場景精靈和二維 動 態 網 狀 之 智 慧 型 的 編 碼 、 適 用 於 MPEG-4 的硬體平台架構設計(以 simple profile 和 FGS profile 做為目標應用)、智 慧型的錯誤隱藏技術,以下將分別對各項 技術詳細說明研究方法及進行成果。 A. 智慧型視訊切割 我們在去年提出了智慧型視訊切割演 算法,其方塊流程圖如圖一。這套演算法 是以改變偵測(change detection)及背景登 記(background registration)為基礎的演算 法,其主要的構想就是不同於以往改變偵 測找尋畫面中「動」的部分,此方法找尋 的是畫面中「不動」的部分,也就是背景 的部分,再利用背景的資訊來幫助我們把 前景物件切割出來。另外此系統提供另外 兩種模式:影子消除模式、全域移動估計 模式;影子消除模式則是在輸入此系統 前,畫面會先以形態學梯度運算的技術消 除畫面中光影的資訊,只留下材質的資 訊,如此一來,物件切割就不會再受到影 子及光影的影響了。而藉由全域移動估計 模式可以使得即使攝影機在晃動下,我們 仍然具有很好的切割效果。根據這個演算 法,我們提出了相對應的硬體架構如圖 三 。 其 中 CDMBA 為 主 要 運 算 核 心 、 Programmable Binary Morphology PE Arrary 則負責型態學和後置處理的相關運 算,GRA 則是負責影子消除模式的運算。 Background Registration Frame Difference Background Difference Post Processing Object Detection Frame Difference Mask Background Difference Mask Initial Object Mask Background Registration Mask Current Frame Previous Frame Object Mask 圖二、視訊切割系統 GRA CDMBG Programmable Binary Morphology PE Array Binary Frame Buffer Control Frame Buffer Background Buffer Index Memory Program Memory Control Operation Parameters Operation Parameters Binary Mask Current

Frame Data On Chip

圖三、已提出視訊切割演算法之硬體架構 B. 智慧型視訊追蹤 在第一年的計畫之中,我們已對目前 已提出的視訊物件追蹤的技術做了全面性 的研究,而在本年度的計畫中,則是提出 如圖四的演算法流程。我們使用空間上的 資訊來做追蹤的演算法是比較有效率的。 而視訊物件追蹤在追蹤不同型態的物體時 會有極大的差別,我們所要追蹤的視訊物 件是人,而膚色是人的重要特徵,因此演 算法中針對膚色的部分進行分析。利用在 現存的研究中,膚色在 YCbCr 轉換後之 Cb-Cr 空間中有一個特殊的分布來做判斷 條件。因此我們所提出的演算法有非常好 的效果,可以準確的追蹤到人的位置。

(4)

圖四、物體追蹤演算法之流程圖 C. 場景精靈編碼 Sprite 的產生是 sprite 編碼系統中最為 困難的一部分,藉由消除連續影像間相對 的運動,便可利用拼貼的技巧將攝影過程 中拍攝到的背景物件加以組成一個整體的 場景稱為 sprite,如圖四所示。 圖五、背景物件 sprite Sprite Generator Background Reconstruction Difference Comparison Update Sprite Original Sequence Affine parameters sprite Reconsturcted Sequence (background) Difference Sequence Updated sprite Ballmask Sequence Object Mask Ball Mask Updated sprite 圖六、sprite 產生之系統方塊圖 在第一年中,我們以軟體實現了一個完整 的編碼系統,圖五則是我們今年提出的一 個更完整的系統詳細流程方塊圖,他不需 要我們先提供去除前景的影像片段、換句 話說它據有自行處理前後景分離的演算 法,使得我們可以從一個影片片段中組出 一個連續場景,進而可以切割前景物件、 進行編碼處理的一系列動作。 D. 二維動態網編碼

在 MPEG-4 的混合輪廓(hybrid profile) 中所提供的二維動態網(2-D dynamic mesh) 提供了一個智慧型前景物件編碼的新想 法。二維動態網編碼能提供更細緻、更高 維度、更複雜的移動補償,在某些情況下, 甚 至 可 以 不 用 做 補 償 剩 餘 材 質 編 碼 (residual texture coding)就可以達到人眼可 以接受的視覺效果,而且二維動態網能提 供視訊物件更高的可編輯性及內差能力, 也能提供視訊物件更為細緻的動態描述。 在這一年中,我們對目前二維動態網的演 算法做分析與研究,並且也找出不同演算 法的優缺點,相信在接下來的一年中接下 來就可以提出我們自己的演算法架構。 NB'(n) n+1 Left Frame (Reference Frame) Right Frame Dn (a) 第一階段 n n-1 n+1 n-w n-w-1 n-w+1 n+w n+w-1 n+w+1 W Left Frame (Reference Frame) Right Frame Dn (b) 第二階段 圖七、兩階段之二維動態網編碼 E. 適用於 MPEG-4 的硬體平台架構設計 根 據 我 們 之 前 的 分 析 要 完 成 一 個

(5)

MPEG-4 的系統,所需的硬體架構必須是 混合式的。因此我們提出了一個混合式的 MPEG-4 硬體架構,整體架構如圖六。系 統中有一個微處理器、一些陣列處理器, 其硬體架構如下圖所示: Video I/O Interface ME Module 64PE @100MHz MPEG4 CL2 SIMD DSP 100MHz (600MOPS ) Shared Memory Universal VLD, VLC, packetizer, Multiplexer Shared Memory

Memory I/F, DMA Controller

Shape Codec (CAE, CAD)

System Controller

Memory (VOP Buffer)

圖八、預計 MPEG-4 硬體架構 為能支援 MPEG-4 標準的多變性,此硬 體中必須要有可程式化的部分,此外,隨 著新功能的加入,可能會需要一些必要的 加速硬體模組,此系統必須要有開放的架 構並有能讓這些模組加入的介面,而此種 硬體的設計方式,正是所謂平台式設計 (platform based design)的概念。整個晶片 實現結果如圖九,詳細規格則列於圖十。 本 晶 片 其 運 算 處 理 能 力 為 MPEG-4 Simple Profile @ level 3,CIF Format, 30 fps。其面積為 5.1 mm x 5.1 mm ,採用 的是 TSMC 0.35 um 製程,功率消耗為 339.51mW,工作頻率 40MHz 就可以即 時運算 MPEG-4 SP@L3。 圖九、實作的 MPEG-4 晶片 Chip MPEG-4 Video Encoder

Specification Simple profile Level 3

Encoding Complexity 352 x 288 at 30 fps Technology TSMC 0.35 um 1P4M

Die Size 5.1 x 5.1 mm2

On-chip memory 39,080 bits

Off-chip memory 2,027,527 bits

Transistor count 828692 trans.

Working frequency 40 MHz Voltage 3.3V Power Consumption 339.51mW 圖十、MPEG-4 晶片規格 四、結論 本子計劃已達成第二年之預定目標, 在各方面都有相當不錯的收穫和成果。在 接下來的年度中,將繼續從事第三年之預 定目標,期泛用型 object segmentation 之 積體電路硬體實作。並且在各方面提出具 有創新性和效果較佳的演算法和架構設 計,同時進行計畫第三年中的相關系統整 合、相關硬體實作部分。 五、參考文獻

[1] Jim Brailean, Weiping Li, Jorn Ostermann, Ya-Quin Zhang,"Chapter 3 MPEG-4 Video Coding Standard", in "Circuits and Systems in the Information Age"

[2] Thomas Sikora, "The MPEG-4 Video Standard Verification Model", IEEE Transactions on CSVT, vol 7 , No.1, Feb 1997

[3] ITU-T Recommendation T.4, “Standardisation of Group

3 Facsimile Apparatus for Document Transmission.”

[4] Aljoscha Smolic, Thomas Sikora, and Jens-Rainer Ohm,

“Long-term global motion estimation and its application for sprite coding, content description, and segmentation,” IEEE

Tran. on Circuit and Systems for Video Technology, vol. 9,

no. 8, pp.1227-1242, December 1999.

[5] D. Zhang and G. Lu, “Segmentation of moving objects in image sequence: a review,” Circuits Systems Signal

Processing, vol. 20, no. 3, pp. 143–183, 2001.

[6] M. Kim, J. G. Choi, H. Lee D. Kim, M. H. Lee, C. Ahn, and Y.-S. Ho, “A VOP generation tool: Automatic segmentation of moving objects in image sequences based on spatio-temporal information,” IEEE Transactions on

(6)

參考文獻

相關文件

 不過以上所提的內容幾乎都會被現在的智慧型手機取 代,因此我們覺得這些功能能夠運用在一個沒有網路

Location Context Interpreter block (LeZi-PDA, etc.).. Foreground

Flash 動畫與視訊產生互動,例如加上字幕、音 效…等,也能以 ActionScript 來控制視訊的播放 效果,甚至藉由 ActionScript

• 與資訊科技科、常識科、視藝科進行跨 科合作,提升學生資訊素養能力。圖書

 畢竟無眾生  諸法中無礙   無戒無忍辱  亦無有毀戒   無智亦無慧  亦無非智慧 

潘銘基, 1999 年畢業於香港中文大學中國語言 及文學系,繼而於原校進修,先後獲得哲學碩士

張庭瑄 華夏技術學院 數位媒體設計系 廖怡安 華夏技術學院 化妝品應用系 胡智發 華夏技術學院 資訊工程系 李志明 華夏技術學院 電子工程系 李柏叡 德霖技術學院

智慧型手機的 Android