第一章緒論

(1)

第一章緒論

1.1 研究動機

由於積體電路的進步，使得周邊的數位產品更加輕巧。在數位儲存方面，SD 或 CF 卡的容量雖已達”Giga”等級，但是對於大量影像或是長時間的視訊資料而言，長期的使用勢必造成容量不足的現象。JPEG(Joint Photographic Experts Group)與 MPEG(motion picture expert group)協會分別訂定出一套靜態影像與視訊的規格。在視訊方面，為減低空間的相似性，

將相鄰兩畫面中所對應的相同區塊，藉由紀錄移動向量與差值影像，來減低所需儲存的資料，進而達到資料壓縮的效果，此一動作稱之為動態估測 (Motion Estimation)。現今存在的快速動態估測演算法中，其計算量仍然佔據相當大的計算量。因此，如何改良相關演算法與減低計算量是我們的研究動機。

1.2 研究目的

近年來在消費性電子裡，數位相機為最具代表性的產品之一，現階段的相機除了具備基本的照相功能外，尚還附加攝影的功能。在壓縮方面，

多數的相機大多採用 M-JPEG(Motion Joint Photographic Experts Group)格式，對於相似性極高的連續影像而言，是相當沒效率的。有鑑於此，此相機平台採用 MPEG-4 的機制，並且使用到相鄰兩畫面間的相似性，利用動態估測的機制，進而增加壓縮效率。在 MPEG-4 的機制中，對於動態估測並沒有明確的訂立一套標準，並且由實驗發現，動態估測佔據了高達 90%

的計算量。因此，本研究針對此一瓶頸與數位相機的硬體規格，提出一個適用於此數位相機之新式演算法。

(2)

1.3 發展環境

1.3.1 軟體模擬環境(XviD)

在模擬方面，我們採用 XviD 做為發展環境。XviD 是一個針對 MPEG-4 所撰寫的公開程式碼，編譯環境採用微軟所提供的 Microsoft Visual C++

6.0。因此，將新的演算法植入此一平台中，便可得到初期的驗證。整個 XviD 的流程如圖 1 所示。輸入影像由”Main”開始執行，一開始

在”enc_main()、Xvid_encore()、enc_encode()”等部份做相關變數設定，如影像記憶體配置、量化値與量化表、影像格式等等，之後便開始作畫面的編碼。由於我們使用的畫面格式僅含 I 畫面與 P 畫面，此流程圖中僅介紹此兩個的流程。MPEG-4 對於每一個畫面都有其指定的檔頭資訊，例如畫面的大小、採用的模式(Inter-mode 或是 Intra-mode)、量化表(有分 H.236 或是 MPEG-2)，以利解碼端之解碼。在”FrameCodeI”中指的是將輸入影像視為 I 畫面，也就是整張畫面進行編碼中不參照前後張的影像資訊，此模式中包含 VOL(video object layer)與 VOP(video object plane)兩個檔頭，其中 VOL 主要記載著一個畫面之序列資訊。

在”MBTransQuantIntra”中主要執行 DCT、Q、IDCT、IQ 等等動作，

將輸入影像資訊做完 DCT 與 Q 後，此資訊便是經過 VLC(Variable length coding)後便為 Bitstream 的資料，在 IDCT 與 IQ 中，便是將反轉換的資料存起來以便做動態估測之用。在”MBPrediction”中，採用 AC/DC 預測方式，

主要是為了消除方塊間之相關性(correlation)。最後在”MBCoding”即針對最後的資料作可變長度編碼，也就是熵值編碼(Entropy Coding)。

在”FrameCodeP”中與”FrameCodeI”最大的不同有兩個地方；

(3)

增加了動態估測與動態補償的功能。其中，在動態估測方面，XviD 已經內建了三個搜尋演算法，分別是鑽石演算法(Diamond search algorithm)、進階鑽石演算法(Advanced Diamond search

algorithm)、方陣演算法(Square search algorithm)等等。本研究主要的應用方面便即借用動態估測的層面，將新式演算法植入其中，

以獲得初步之實驗成果。藉由相關數據來推測是否適用於相機平台中。

Start

Command line parsing Initial setting Reading data

Encode mode setting

Analyzing MB Encoding

frame

VLC Interpolation

FrameCodeI FrameCodeP

enc_ main ( xvid_ encraw.c)

Xvid_ encore (xvid.c)

enc_ encode ( encoder.c)

BitstreamWrite- Vop Header

Motion- Estimation

Motion- Compensation

MBTransQuant- Inter

MBPrediction

MBCoding

Output Data Remove correlation

between Blocks

VLC

BitstreamWrite- VolHeader

BitstreamWrite VopHeader

MBTransQuant- Intra

MBPrediction

MBCoding Remove correlation

between Blocks main

( xvid_ encraw.c)

Diamond AdvDiamond

圖 1 XviD 中 I 畫面與 P 畫面的壓縮流程

(4)

1.3.2 數位相機軟體發展環境(Code Composer Studio, CCS)

在程式開發方面使用德州儀器所提供的發展平台 CCS。此平台中除了作為開發演算法用之外，尚具備一般軟體開發環境所沒有的特殊工具。就影像來說，一般在處理完影像資訊時，使用者常被檔頭資訊與閱讀影像的工具所限，有時還因為檔案資料要回傳到 PC 端導致花費許多時間。因此，

CCS 已經內建可以顯示影像的工具了。如圖 2 所示，使用者可以直接利用 CCS 的工具(ViewÆGraphicÆImage )來觀看影像資訊。

圖 2 使用 CCS 工具觀看影像之結果

(5)

1.3.3 數位相機硬體發展環境

在硬體實現方面，採用由德州儀器所提供的 OMAP，其型號為 DM310 (此為發展數位相機之平台)，系統架構主要含兩個中央處理器，一個為 ARM9，另一個為 DSPC54，DSP 其工作時脈為 125MHz。此外為適應數位相機之發展，也提供了 SD 卡、USB、CCD 等之介面，方便開發者做研發之用。

1.4 章節安排

第一章為本論文的簡介，分別提出研究動機與研究目的。接續介紹本研究的發展環境，主要分成軟體與硬體兩個部份，其中軟體為國際的公開共用的 MPEG-4 原始碼 XviD，硬體方面則為現今受歡迎的數位訊號處理器與 ARM 系統。

第二章為簡介過去所被提出來的相關快速搜尋演算法，包含一般的快速搜尋演算法，如鑽石形搜尋演算及適用於數位相機平台的演算法，如三步搜尋演算法等等。

第三章為本研究所提出的快速搜尋演算法，此一演算法為針對特別的嵌入式平台所設計的。

第四章為實驗步驟與模擬結果，特別介紹此一數位相機平台中的硬體加速器，另外分別針對軟體與硬體所分別得到的實驗數據做分析與比較。

第五章為本研究的結論與未來工作。

第一章 緒論