• 沒有找到結果。

多媒體系統晶片設計技術之研究---總計畫(III)

N/A
N/A
Protected

Academic year: 2021

Share "多媒體系統晶片設計技術之研究---總計畫(III)"

Copied!
5
0
0

加載中.... (立即查看全文)

全文

(1)

行政院國家科學委員會補助專題研究計畫成果報告

※※※※※※※※※※※※※※※※※※※※※※※※※

多媒體系統晶片設計技術之研究— 總計畫(3/3)

※※※※※※※※※※※※※※※※※※※※※※※※※

計畫類別:□個別型計畫

■整合型計畫

計畫編號:NSC89-2218-E-009-077-

執行期間:

89 年

8 月

1 日至

90 年

7 月

31 日

計畫主持人:李鎮宜教授

共同主持人:沈文仁教授、任建葳教授、周景揚教授、陳紹基教授

本成果報告包括以下應繳交之附件:

■赴國外出差或研習心得報告一份

□赴大陸地區出差或研習心得報告一份

□出席國際學術會議心得報告及發表之論文各一份

□國際合作研究計畫國外研究報告書一份

執行單位:國立交通大學電子工程學系

九十年

十月

二十八日

(2)

行政院國家科學委員會專題研究計畫成果報告

多媒體系統晶片設計技術之研究— 總計畫(3/3)

計畫編號:NSC89-2218-E-009-077

執行期限:89 年 8 月 1 日至 90 年 7 月 31 日

主持人:李鎮宜 國立交通大學電子工程學系

共同主持人:沈文仁、任建葳、周景揚、陳紹基 國立交通大學

電子工程學系

一、中文摘要

此整合型記畫執行三年來,已產出數十篇的 國際會議和期刊論文,並有部分技術落實至產業 界。在此僅簡述有關符合多樣標準的視訊解碼器 的部分研究成果,提供參考。 此整合型計畫產出一個具有高輸出率且訊息 編碼可程式化之影像解碼器的硬體架構設計。因 為使用以記憶體為基礎的可變長度解碼器[19],所 以此影像解碼器能夠經由改變記憶體的內容達到 霍夫曼編碼表和編碼符號可程式化,影像標頭和 量化表也使用記憶體來儲存而可以修改,為了縮 短訊息解碼器和 IDCT 間的處理時間差,使用 ISDCT 來只操作非零的 DCT 係數且平行計算 8 個 點 [23],根據資料型態分析的結果,提出的高效 率管線化設計來增加處理速率和減少暫存器的使 用。本影像解碼器針對 MPEG 和 JPEG 的影像來 設計,在採用 0.35-µm CMOS 的製程技術下,其 在 4.38×4.38 mm2 內整合了 125K 邏輯閘和 14K bits 記憶體,模擬的結果顯示此影像解碼器在 66MHz 的時脈頻率下,訊息解碼可以達到 56.5M symbols/sec,而影像解碼則有 400Mpixels/sec 的輸 出率,因此所提出的影像解壓縮架構滿足系統對 效能的需求,並且有高度的適應性可以應用於多 種影像解碼程序中。 英文摘要:

In this paper, a video decompression architecture with high throughput and entropy decoding programmability is presented. Due to the memory-based VLC decoder [9], this video decoder acquires the flexibility to program the used Huffman tables and source symbols by changing the associated memory contents. The information of image headers and quantization tables are loaded into memory modules for modification. To minimizing the operation time difference between entropy decoding and IDCT, an ISDCT that manipulates nonzero DCT coefficients only and calculates 8 pixels in parallel is employed [10]. According to the result of data type analysis, a novel pipeline scheme is developed to improve processing rate and save internal buffer space. Using 0.35-µm CMOS technology, a VLSI implementation including memory-based VLD, symbol decoders, ISDCT, and MC is shown to

reconstruct MPEG and JPEG pictures. This design integrates 125K logic gates and 14K-bit memories in a 4.38×4.38 mm2 core area. Simulation results show that it achieves 56.5M symbols/sec in entropy decoding and 400M pixels/sec in video decompression with a clock rate of 66MHz. Therefore, the proposed video decompression architecture accomplishes both satisfactory performance for advanced applications and sufficient adaptability for various video decoding procedures.

二、 研究動機與相關研究發展現況 多媒體應用結合了數種型態的訊息,例如文 字、言詞、聲音和圖片,其中由於視訊影像的資 料量龐大,成為決定系統效能最重要的部分,而 近年來更由於電腦普及和通訊技術進步,數位影 像已經被廣泛地使用在各種領域之中,在此同 時,對於畫面品質和解析度的要求也在持續提 高,使得所要處理的資料量大幅增加,而影像壓 縮與解壓縮是達到降低儲存空間和通訊頻寬,並 且提供高品質視訊服務的必要方法,為了方便影 像資料的交換和傳遞,針對各種不同應用的國際 標準也就隨之產生,例如:JPEG、MPEG、H.263 等。 以實際應用的觀點來看,高效能且低成本的 影像解碼器是一個不可或缺的模組,因此也就在 文獻中被廣泛地討論[1-8]。雖然目前軟體的解決 方案可以滿足 VCD 與 DVD 等應用,但是其效能 的提昇有限,並且需要使用高效能的數位訊號處 理器,使得高階應用系統和可攜式產品,例如數 位攝影機、數位電視等,仍然使用硬體模組的實 現方式,以達到高效能和低成本的設計考量,但 是一般所採用的硬體架構是直接完成解壓縮流 程,並沒有可率可程式化的功能,使得在以 SOC 為設計導向的情況下,系統的可應用範圍和重複 使用的能力大幅降低,此外也沒有針對各個步驟 和整體演算法的關係作分析,然後再設計可以使 系統達到最佳化的功能方塊,因此解碼的動作是 以 MB-by-MB 或 block-by-block 的方式來完成,不 僅需要較大量的內部記憶體來儲存暫時性的資 料,系統的效能也會因為要存取這些記憶體而無 法有效增加。 本論文的研究目的在於發展一個高效能且高

(3)

度可程式的影像解碼器,以滿足多功能系統和多 重應用的需求,並且能夠在降低時脈頻率後,大 幅降低功率效耗,以適用於可攜式產品。因此我 們首先提出以記憶體為基礎的可變長度解碼器的 設計,使得訊息解碼的部分可以完全可程式化, 然後分析解碼流程中各個步驟的資料型態,再進 行功能方塊和管線化的設計,以達到減少系統停 頓時間和降低記憶體空間的需求,採用平行的色 素點處理方式,以大幅提昇解碼器的輸出率,使 得在低時脈頻率的情況下,就可以有高效能的表 現。在接下來的章節中,將分別對解碼器系統的 硬體架構和關鍵功能方塊的設計加以說明。 三、系統架構簡介 所提出之影像解碼器的系統架構如圖一所 示,其主要分成四個部分,名為 MB Syntax Parser & MTM VLD, Symbol Decoders, ISDCT, and MC & Frame Memory。其中 MTM VLD 是使用以記憶體 為基礎的架構來實現,不但使可變長度編碼表和 編碼符號可以程式化,更達到固定的解碼符號速 率,所以 MB Syntax Parser & MTM VLD 和 Symbol Decoders 是設計成以符號為基礎的同步,也就是 說每一個時脈週期,MB Syntax Parser & MTM VLD 都會解開一個編碼字元並送出相對應的符 號,而 Symbol Decoders 會將一個符號回復成為原 始資料,因此 MTM VLD 所解出來的符號可以利 刻送到 Symbol Decoders,其間的暫存記憶體就不 需要,由位元資料流到原始資料的符號解碼程序 也達到固定的符號速率,即一個時脈週期一個符 號。後面的功能方塊,如 IDCT 和 MC,是以色素 點為基礎將影像解回來,大部分的現存設計中, 是 使 用 Inverse Scan (Iscan) 暫 存 記 憶 體 來完成 symbol decoders 和 IDCT 間不同資料速率的轉換, 並將 DCT 的係數由 1D 的數列轉成 2D 的矩陣,然 而讀寫 Iscan 暫存記憶體需要相當長的時間而使系 統整體效能下降,經由觀察自然影像壓縮的結 果,可以發現 IDCT 的輸入資料通常是一個稀疏的 矩陣,即大部分的係數都是零,所以不需要提供 完整的 8×8 DCT 係數給 IDCT 模組,因此所提出 的影像解碼器架構是採用 ISDCT [6-8],除了只處 理非零的 DCT 係數外,並且還完成資料速率和型 態的轉換,使用的 ISDCT 是由 2 個 1D IDCT 和 2 個轉置記憶體 (TM) 所組成,同時 Iscan 暫存記憶 體也用 Iscan 位址轉換器取代,將 RLD 所解出來 的 Iscan address 轉成 8×8 矩陣的 row-column address,因為 1st IDCT 是接收 symbol decoder 所 提供的非零的 DCT 係數,因此 ISDCT 的輸入可以 是固定的符號速率,而輸出則是固定的色素點速 率,以符號為基礎的解碼流程由 MB syntax parser 延伸到 ISDCT 的 1st IDCT。 根據上述的資料型態分析,影像解碼器的功能 方塊可以分成 2 類,以符號為基礎和以色素點為 基礎,MB syntax parser、VLD、symbol decoders 和 1st IDCT 每一個時脈週期處理一個符號,2nd

IDCT 和 MC 是 pixels-by-pixels 地完成它們的工 作,因為解壓縮程序是依序處理壓縮的資料,所 以 2 類功能方塊可以串接成為以符號和以色素點 為基礎的管線鏈 (pipeline chain),而 ISDCT 內的 TM 則完成 2 管線鏈間的資料速率和型態轉換。此 外,管線級內的資料只有再下一級往前進時,才 會移到下一級,不然管線級會停滯以保持其內資 料,例如當 1st IDCT 可以接受資料時,symbol decoder 才送出 DCT 係數到 ISDCT,否則整個以 符號為基礎管線鏈會停滯來保持有效的 DCT 係 數,另一方面,ISDCT 在 MC 可以收下資料時, 才會送解壓縮後的色素點過去,否則 2nd IDCT 會 停止讀取 TM 以保持有效的計算結果。根據上述 的管線化設計,功能方塊並不需要使用記憶體來 暫存其輸入輸出的資料,雖然如此,但是系統外 部仍需要暫存記憶體來儲存壓縮的位元資料流和 解壓縮後的色素點,以減少整個影像解碼器的停 滯時間。 因為所有的功能方塊被設計成以符號或以色 素點為基礎的管線,所提出的影像解碼器並不需 要整體的管線控制器來安排每個模組的工作,此 點和現有的以 MB 或以 block 為基礎的管線不同, 而為了正確地完成解碼的動作,會將每個解出來 的符號貼上標籤,名為符號型態號碼(symbol type I.D.),然後將符號和其相對應的型態號碼一起在管 線中傳遞,因此,資料會通過正確的路徑並且被 適當的功能方塊所處理,舉例來說,如果一個符 號被貼上 Run-Length Pair 的標籤,則此符號會被 RLD, IDPCM, Iscan address converter, and IQ 解碼 成為 DCT 係數,接著送到 ISDCT,但是如果符號 是 貼 上 motion vector 的 標 籤 , 它 就 會 被 MV_decoder 所處理,而所得到的 MV 也會送到 MC。 MB syntax parser MTM VLD Symbol Memories Used VLC_table Sym_addr bitstream MB_addr Recovery RLD IQ MV Decoder 1st IDCT TM (x2) 2nd IDCT Frame Memories MC dec_ pixels MC & Frame Memories ISDCT Symbol Decoders MB Syntax Paser & MTM VLD

bitstream symbol basis pipeline chain conversion pixel basis pipeline chain

VLD_error d e c _ s y m b o l R o w / c o l, n o n z e ro D C T _ c o e MV & MC_syntax Iscan_addr Converter IDPCM reconst. pixels

Fig. 1: The proposed video decompression architecture.

四、功能方塊架構簡介

此節將會說明功能方塊 MB syntax parser & MTM VLD、Symbol Decoders 和 ISDCT 的架構設 計,MB syntax parser & MTM VLD 與 Symbol Decoders 的互動會影響符號解碼程序的輸出率,

(4)

而 ISDCT 因為完成符號對色素點的轉換,所以決 定 了 影 像 解 碼 器 的 解 壓 縮 率 , 而 MC 是 接 收 Symbol Decoders 和 ISDCT 的輸出,不但重建影 像,更控制其他功能方塊的動作。

圖 二 為 MB syntax parser 、 MTM VLD 和 Symbol Decoders 的方塊圖,首先 bitstream selector (BS_sel) 在暫存住的位元資料流中並選出編碼字 元給 MB syntax parser 和 MTM VLD,若編碼字元 是固定長度的參數,parser 會直接解開;如果編碼 字元是可變長度編碼,parser 會認出所使用的編碼 表 (VLD_TB_sel),然後編碼字元就會被 MTM VLD 解開,其編碼字元長度(CL)會回饋給 VLD pre-processor 以 求 得 全 部 的 解 碼 長 度 (total_dec_BL),由於這些動作是在一個時脈週期 完成的,所以下一個編碼字元可以在下一個時脈 週期被 BS_sel 找到,而達到一個時脈週期解出一 個符號的固定速率。在解編碼字元時,parser 會根 據位元資料流的前後文,替符號設定型態號碼, 後續的 Symbol Decoders 則根據這個訊息正確地將 送來的符號處理成 MB address、motion vector、DCT coefficient 和 row/column address。

VLD pre-processor MB syntax parser BS Sel MTM VLD Group detectors & TB_info memory VLD_TB_Sel codeword bitstrea m syntax_setting total_dec_BL dec_sym_addr calculator match_GI sym_type_id syntax_BL VLC_CL-1 Sym Mem TB01 Sym Mem TB02 Sym Mem TBxx ... dec_sym_addr VLD post-processor symbol VLD_error ctrl flags 1st stage symbol MUX sym_type_id syntax setting symbol VLD_error 2nd stage 3rd stage Symbol Decoders

additional bit length

Fig. 2: Block diagram of the MB syntax parser, MTM VLD, and symbol memories.

所採用的 ISDCT 包含 1st IDCT、2 個 TM 和 2nd IDCT,如圖三所示,由於 TM 必須存住 1st IDCT 的暫時計算結果,在所有的 DCT 係數都操 作完畢,EOB_in 為 1 時,TM 內的資料才是完整 的 1st IDCT 結果,然後才能傳送到 2nd IDCT 作運 算,而在 2nd IDCT 還沒有讀完 TM 內的 8×8 block 之前,1st IDCT 不可以使用這個 TM;因此使用 2 個可交替的 TM,分別提供給 1st 和 2nd IDCT, ISDCT 的停滯時間大幅減少,使得解碼器的效率 獲得有效的提昇。另外,2nd IDCT 使採用平行處 理的架構,每次由 TM 讀取一個 column 的資料, 接下來就同時處理此 8 個色素點,所以大幅增加 影像解碼器的輸出率,而在降低時脈頻率時,仍 然可以提供相當高的性能,以滿足低功率應用的 需求。 multiplier bank TM_in0 TM_in1 TM_column_out0 TM_column_out1 TM_in4 TM_in5 TM_column_out4 TM_column_out5 TM_in2 TM_in3 TM_column_out2 TM_column_out3 TM_in6 TM_in7 TM_column_out6 TM_column_out7 data_in PE 1 PE 2 PE 7 PE 6 PE 5 PE 3 PE 4 PAM 1 PAM 2 PAM 3 PAM 4 PAM 5 PAM 6 PAM 7 + -+ -in0 in1 in3 in5 in7 in2 in6 in4 a f c+f a f c c+f c a /2 + -+ -+ -+ -+ -E B G D + -+ -+ -+ -out0 out7 out6 out5 out4 out3 out2 out1 + -(a) (b) (c) DCT_coe, row, column 8 pixels of a column 1st IDCT De M ux TM 0 TM 1 M ux 2nd IDCT EOB_in EOB_out data_in_v data_out_v

Fig. 3: Schematic of the used ISDCT: (a) the 1st IDCT; (b) transpose memory; (c) the 2nd IDCT; (d) ISDCT with two TM.

圖四為 MC & frame memories 的架構圖,為了減 少其他功能方塊的停頓時間,此 MC 目標在同時 接收一個符號和 8 個色素點,所以使用 2 個 MB header buffer,buf_1 提供 header 給目前正在解碼 的 MB,而 buf_0 收集由 Symbol Decoders 傳來的 下一個 MB header,使用這種設計,整個影像解碼 器的停頓時間就可以大量減少;而 frame memory 是由 16 個 sub-memory 所組成,一個 sub-memory 儲存一個 pixel row,因此可以一次就抓出 16 個 column pixels,選出所需要的 9 個 reference pixels, 而可以一次就重建回 8×8 block 的一個 column。 MB header Buf_0 MB header Buf_1 from Symbol Decoders FM read/w rite addr.

& MC ctrl signals : : ref_pixel selector_1 16 col_pixels ref_pixel selector_0 from ISDCT 9 ref_pixels 9 ref_pixels pred_pixel generator ( half-pixel precision )

+

a col of pred_block ( 8 pixels ) a col of dec_block ( 8 pixels ) a col of rec_block ( 8 pixels ) 16 col_pixels } sub-mem [8 : 15] } sub-mem [0 : 7] } sub-mem [8 : 15] } sub-mem [0 : 7] block slice 0 block slice 1 block slice 2 block slice 3 : : FM 1 with 16 sub-mem block slice 0 block slice 1 block slice 2 block slice 3 : : FM 0 with 16 sub-mem

Fig. 4: Block diagram of the MC & frame memories.

五、結論與成果

此論文提出以一個高效能影像解碼器的架構 設計,其中包含 MB syntax parser & MTM VLD、 Symbol Decoders、ISDCT 和 MC。因為使用以記 憶體為基礎的功能方塊,此影像解碼器達到高度 的可程式化,而可以滿足於各種解碼流程;功能 方塊均是根據各個步驟的資料型態分析結果來設 計,因此整個系統可以達到降低內部暫存記憶體 需求和減少停滯時間的設計目標;然後將所有的 功能方塊結合成以符號為基礎和以色素點為基礎 的管線鏈,並且 ISDCT 包含 2 個 TM 和 8-in 8-out 的 2nd IDCT,所以影像解碼緝獲得相當高的效

(5)

能。在使用 0.35-µm CMOS 製程的 cell library,影 像解碼的時脈速率為 66MHz,此時達到 56.5Msps 的符號字元解碼速率,而根據實際影像的測試結 果,此解碼器的平均解壓縮率為 400M pixels/sec, 所以此設計能夠滿足目前的應用需求,如數位相 機、高畫質數位電視等,而所提出的硬體架構更 可以被各種影像解碼系統所採用。 MB syntax parse & MTM VLD Table Info. Memories Q Table Memories Symbol Decoders 1st IDCT TM x 2 2nd IDCT Symbol Memories MC Process TSMC 0.35µm SPQM CMOS Cell Library TSMC 773 0.35µm 3.3V cell library Core size 4381 × 4377 µm2 Parser & MTMVLD Symbol Decoders 1st IDCT TM x 2 2nd IDCT MC : 25k : 12k : 9k : 17k×2 : 25k : 20K Gate Count Total : 125k Clock Rate 66MHz

Fig. 5: Chip summary of the proposed video decoder.

六、參考文獻

[1]

Peter A. Ruetz, Po Tong, Daniel Luthi, and Peng H. Ang, “A Video-Rate JPEG Chip Set,”

Journal of VLSI Signal Processing, vol. 5, pp.141-150, 1993.

[2]

K. Kawahara, H. Yamauchi, and S. Okada, “A Single Chip MPEG1 Decoder,” IEEE Trans. on Consumer Electronics, vol.41, issue 3, pp.707-715, Aug.1995.

[3]

Toshihiro Masaki, Yasuo Morimoto, Takao Onoye, and Isao Shirakawa, “VLSI Implementation of Inverse Discrete Cosine Transformer and Motion Compensator for MPEG2 HDTV Video Decoding,” IEEE Trans. on Circuits and Systems for Video Technology, vol. 5, issue 5, pp. 387-395, Oct. 1995.

[4]

E. Brosz, R. Meyer, L. Phillips, and R. T. Ryan, “A Single-Chip HDTV Video Decoder Design,” IEEE Trans. on Consumer Electronics, vol.44, issue 3, pp.519-526, Aug.1998.

[5]

L. Bolcioni, M. Borgatti, M. Felici, R. Rambaldi, and R. Guerrieri, “A low-power, voice-controlled, H.263 video decoder for portable applications,” IEEE Journal of Solid-State Circuits, vol. 33, issue 11, pp. 519 – 526, Nov. 1998.

[6]

T. Onoye, G. Fujita, H. Okuhata, M. H. Miki, and I. Shirakawa, “Low-power implementation of H.324 audiovisual codec dedicated to mobile computing,” in Proc. of Asia and South Pacific Design Automation Conference 1998, pp. 589-594, 1998.

[7]

Nam Ling, Nien-Tsu Wang, and Duan-Juat Ho, “An efficient controller scheme for MPEG-2 video decoder,” IEEE Transactions on Consumer Electronics, vol. 44, issue 2, pp. 451 –458, Dec.1998.

[8]

Jui-Hua Li and Nam Ling, “Architecture and Bus-Arbitration Schemes for MPEG-2 Video Decoder,” IEEE Trans. on Circuits and Systems for Video Technology, vol. 9, issue 5, pp. 727-736, Aug. 1999.

[9]

Bai-Jue Shieh, “Area Efficient and High Throughput Memory-Based VLC Codec Designs,” Ph.D Dissertation, National Chiao Tung University, June 2001.

[10]

Shu-Tzu Lin, “Analysis and Design of a

High-Throughput Two Dimension Inverse Scan Discrete Cosine Transform Processor,” Master Dissertation, National Chiao Tung University, June 2000.

數據

Fig.  1:  The  proposed  video  decompression  architecture.
Fig. 2: Block diagram of the MB syntax parser, MTM  VLD, and symbol memories.
Fig. 5: Chip summary of the proposed video decoder. 六、參考文獻

參考文獻

相關文件

 為了更進一步的提升與改善本校資訊管理系 的服務品質,我們以統計量化的方式,建立

利用 Web Survey 來蒐集資料有許多的好處。許多研究者利用 Web Survey 進行研究的主要原因在於可以降低成本、即時的回覆。然而,Web Survey

由於醫療業導入 ISO 9000 品保系統的「資歷」相當資淺,僅有 三年多的年資 11 ,因此,對於 ISO 9000 品保系統應用於醫療業之相關 研究實在少之又少,本研究嘗試以通過

由於 Android 作業系統的開放性和可移植性,它可以被用在大部分電子產品 上,Android 作業系統大多搭載在使用了 ARM 架構的硬體設備上使裝置更加省電

因此若將效率應用在教育機構方面,陳云愷【 45】認為教育

針對 WPAN 802.15.3 系統之適應性柵狀碼調變/解調,我們以此 DSP/FPGA 硬體實現與模擬測試平台進行效能模擬、以及硬體電路設計、實現與測試,其測 試平台如圖 5.1、圖

團隊管理 (team management) 就成為專案成功 很重要的因素之一,好的團隊可以發揮一加 一大於二的功效,壞的團隊可能會將努力消

本研究以河川生態工法為案例探討對象,應用自行開發設計之網