• 沒有找到結果。

MPEG各相關標準與應用概述…

第四章 數位多媒體影像技術及Amana公司介紹

4.1 影像處理的技術發展

4.1.2 影像壓縮技術

4.1.2.2 MPEG各相關標準與應用概述…

在多媒體信號傳輸中,只有對音頻和視頻信號進行有效的編碼,才能最後解 析出高品質的聲音和圖像。MPEG-2 是截至目前發展最成功的影像壓縮標準技 術,由於其簡單、高品質特性及達4~6Mbps 的資料傳輸率,吸引 DVD Player、

STB 等眾多廠商相繼採用而形成龐大市場規模,且市場的成熟也帶動週邊產品與 環境的支援整合,造就其今日主流壓縮技術地位。

MPEG2 和 MPEG1 音頻壓縮可分為三層。層數越高,壓縮的程度、所需 CPU 處理能力以及聲音品質也相應增加;而傳輸所需的頻寬則相應減少。因此,第一 層的壓縮率最低、所需 CPU 處理能力最低、延遲也最少。由於壓縮率最低同時 聲音品質最差,因此它所需的傳輸頻寬最大。而第三層的聲音品質最佳,壓縮率 可達1:10。處理時間也幾乎是第一層的三倍。

表4-1 MPEG2 壓縮規格

壓縮層的概念是逐漸發展而來的。第三層規範比第一、二層定得晚。當第三 層規範開始流行時,採用第一、二層規範的設備已十分普及,消費者也非常熟悉 了。因此,必須讓消費者能自由地選擇適合自己應用的那一層規範。這與黑白電 視和彩色電視的情況有些類似。彩色電視便可對黑白電視的信號進行解碼。

然而進入高畫質 DVD 與 DTV 時代,壓縮率不足的特性成為該標準唯一的 弱點,因而導致後續MPEG-4、H.264…等新興技術規格的出現。完整的 MPEG2 標準可滿足 STB 等廣播應用和 DVD 或 D-VHS 等多媒體應用。MPEG2 並非對 MPEG2 編碼器進行標準化,而是為經過 MPEG2 編碼的位元流提供了一種標準 化格式,另一方面,它也為MPEG2 解碼器提供了一個標準模式。

濾波器組採用快速傅利葉變換(FFT)將時域採樣轉換成同樣數目的頻域採 樣。輸出是一系列頻寬相等的子帶。心理聲學模式過程計算每一子帶的信號掩蔽 比(SMR),以便決定每一子帶可用於編碼的信號位元數。在信號位元或噪音分配 過程中,通過濾波器組的輸出及SMR 資訊來決定每個子帶可承受的量化噪音。

量化噪音越高,這一子帶所分配的信號位元數就越低。在位元流格式化模組中,

子帶頻率採樣與分配給該層的信號位元及一些其它資訊相結合,形成一個音頻訊 框,這個訊框包括一個信號頭和其它資訊段。

(二) MPEG-4

MPEG(Motion Picture Experts Group)制定 MPEG-4 標準時,主要是考量理 想虛擬世界所需的多媒體資料呈現方式(Presentation),MPEG4 主要目標在於影 像/聲音上物件化;然描述,儲存,傳送,融合這些物件的方式必須使用額外的 功能,且這些功能是MPEG1 和 MPEG2 所沒有的。

MPEG-4 被視為多媒體應用的理想標準。2002 年國際標準組織制定了 Simple Profile、Advanced Real Time Simple Profile 等規格,因應不同的 Profile 及 Level 可做不同的應用,如行動電話、PDA 等可攜式裝置適用於 Simple Profile 規格,

影像電話、視訊會議、遠端監控等即時編碼應用則適合於 Advanced Real Time Simple Profile 規格。

MPEG-4 技術推出原本的目的在執行窄頻的影像傳輸應用,因此其能夠使影 像維持在176x144 pixels 的低畫素水準,並達到每秒 48~64Kbits 的傳輸速率;除 此之外,MPEG-4 也儘可能在較低的傳輸速率下提供一距離目標控制(instance

object manipulation),且能根據不同的規則,處理諸如背景(background)、移動影 像(moving image)等各種影像元件。更重要的,是 MPEG-4 針對接收器的處理功 耗和頻寬具有可定標性(scalability;指在壓縮一次影像的過程當中,可同時產生 滿足許多目標的位元流)特色。

MPEG-4 包含一組用來支援和加強這些應用的工具,包括形狀編碼 (shape coding)、移動估算 (motion estimation) 與補償、影像紋理編碼 (texture coding)、

抗錯性、sprite 編碼和可延展性。若廠商無意實作整個標準,MPEG-4 也提供許 多定義良好的子集合,它們稱為「符合點」(conformance points),可協助廠商很 自由的將系統成本最佳化,不會對操作互通性造成任何影響。結合這些能力,即 可為設計人員帶來彈性和操作互通性都很好的途徑,使他們能產生極高品質的數 位視訊繪圖,並支援各種不同的多媒體應用。

圖4-3 MPEG4 影像處理技術 資料來源:http://www.cast-inc.com/cores/mpeg4-mce/index.shtml

MPEG-4 標準是由一組工具所組成,能支援不同類別的各種應用;整體來 說,主要功能特色可分成以下幾大類:

壓縮效率:MPEG-4 是以先前標準為基礎,但提供更高編碼效率,增加 MPEG-4 應用的市場接受度。

內容導向互動性 (content-based interactivity):把視訊當成物件,而非視訊 圖框,即可讓內容導向應用 (content-based applications) 付諸實現;此時 只須提供更高效率的物件表示法、物件操控、位元串流編輯和物件導向延 展能力 (object-based scalability),就能將內容互動性帶至更高水準。

適用於所有傳輸媒介:就算在容易發生錯誤的環境,MPEG-4 也很強健可

靠,故可用於各種傳輸媒介,包括行動網路和實體連接線路。

MPEG-4 視覺場景 (visual scene) 可能包含一個或多個視訊物件,每個視訊 物件都可藉由時間和空間資訊加以描述,包括它們的形狀、移動和紋理。某些應 用可能無法使用所有的 MPEG-4 工具,原因可能是相關的額外處理負擔過於龐 大,或是視訊物件的產生極為困難,此時 MPEG-4 視訊可直接對矩形圖框 (rectangular frame) 進行編碼,它也是各種形狀物件中最簡單的一種 (degenerate cases)。MPEG-4 視覺位元串流會提供階層式的視覺場景描述,起始碼 (start codes) 則是特殊的編碼值,它們可以存取位元串流的每一層階層架構。階層架構中的各 層包括:

視覺物件序列 (Visual Object Sequence,簡稱 VS):它是完整的 MPEG-4 場景,可能包含任何 2-D 或是 3-D 的自然或合成物件以及它們的加強層 (enhancement layer)。

視訊物件 (Video Object,簡稱 VO):視訊物件會連結至場景中的某個 2D 元素,矩形圖框就是最簡單的例子;它也能是任意形狀的物件,對應於場 景中的某個物件或是背景。

視訊物件層 (Video Object Layer,簡稱 VOL):視訊物件支援可延展 (scalable) 以及不可延展 (non-scalable) 兩種編碼模式,實際編碼模式則由 視訊物件層所代表的應用決定。視訊物件層能支援可延展性編碼。

視訊物件平面群 (Group of Video Object Planes,簡稱 GOV):視訊物件平 面群是可選用的功能,它會提供視訊物件平面被獨立編碼的各點,讓位元 串流中能夠加入多個隨機存取點。

視訊物件平面 (Video Object Planes,簡稱 VOP):視訊物件平面是在時間 取樣的視訊物件,它們可以獨立取樣,也可以利用移動補償值進行取樣。

矩形可以代表傳統的視訊圖框。

視訊物件平面的使用方法有很多種,最常見的做法是讓它們包含某個視訊物 件的時間取樣值的編碼視訊資料。每個視訊物件平面都包含多個巨集區塊 (macroblock),每個巨集區塊則會包含四個 8x8 亮度區塊 (luminance block) 以及 兩個8x8 色度區塊 (chrominance block)。

(三) H.264

H.264 同樣具備多元豐富的應用市場,包括廣播服務供應商、有線、衛星、

電信營運商都對 H.264 的壓縮能力充滿了興趣。在影音家電方面,氣勢如虹的 DVD Recorders/PVRs 業者也有意使用 H.264 技術壓縮更多的影像位元於碟片 上,目前包括DVD Forum 也正積極評估 H.264 在高解析度媒體進行高效能壓縮 的可行性(使用 Red-ray);在 DTV 的應用方面,業界正積極討論以 H.264 技術傳 送數位地面電視訊號到行動裝置的成效,特別是極力推廣數位內容產業的日、韓 兩地,更殷切希望能在 2005 年前完成此一目標。在歐洲,業者普遍看好 H.264

是針對DVB-X 進行壓縮的可能技術之一,足見 H.264 受到相當的期待。

自2003 年 5 月國際電信聯盟(ITU)正式批准該技術之後,H.264 是繼 MPEG-4 之後崛起的另一種新興影像壓縮技術規格。其之所以會受到矚目,主要在於其壓 縮程度與效能皆不下於既有的MPEG-4 IC;與 MPEG-4 不同,H.264 包含一個內 建的網際網路協定適配層,所以H.264 協議可以被映射到任何固定 IP、無線 IP、

儲存或廣播網路中,對於某些Cable 或衛星(廣播/電視)營運業者,該技術有效解 決了 MPEG-4 相對於 MPEG-2 頻寬不足的問題;更重要的,是 H.264 可和目前 居於主流的MPEG-2 格式回溯相容;除此以外,其具備的多重參考框架(multiple reference frame)功能,也有助於對間歇性的畫面移動進行有效壓縮;且獨有的「內 部評估」─Intra-estimation 功能也可藉由尋找臨接區塊(adjoining blocks)的臨近圖 素(Pixel)來評估資料區塊;再者,其只對於實際區塊與預測區塊間的不同處進行 編碼,對於有剩餘空間的平面背景之影像處理也有著極大助益。因為H.264 有可 能成為一種適用於各類系統的公共技術,允許消費者在行動電話、可攜式相機、

可燒錄DVD、家庭伺服器與 PC 之間交換和傳送多媒體文件,但尚未解決的 H.264 IP 授權問題可能會帶來困擾。

(四) MPEG-7

MPEG-7 主要是一描述多媒體內容的介面工具,其目的為針對不同多媒體資 訊建立描述符號,以對 MPEG 標準做出更具體的指定與說明,並利於進行影像 特徵擷取;因此就定位而言,MPEG-7 主要是作為一影音資料庫,而非影音壓縮 工具,故該標準與MPEG-2/MPEG-4/H.264 並非處於競爭地位,僅是做為一工具 而無開發具體晶片。

有別於 MPEG-1 到 MPEG-4 與音訊和視訊的壓縮和解壓縮有關的標準,

MPEG-7 主要目標是在多媒體的環境中提供一組核心技術作為描述影音資料內 涵(audiovisual data content)的標準。MPEG-7 標準並不包括用於製作內容描述資 料(content description data)或用於搜尋和處理它們的軟體。動畫專家小組(Motion Picture Experts Group)決定把心力集中在這些描述資料的格式上,而把適宜軟體 系統的製作工作留給使用這項技術的人去開發。因此 MPEG-7 不依賴其他 MPEG 標準,甚至與數位檔案也不相關。MPEG-7 提供了綜合性的描述工具。

不論是目錄層級(catalogue level, 例如 title)、語義層級(semantic level, 例如 who, what, when, where)或是結構層級(structural level, 例如 spatio-temporal region, color histogram, timbre, texture) 都因而會為多媒體之內涵產生新的應用。

MPEG-7 可被應用在數位程式庫、多媒體名錄指南服務、廣播媒體選擇、多 媒體編輯…等領域,該規格已在 2001 年 7 月成形,並吸引國內外產學各界業者 投入。包括國內沛錦科技與台灣大學等公司學校皆已積極進行相關技術開發。

MPEG-7 可被應用在數位程式庫、多媒體名錄指南服務、廣播媒體選擇、多 媒體編輯…等領域,該規格已在 2001 年 7 月成形,並吸引國內外產學各界業者 投入。包括國內沛錦科技與台灣大學等公司學校皆已積極進行相關技術開發。