• 沒有找到結果。

MPEG-4 是最新的國際多媒體通訊標準,是由 Moving Picture Expert

Group(MPEG)是發展出來的。它是使用一種物件為導向的方式來做多媒體呈現,

也就是一個場景是由各樣多媒體物件(media objects)所組成,所有它有很強的整 合性功能。MPEG-4 為四個階層的架構,分別為傳輸層、同步層、壓縮層、整合 層。這個標準主要是由 Systems[4], Video, Audio 這 3 個部分所組成,systems 提 到的是整個系統細部的分工組成,還有場景的構成。後面兩個部分別提到 video 和 audio 的壓縮演算法。由於我的研究並不着重於壓縮的演算法,所以我只介紹 systems 的部分。

2.1.1 MPEG-4 目標

MPEG-4 的目標為提供一個全新的多媒體影音呈現標準。並且支援新的傳輸

與存取方式、互動性、不同的傳輸協定,所以它可以達到各式各樣不同的應用,

如網路視訊、多媒體廣播(broadcasting)、數位內容資料庫的存取、遊戲、在手持 裝置上的多媒體通訊等等。

MPEG-4 最大的進步在於它讓使用者不再處於被動的狀態,它讓使用者可以 對場景中的多媒體物件做互動的功能,不論這些物件的來源,可能是圖片、文字、

影片、聲音。數位內容的生產者可以讓使用者去改變場件中物件的屬性,或者是 物件的行為模式。

2.1.2 MPEG-4 系統架構

ISO/IEC 14496-1[4]這份文件定義了 MPEG-4 的系統架構,這分文件包含下面這 些項目:

1. 如何表示多媒體物件( audio-video objects )。

2. 這些多媒體物件在一場景中空間和時間的位置和它們的行為。

3. 如何以位元碼表示處理資料流的資訊。

4. 一個通用性的資料流傳輸介面。

在這一小節中,我們將介紹 MPEG-4 的系統架構。

Multiplexed Streams Interactive Audiovisual

Scene

Elementary Streams

Composition and Rendering

Display and User Interaction

Transmission/Storage Medium (RTP)

FlexMux FlexMux

DMIF Application Interface

SL SL

SL SL

...

Sync

Layer

Elementary Stream Interface AV Object

data

...

Compression

Layer

SL

SL-Packetized Streams

(PES)

MPEG-4 定義了全新的傳輸架構稱為 Delivery Multimedia Integration Framework(DMIF)。

在 DMIF 中定義了兩種介面 DMIF-Application Interface(DAI)及 DMIF Network Interface(DNI)。資料流由網路實體層往上經由 DNI 進入傳遞層,網路實 體層是網路實際的協定,透過這一層使得傳輸層和下層網路所使用的網路協定互 相獨立,下層可依需要使用各式的網路協定,如 RTP、ATM、H.223。

通過這層 DNI 介面的資料流我們稱為 FlexMux 資料流,一個 FlexMux 資料 流可以是參雜具有同樣網路參數的一個或多個具備同步資訊的物件封包資料流 (SL-Packetized stream)。傳遞層會將這些參雜的資料流分為一個一個獨立的物件 封包資料流,再經由 DAI 介面與同步層連接。

2. 同步層( Sync Layer )

主要是負責每個封包的切割、時間、連續性等資訊。Elementary Stream 會被 切割成最小的資料單位稱為 access units,而只有 access units 才能被賦予時間的 資訊,這個動作有點類似為一個信封被貼上郵票的動作,這樣才知道這個資料要 在什麼時候被解碼和構成。切割之後的 access units 又會合而成為一個 elementary stream,然後送到下一層。

3. 壓縮層( Compression Layer )

從底層上來的資料在這一層被解碼,被解碼出來的資料最後會被組成及繪出整個 畫面。下面列出解碼出來的資料種類:

(1) OD(Object Description) :

描述一個多媒體物件是由那些基本資料流構成,提供基本資料流和場景 描述間的連結。一個物件描述式是基本資料流描述式的集合,這些描述 式是在描述一個資料流的配置和物件本身或者是場景描述的資訊。物件 描述本身就是以基本資料流的方式傳輸,每一個物件描述式都有一個識 別碼(object descriptor ID),利用這個識別碼就可以提供和場景描述的連 結。每一個基本資料流也有一個識別碼(elementary stream ID),透過這 個識別碼可以得到每一個資料流。

根據下圖,我們透過物件描述識別碼來得到一個物件描述式,從裡面得 到基本資料流描述式,就知道每一個基本資料流的識別碼。

100

Visual Stream (e.g. temporal enhancement) Visual Stream (e.g. base layer) Scene Description Stream

Object Descriptor Stream

e.g. Movie Texture Scene Description

ObjectDescriptorID

ES_D ES_D

ES_D

... ...

...

...

BIFS Command (Replace Scene)

e.g. Audio Source

Audio Stream

圖 5:OD 使得 SD 和 ES 做一連結

(2) SD(Scene Description) : 場景描述資訊是由場景描述語言(scene

description language)來完成。場景描述語言是用來描述物件之間的行為,彼 如說物件的位置、大小、物件和物件之間的關係等等。MPEG-4 所使用的場 景描述語言為 BIFS(Binary Format for Scene)。

‹ 針對 MPEG-4 system 的 binary format 場景描述語言,根據 VRML[15]的語法所延伸

‹ Node、Field 為構成場景的基本元素

‹ 三種 BIFS command (Replace, Insert, Delete)控制場景劇情

‹ Route 和 Event 控制場景內物件之間訊息的傳遞

相關文件