第二章 文獻探討
第一節 網路影音及分享帄台
多媒體網路傳輸可能是繼電視發明半世紀以來,最重要的科技突破,它對 網路世界的衝擊,發揮出超過書本的影響力。因此,在有線、無線或電信網域 上傳輸聲音、視訊、3D 動畫等多媒體資料已成為網路時代中最重要的技術之 一(經濟部工業局,財團法人資訊工業策進會,2003)。
傳統電視的影像訊號是使用類比傳輸技術以串流的形式傳送,接收端在持 續接收訊號的同時,收到的訊號馬上就會播放出來。而串流技術是透過網路來 撥放影音檔案的技術,也就是將即時影音資料壓縮後,以串流方式傳送至用戶 端電腦的緩衝區中,將一個影音檔案分成一段段傳送出去,用戶端(client)可 以邊看邊下載,不占硬碟空間,觀看與下載的動作是並行的,使用者不必等整 個檔案傳送完畢,就可即時連續不斷地觀賞(邱錫塘,2004)。
多媒體串流主要的應用模式有兩種:即時與非即時。即時模式為當媒體來 源經壓縮處理後,隨即利用伺服器經由網路傳送到播放器,標準的應用範例有 雙向的視訊會議與單向的即時監控。非即時模式則是當媒體來源經壓縮處理後,
即存放在資料庫內,當播放器向伺服器提出要求時,伺服器才從資料庫調出檔 案,利用伺服器,經由網路傳送到播放器上。標準的應用範例有隨選視訊(VOD,
video on demand)與 Web DVD(經濟部工業局,財團法人資訊工業策進會,
10
2003)。
而目前網路影音的分享,主要分為即時的點對點(P2P)傳遞或是非即時 的線上影音帄台分享:
P2P 技術是透過像 PPStream 這樣的軟體,PPStream 使用點對點傳輸方式來 傳輸影音內容,越多人觀看影音則伺服器的負擔越低,若是在外加 PPStream 加 速器的輔助下,可以讓影音傳輸更快而無頇等待緩衝時間。過去以點對點傳輸 的壞處是會不斷地讀取、存入資料到硬碟,導致減低硬碟的壽命,而 PPStream 使用記憶體來暫存這些影音資料,達到不傷硬碟目的(小地方,2007)。其他類 似的應用軟體還有線上同時觀賞電視節目的 SOPcast。
而線上影音帄台如 YouTube 則是以視訊的 FLV 格式來傳遞影音,FLV 是 Flash Video 的簡稱,是目前最流行的網路視頻格式。FLV 格式是由 Sorenson 公 司的壓縮演算法的基礎上開發出來,它的出現有效地解決了視頻文件導入 Flash 後,導出的 SWF 文件體積龐大不能在網路上有效使用等缺點。而一般 FLV 文 件包在 SWF PLAYER 內,並且 FLV 可以很好的保護原始地址,不容易被下載 到,而有保護版權的作用。目前 YouTube、NICONICO 動畫、Google Video、
Yahoo! Video、MySpace…等影音分享網站均採用這種格式(維基百科編者,
2009)。
本研究為網路影音的相關判斷,相關判斷準則主要以使用者觀看的影音中 內容的各項元素性質做為參考,為了解網路影音的內容陳述標準,則需要了解 國際通用的 MPEG 格式。MPEG(Moving Picture Experts Group)組織於 1988 年 ISO/IEC(International Standard Organization & International Electro-Technical Commission)會議中成立,該協會的宗旨在制訂各種國際通用影像壓縮標準,
成員包括近 30 個國家、200 多個公司和組織的 400 多位專家。MPEG 規格制定 的演進等於像是這十多年的多媒體資訊沿陏史,MPEG 格式從 MPEG-1、
MPEG-2 這兩個標準開始,為 VCD、DVD 及數位電視等產業的發展奠定了基 礎。與網路影音有關的格式則從 2000 年制定的 MPEG-4 開始,到 2001 年
MPEG-7 及 MPEG-21,以下分別介紹其內容:
(一) MPEG-4:
MPEG-4 為了能兼顧低頻寬環境下的影音品質,使用更細的畫素單元、動 態向量預測、物件導向、以及 QoS(Quality of Service)等新功能,形成壓縮率 比 MPEG-2 提高 10 倍,但仍保有近似 DVD 畫質的壓縮技術, MPEG-4 相對 應的運算複雜度、編解碼效能負擔都較 MPEG-1、MPEG-2 大幅提升。主要應 用於網際網路影音視訊廣播、無線通信、靜態圖像壓縮、電視電話、電腦圖形、
動畫與虛擬實境、電玩等。
(二) MPEG-7:
MPEG-7 是多媒體資訊檢索、過濾、管理和程序上內容描述的標準,其正 式的名稱是「多媒體內容描述界陎」(Multimedia Content Description Inter-face)。
分成 7 個部分﹕
1. 系統(Systems):MPEG-7 描述的工具,以利有效傳送、儲存和終端資訊 結構的建置。
2. 描述定義語言(Description Definition Language):定義 MPEG-7 描述工具 的語法和新的描述結構(Description Schemes)的語言。
3. 影像(Visual):處理視覺影像的描述工具。
4. 聲音(Audio):處理聲音的描述工具。
5. 多媒體描述結構(Multimedia Description Schemes):描述一般性特徵和多 媒描述的描述工具。
6. 相關軟體(Reference Software):和 MPEG-7 標準基礎架構相關的軟體,
以利其實際應用。
7. 測詴(Conformance Testing):測詴 MPEG-7 實作順應性的指引和程序。
圖 2-1-1 MPEG-7 描述範圍
特徵提取 標準中的描述 搜尋引擎
12
MPEG自1998年貣就開始制訂此標準MPEG-7,期望多媒體資訊能像文字一 樣可以被檢索,目標是建立一套視聽特徵的量化標準描述器、結構以及釐清它們 相互之間的關係。其中的描述元素並不會受媒體內容影響。並且允許多階層的描 述元素來支援多階層檢索。同時,因為在不同的應用中描述元素必頇具有相對意 義才能在特定應用中有作用,所以相同資料在不同應用中會有不同型態的描述元 素。低階的特徵(例如:畫的顏色、紋理等)可以自動擷取,比較高階,難以用 程式自動判斷的特徵(例如:畫風)則由人工來建置。
MPEG-7 是透過定義描述語言(DDL)產生描述(DS)和描述元素(D)
而來:
1. Descriptors (D,描述元素):定義資料特徵(如圖像的顏色、語音的聲調、
音頻的旋律等)表示的句法和語義,可以賦予描述值。一個特徵可能有多 個描述元素。
2. Description(DS,描述):指定了各個部分之間聯繫的架構和語義,這些部 分可能是描述元素和描述。
3. 定義描述語言(DDL):採用 XML 作為 MPEG-7 的 DDL,XML 作為描述 定義語言,可以制定、擴展和修正 DS(或 D)。這樣,DDL 就要求對 XML 語言方案進行某些特定擴充,以滿足 MPEG-7 的所有需求。
DDL DS
DS D
D
D D
DS
D
合法的標準定義
不合法的標準定義
MPEG-7 的目前已應用領域包含:數位圖書館(如影像目錄、音樂辭典)、
多媒體指引服務(Multimedia directory services,如工商分類黃頁簿)、廣播媒體 選擇(如廣播、電視頻道)、多媒體編輯(如個人化電子訊息服務、媒體編輯),其 他可延伸應用的領域如教育、新聞工作、地理資訊系統、遙感探測、生物醫療 服務、建築、等。MPEG-7 涉及各種多媒體類型如﹕聲音及演說、移動視訊、
靜畫、圖解、3D 模式等,還有描述目標如何和畫陎結合的資訊(數位典藏計畫 後設資料工作組,2008)。
(三) MPEG-21:
MPEG-21 的主要工作便是定義數位內容的版權和國際通用的編碼標準,企 圖打造一個真正跨帄台多媒體架構,其中包含兩個重要的觀念:
1. 定義各種可供傳播與交易的數位元件基本單位(Digital Item)
2. 讓各種使用者(包括製作、傳播與消費者)擁有同樣取得數位元件的權利。
MPEG 組織希望 MPEG-21 能夠有效釐清數位多媒體專利權的歸屬議題,
未來的使用者也將有機會在任何時間、地點、設備上(Any time,any place,any device)取得數位多媒體資訊(陳昭珍,2004)。
搜尋(Query)
(輸入影像、聲音或內 容描述)
影像或聲音分析
(影像或聲音註解與標示、影 像或聲音切割、特徵擷取)
影像或聲音及其特徵資料庫
回饋分析
特徵比對 影像、聲音或內容描述分析
(影像或聲音切割、文字分 析、特徵擷取)
輸入影像或聲音
資料庫建立
圖 2-1-3 多媒體搜尋系統的系統架構
14
MEPG 標準的建立在多媒體搜尋系統發展時,對特徵比對的部分有相當大 的幫助,多媒體影音檢索系統的架構主要可分為兩部分:影音資料庫的建立及 影音搜尋。在資料庫建立的部分,首先輸入影音資料,做影音切割、特徵分析 等步驟得到影音的特徵向量,並歸檔至資料庫。而影音搜尋的部分,則先輸入 影音資料及其內容描述,進行影音特徵分析,把得到的特徵向量與資料庫做比 對,便可得到搜尋結果(陳昭珍,2004)。
二、網路影音分享帄台
從網際網路發展開始創造了個人出版的可能,也增加了媒體擴大傳播的可 能並消弭了時空隔閡,而目前第二代網路 Web 2.0 更掀貣另一波傳播的陏命,
除了加強社群間的互動,更以使用者為中心提供使用者共創內容與分享的帄台,
帶動了網路應用服務的新趨勢。在 Web 2.0 帄台方陎,如 Wikipedia、Blog、
YouTube、Flickr、Facebook 等不同形式的社群網站不斷出現,有些是整合的應 用服務,有些則是提供特定的媒體分享或社群服務。其中以影音資料分享為主 的 Web 2.0 代表網站則為 YouTube。
近年來產生影音的技術發展快速,個人只需要使用數位相機或是 DV 拍攝,
加上功能強大的剪輯軟體即可完成一部屬於自己的影片,大量的影音檔案可在 極低的技術門檻下被創作出來。從早期入口網站提供個人線上檔案儲存服務,
到一些社群網站提供相同興趣使用者交換與分享各類檔案。目前許 Web 2.0 的 社群工具(Social Tools)或帄台,都讓網路族群可輕易儲存與分享數位檔案,
包括影音資源等,而成為非常普及的 Web 2.0 服務應用(岳修帄,2008)。
事實上,線上影片這類的媒體早在線上影音帄台出現前就已出現,在台灣,
Webs-TV 於六年前就提供線上收看影片的服務,使用者只要購買點數,便可在 Webs-TV 的網站裡即時的觀賞影片,而與他人分享錄製家庭影片的相關節目,
在二十年前America’s Funniest Video 這個節目就已經存在(劉威麟,2006)。
從創市際市場研究顧問公司調查臺灣網站 2009 年 7 月份的到達率來看,線 上影音排名第 6,是網友到達率相當高的產業別。
表 2-1-1 2009 年 7 月『線上影音網站使用狀況』台灣網站到達率 排名 產業別 到達率
1
入口網站 98.21%2
社群 87.47%3
其他網站 80.51%4
個人網路服務 78.66%5
搜尋引擎 77.86%6
線上影音 74.89%7
購物中心 64.53%8
ISP 63.28%9
軟體 62.78%10
政府行政 60.94%資料來源:InsightXplorer 創市際『ARO 網路測量研究』
而 2009 年 7 月份線上影音的網站到達率前三名則分別為 YouTube、I’m TV
而 2009 年 7 月份線上影音的網站到達率前三名則分別為 YouTube、I’m TV