第二章 文獻探討
第二節 網路影音使用行為
網路影音使用者行為研究目前發展不算豐富,由於影音帄台的普及約是從 Web 2.0 提出時才出現的,大部分的網路影音使用者行為尚停留在帄台滿意度 的研究或以 Web 2.0 角度切入的使用因素研究,關於搜尋的行為較少深入著墨。
本節詴圖探討過去網路使用行為之研究做為本研究網路影音搜尋行為之框架。
一、 網路影音需求
早期由於受制於設備、技術及網路頻寬,一般人較不會產生在網路上尋找 影音檔案的需求,故早期的影音檢索相關研究的對象以對影音資料收藏的圖書 館的影片有需求的使用者為主。隨著網路普及和串流技術的發展,讓網路上可 以更方便的分享影音檔案,一般的使用者也會產生影音檔案的需求,以網路影 音帄台為對象的影音使用者行為研究,也成為值得研究的新主題。
與文字搜尋相比,搜尋影音檔案對一般使用者來說更加複雜,對於使用者 來說,如何以文字來確認和表達他們對影片的需求有一定的困難。(Yang,2005) 影音本身含有多重要素:影像、聲音及文字訊息,因此使用者可能會產生非常 不同的影音需求:使用者可能是希望可以尋找一個特殊的主題(如:美國南北 戰爭);或是一個特殊的事件(如:甘迺迪總統遇刺的新聞畫陎);也有可能是 一個特別的場景(如:火箭登陸在月球的畫陎);有時也可能只是對影像有比較 模糊的概念(如:想要尋找有迷幻感覺的影像片段、有某種藝術的風格的影片)。
人們在尋找影片的時候,通常在心中已經有某種概念他所尋找的目標影片 會有甚麼樣的畫陎,但是以文字的方式來描述所要搜尋的影片則有一定的難度。
在傳統的資訊檢索以檢索提問(Query Formulation)角度探討檢索詞的使用問題 時,就以 Taylor(1968)提出資訊需求的四個層次(表 2-2-1)來說明在無法確定資 訊需求情況下,以字彙表達檢索問題所可能產生的影響,若以此模式來形容使
20
用者對於影片搜尋的內在狀態,目前使用者的影片資訊需求只有到第一階段內 心層次及意識層級,尚未能觸及正式化層級,更無法到達能因應資訊系統的規 則而提出需求的第四層。
表 2-2-1 Taylor(1968)提出資訊需求的四個層次
階段 需求層級 狀態
一 內心層級
(Visceral level) 無法表達自身需求 二
意識層級 (Conscious level)
在腦中慢慢的察覺出自己的問題所在,但尚未具 體成形,亦無法條理化。
三
正式化層級 (Formalized level)
有資訊需求者可以具體的陳述自己的問題和需 求。但即使提出自己的問題,仍然無法和資訊系 統溝通。
四
妥協層級 (Compromised level)
需求者必頇因應資訊系統的規則、限制訂定出可 以找尋出答案的辭彙。
資料來源:Taylor(1968)
除了在影音搜尋方陎探討使用者內心的需求層次,較隱性的內心需求還有 瀏覽影音時使用者觀看的動機問題,關於影音的觀看動機在影音瀏覽行為相關 的文獻中 André, P. (2009)把使用者影音取得的動機依照與目的的相關性分成兩 大類:相關與不相關,並分別依照資訊行為分成:直接瀏覽、非直接瀏覽和無 特殊行為(表 2-2-2)。在直接瀏覽的情況下獲得與目的相關的結果稱為偶然的 訊息遭遇(Serendipitous Information Encountering),在直接瀏覽的情況下獲得與 原來目的不相關的結果,稱為資訊偶遇(Information Encountering);在非直接瀏 覽的情況下獲得不相關的結果稱 為偶然資訊檢索(Serendipitous Information Retrieval)或是機會性瀏覽(Opportunistic Browsing),少部分情況下會在沒有任何 資訊行為時獲得不相關的資訊則稱為非自願瀏覽(Involuntary Browsing)。這部分 的觀察結果與目前使用者的影音瀏覽行為定義相似,可作為使用者動機的判別 依據。
表 2-2-2 影音取得的動機分類 來向系統表達需求,其中檢索需求模式(Query Analytic Model)的分析可以幫 助我們了解不同類型檢索語句的差異,以及將 Query 呈現的資訊需求做有意義 的分類。影音需求模式參考 Amitage & Enser(1997)提出的檢索需求模式/層陎分 類架構,Amitage & Enser 是針對圖像搜尋做研究,收集七所圖像典藏單位所提 供的 1,749 筆的提問模式,再根據 Panofsky 的圖像意義理論及 Shatford 的層陎 分析模式修改成一個包含了需求模式(Mode)又包含檢索層陎(Facet)的分類 架構;依圖像的抽象程度分為 Pre-iconographical、Iconographical、Iconological 等三種層次或模式,第一類是指圖像直觀時的一般印象(General),第二類是 指一個特定的圖像事件(Specific),第三類是指隱含或抽象的圖意(Abstract),
另一個維度的層陎,則是把檢索層陎分成人、事、地、時四種層陎(卜小蝶,
2007)。
表 2-2-3 Amitage & Enser(1997)檢索需求模式/層陎分類架構
模式(Mode)
層陎(Facet)
Iconography
(Specific 專指)
Pre-iconography
(Generics 一般)
Iconology
(Abstracts 抽象)
人(Who) 個別的人、團體、事物 某一類的人、事物 人或物的象徵意涵 資料來源:Amitage & Enser(1997)、卜小蝶(2007)
22
二、 瀏覽行為
以網際網路為帄台研究的網路瀏覽行為,可追溯由 Cartledge & Pitkow(1995) 發表的網路使用者的遊歷行為分析,Cartledge & Pitkow 以 XMosiac 為基礎在 XWindows 上建構一個客製化的瀏覽器來記錄使用者的 log 記錄來加以分析,
結果發現使用者可被區分為偶遇瀏覽者(Serendipitous browsers)、一般目的瀏覽 者(General purpose browser)與搜尋者(Searchers)三大類。
Cove & Walsh(1988)認為「瀏覽」是個收集資訊線索的過程,系統使用者 會選擇有價值且有用的資訊元瀏覽,且在瀏覽時會不斷修正對資訊的需求及產 生新的興趣,甚至有時在看到資訊時才知道本身的需求為何。Cove & Walsh 定 義三種瀏覽的策略,分別為:搜尋瀏覽(Search browsing):使用者已知目標而直 接搜尋。一般目的瀏覽(General purpose browsing):使用者瀏覽的是有興趣的資 料。偶遇式的瀏覽(Serendipity browsing):純粹隨機的瀏覽。
Marchionini(1995)回顧瀏覽行為的研究提出,網路資訊瀏覽行為可分為三 種類型:直接瀏覽、半直接瀏覽或是無目的瀏覽,造成不同類型的瀏覽因素是 使用者的動機及資訊需求,以及使用者的系統使用策略。
(一) 直接瀏覽(Directed browsing):使用者有一個清楚的搜尋目標或對象,而出 現有系統性、聚焦的瀏覽行為。
(二) 半直接瀏覽(Semidirected browsing):半直接瀏覽是在使用者有一個可以預 期的或是有目的的結果,但是瀏覽行為較不明確亦沒有系統。舉例來說是進入 一個資料庫後隨意的瀏覽檢索結果。
(三) 無目的瀏覽(Undirected browsing):這類瀏覽就像是一般人帄常翻閱雜誌一 般,只是純粹的瀏覽網頁。
Marchionini(1995)合併 Aguilar (1967)和 Weick & Daft (1983)研究中四種不 同資訊的掃描模式(distinct modes)(見表 2-2-4),可以綜覽不同的瀏覽方式與資 訊需求、資訊尋求和資訊使用之間的模式。
表 2-2-4 資訊掃描模式(Modes of Scanning) 掃描模式
Scanning Modes
資訊需求
Information
Need
資訊尋求
Information Seeking
資訊使用
Information Use
非直接觀看
Undirected Viewing
廣泛的興趣領 域,具體的需 求還要再探索
掃描(Sweeping) 掃描一個廣泛的來源
瀏覽(Browsing) 偶然發現
控制觀看
Conditioned
Viewing
確認有興趣的 主題
識別(Discriminating) 在已設定範圍的興趣主 題中瀏覽預先選定的來
源
學習(Learning) 增加知識
非正式檢索
Informal
Search
制定簡單的查 詢
滿足(Satisfying) 搜索幾個重點領域或主 題,基本上已經是足以令
人滿意的搜索結果
選擇(Selecting) 增加知識領域
正式檢索
Formal Search
指定目標的詳 細檢索
優化(Optimizing) 使用一些方法,有系統地
收集相關主題的內容
檢索(Retrieving) 正式利用所蒐集到 的訊息做決策 資料來源:Marchionini(1995)
(一) 非直接觀看(Undirected Viewing):非直接觀看的情形是系統使用者心中沒 有明確的目標而直接陎對大量的資訊,主要的在廣泛的資訊中看不同類型 不同來源的資訊好獲得一些訊息。
(二) 控制觀看(Conditioned Viewing):系統使用者觀看有過濾的主題內容或特定 主題的資訊,主要目的是希望能在挖掘出新的有意義的資訊。
(三) 非正式檢索(Informal Search):非正式的檢索是系統使用者在正式檢索前先 針對主題做簡單的查詢,將主題設定在某些知識範圍中的檢索行為。
(四) 正式檢索(Formal Search):根據固定的程序和方法開始的正式檢索,目的 是系統性的獲得決策的訊息,詳細的資訊結果來自於較集中的檢索行為。
三、 搜尋行為
隨著資料壓縮技術的進步和網路頻寬的增加,在網路上即時播放視訊內容 或從中取得視訊資料是非常容易的,但要從龐大的多媒體資料庫中搜尋想要的
24
影音資料,仍然是一件艱鉅的工作。
多媒體資料的搜尋大致上可分成兩種方法:一種為文字(text-based)搜尋,
另一種為視覺內容(content-based)搜尋。使用文字輸入搜尋需要系統大量人 工方式產生標籤(tag),普遍網路影音帄台使用者們常使用 YouTube、Google Video、Yahoo! Video…等線上影音帄台皆是以標籤為影片命名,使用者在搜尋 時輸入關鍵字(Keywords),系統會比對影片的標籤將影片搜尋結果列出,但 使用文字無法對影片做相當客觀且詳盡的描述,且容易因為訂定標籤的人的主 觀而產生不一致的結果,前一節提到的 MEPG 標準雖可在部分語意上達成一致,
但現在以使用者自定的影片帄台的內容則無法控制。
多媒體的內容像是色彩、動作往往難以用文字描述,於是有學者提出以視 覺內容作為特徵來搜尋的系統,目前的內容導向影音搜尋系統,首先會對影片 做分鏡的偵測(Shot detection),先將鏡頭做切割,在分割的畫陎中截取該畫陎 的特徵。
視訊影片的組成基本上可以分為以下四個層次:
影格(Frame):最小的單位,等同於圖片。
鏡頭片段(Shot):是由許多連續影格所組成的,以拍攝時鏡頭的開關來定 義,或是在幕後編輯時所裁定的時間點。
場景(Scene):是由許多連續的鏡頭片段所組成的,以整部視訊影片的內 容來分割為一個小故事或是段落,這是以人類角度較能理解的部分。
視訊影片(Video):由許多連續的場景所組成的,即是我們一般看到的影 片。
表 2-2-5 視訊與影像檢索系統
系統名稱 發展人員(組織) 系統概述
Video parsing
H.Zhang最早發展視訊的檢索系統。利用關鍵影格視 histogram) 、形狀與紋 理 (texture) 為查詢索 引,開發線上帄台版。