• 沒有找到結果。

第一章 緒論

第一節 研究背景動機

第一章 緒論

第一節 研究背景動機

隨著網際網路的普及與儲存技術的發達,傳統於紙本上紀錄與傳遞資訊之方 式,得以透過網路以數位化的方式傳遞,大部份的民眾皆能夠利用網路快速的獲 取或是儲存資訊,而網路新聞也在這樣的環境之下蓬勃發展。以台灣的新聞業為 例,新聞報社除了經營傳統的紙本新聞外,也各自發展新聞網站,讓民眾能夠即 時、全天候於網路上接收新聞資訊。World Association of Newspapers (WAN) 於 2008 年針對全世界 232 個國家進行網路新聞閱讀的調查,其報告指出每日經由 網路散播的新聞大約多達 573,235,00 篇,有 1.75 億的人口閱讀這些網路新聞,

而目前已有將近 4,500 個新聞網站提供網路新聞(引自 Oliver, 2008)。

然而,網路新聞亦因網路的開放環境、媒介的多樣性、發佈的方便性等因素 產生了如 David Shenk(1997)所提及的資料煙霾(Data Smog)。提供網路新聞 的網站大致上有兩種,第一種是實體報社所建置的新聞網站,主要提供該報社記 者所發的新聞稿(紙本與網路同步刊登),例如:中央通訊社(CNA)的即時新 聞網1、中國時報(Chinatimes)的中時電子報2、聯合報(UDN)的聯合新聞網3、 台視新聞(TTV)4等等;另一種則是為了整合這些報社提供的網路新聞而出現 的整合式新聞網站,讓使用者能夠同時跨越多個新聞網站閱讀新聞,例如,Google

1 http://www2.cna.com.tw/

2 http://news.chinatimes.com/

3 http://udn.com/NEWS/mainpage.shtml

4 http://www.ttv.com.tw/news/

2

新聞5、Yahoo 新聞6、PCHome 新聞7等等。值得注意的是,除了整合式的新聞網 站會將報社新聞網站中的新聞轉載於其網站之中外,報社新聞網站也會轉載其他 報社新聞網站中的新聞,例如,圖 1 中自由時報將中央社一篇關於「塑化劑」

的新聞,連同原標題轉載於其網站中。雖然中央通訊社之背景屬較特殊的報社,

其販賣新聞稿或是消息來源予以其他報社,其同時發展新聞網站發布網路新聞稿,

對於一般大眾來說,這樣的環境導致內容相同的新聞重複的被刊登在不同的新聞 網站中,使用者必須自我過濾這些重複的新聞資訊。除此之外,由於 Web2.0 消 費端生產(Peer-produced)的概念,使得新聞網站也會有許多自由記者、網路記 者,或者一般網民進行投稿,和統一經過報社編輯發佈的紙本新聞相較之下,專 業性與可信度接受到質疑。

圖 1 自由時報電子報將中央社的新聞轉載於其網站中 資料來源:http://www.libertytimes.com.tw/index.htm

因應網路環境所帶來的資訊量龐大、重複、尋獲不易、以及可信度有待商榷 等問題,搜尋引擎、人工或自動化分類、視覺化介面等許多的人工智慧或網路技

5 http://news.google.com/nwshp?hl=zh-TW&tab=wn

6 http://tw.news.yahoo.com/

7 http://news.pchome.com.tw/

3

術不斷地被開發協助使用者消化這些網路資訊。搜尋引擎在今日往往能夠協助使 用者解決資訊量過於龐大的問題,然而,利用搜尋引擎獲取資訊的前提是使用者 確切的知道自己正在尋找目標,但是一般使用者不見得總是能夠清楚定義究竟想 要尋找什麼,也因此,使用者無法確切的組織關鍵字,獲得正確的資訊(Delphi Group, 2004; Pu, Chuang & Yang, 2002 )。 亦 有 研 究 者 利 用 自 動 化 摘 要

(Auto-summarizer)方法彙整歸納必要資訊予以使用者閱讀。自動化摘要的主要 作法為萃取多份與事件相關的新聞文章,進行彙整摘要後,產生描述事件重要人 事時地物的彙報使用者(劉政璋、葉鎮源、柯皓仁與楊維邦,2005;McKeown, &

Radev, 1995;Barzilay, Mckeown, & Elhadad, 1999;Bloedorn, 1999)。其可結合相 似性回饋(Relevance Feedback)、詞彙擴展(Query Expansion)、及術語推薦(Term Suggestion)的方法於使用者的搜尋結果中更進一步地取出相關的特徵與更多相 關的結果予以使用者作選擇。在資訊視覺化的技術方面,利用資訊視覺化的技術 能夠幫助使用者以更多的角度來瀏覽資料。加州大學軟體研究機構中的資訊視覺 化團隊在其網站上便提及:「資料以視覺化的方式呈現,是將資訊摘錄成視覺形 式,讓使用者更輕易的理解與辨識資訊中重要的特徵、快速的找到資料中的規則 與挖掘資料中更深層的含意。互動的資訊視覺化更能夠讓使用者經由呈現的改變 以更不同的視角檢視資訊」(Institute for Software Research at University of California, n.d.)。在新聞視覺化的應用上,國內則有 Tseng、Chang、Rundgren 與 Rundgren 於 2010 年利用資訊擷取方法取出新聞文件中的關鍵字並建立詞彙貢獻 關係,再將其繪製為網絡狀的概念圖(Concept Map)來引導使用者閱讀相關新 聞。

上述的網絡視覺化方法主要是以網絡圖來呈現辭彙、主題、概念與其間的關 係,目前已被應用在教育學習或資訊科學等數個領域中。其被認為能夠達到以下 功能:

4

1. 外化概念結構:概念圖能夠外化概念的關係網絡幫助人們將學習到的知 識概念化(Novak & Gowin, 1984)。

2. 資訊監控:例如 So-Net(n.d.)的 Blog Keywords Visualizer 提供網絡化 的部落格熱門關鍵字,即時呈現熱門詞彙的脈絡。

3. 導覽搜尋:輔助使用者進行資訊搜尋,例如,Tseng (n.d.)所開發的知識 入口系統平台(Knowledge Search Portal, KSP),以網絡圖幫助使用者搜 尋或瀏覽新聞。而網絡圖並不僅侷限於辭彙關係的表現,更重要的是關 係的連結使得兩辭彙更加的受到注視,且相互增強了兩辭彙在文字內容 中的背景知識。例如,「日本」與「地震」兩個關鍵字,若兩者單獨出 現,使用者可能會忽略此二關鍵字,但是當兩者存在關係連線時,使用 者可能會因此而產生興趣,想要進一步了解此二關鍵字究竟是在怎樣的 背景之下產生關聯的(Tseng, Chang, Rundgren, & Rundgren, 2010)。藉 著呈現關鍵字間的關係脈絡,有效地提供使用者相關關鍵字的推薦,使 用者不必憑空聯想與重新定義關鍵字。

綜以上所述,無論是透過資訊擷取或視覺化方法,過去發展的系統都在嘗試 導覽(Navigate)使用者,提供某資料群(Data Set)的概觀或者資訊給使用者。

導覽的目的也就是提供不同的觀察角度,讓使用者在瀏覽資訊時能夠自我定位而 減少迷失方向的情況(Tufte, 1990),而得以在龐大的資料中順利獲取所需的資 訊。因應使用者經常需要以時而宏觀,時而微觀的多重視角來掌握資訊的脈絡,

因此,本研究將設計一個動態視覺化互動新聞瀏覽輔助工具,導覽使用者以獲取 更好的網路新聞閱讀經驗。在實際執行項目上,本研究將文字處理的技術與視覺 化技術作結合,發展一套利用網路圖幫助使用者搜尋或瀏覽新聞的導覽視覺化系 統,其中納入更多視覺化繪圖的技術與互動功能的開發,希望能夠發展一套除了 在瀏覽或搜尋時能夠呈現關鍵字的網絡圖導覽使用者,同時還能夠讓使用者更加 彈性的切換觀察角度、記錄使用者的瀏覽過程,直接的與資料進行互動,引導使

5

用者利用這些功能尋找正確的資訊。