基於讀者回饋探勘有助於新聞社群經營之新聞資訊 - 政大學術集成

全文

(1)國立政治大學資訊科學系 Department of Computer Science National Chengchi University 碩士論文 Master’s Thesis. 立. 政治大. ‧ 國. 學 ‧. 基於讀者回饋探勘有助於新聞社群經營之新聞資訊 Mining Useful News Information Based on User Feedback for Building News Community. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 研究生：邱偉嘉指導教授：陳志銘、劉昭麟. 中華民國九十八年十二月 December 2009.

(2) 基於讀者回饋探勘有助於新聞社群經營之新聞資訊 Mining useful news information based on user feedback for building news community. 研究生：邱偉嘉. Student：Wei-Chia Chiu. 指導教授：陳志銘. Advisor：Chih-Ming Chen. 劉昭麟. 立. 政治大資訊科學系. 學. 國立政治大學. ‧ 國. Chao-Lin Liu. sit. io. A Thesis. er. Nat. y. ‧. 碩士論文. submitted to a Department of Computer Science. n. v i l n C hChengchi University National engchi U in partial fulfillment of the requirements for the degree of Master in Computer Science. 中華民國九十八年十二月 December 2009.

(3) 致謝. 我在研究所的這段時間裡，每天盼的就是這天的到來。首先，我要感謝我的指導教授陳志銘老師及劉昭麟老師，由於陳老師不厭其煩的指導，好幾次想要放棄的時候，陳老師都會鼓勵我並且適時的給我支援，感謝劉老師教導我作研究者該有的正確態度，也提. 政治大. 供 MIG 的空間讓我使用，在兩位老師的指導下，讓我的研究能夠順利進行。同時也感. 立. 謝口試委員林守德老師、林信成老師及蘇蘅老師對於本論文的建議和指教，使得本論. ‧. ‧ 國. 學. 文能夠更加完善。. 感謝一起奮戰的 MIG 同袍，仁祥學長、Peter、智傑、正宗好人家樑、min（還有妳. Nat. sit. y. 的懶人包 XD）、George 以及摯友志彬、建中畢業的考瑞、海大的昭憲、建良、傑弟、. n. al. er. io. 小烏龜、兩百塊，還有 DLLL 的布丁、Cos、雁農、憶珊及助理玉玲，有你們的陪伴跟. i n U. v. 喇賽，讓我碩士生涯不孤單。要感謝的人太多了，謝謝大家！. Ch. engchi. 最後謹將本論文獻給我最愛的家人，我的父母邱東義先生、李美彩女士、我乾媽林玉釵女士、阿姨李美筍女士、我的姑姑和姑丈、表姊、妹妹和弟弟，感謝你們的支持及加油打氣，我愛你們！. 邱偉嘉 2009 年的最後一天. i.

(4) 基於讀者回饋探勘有助於新聞社群經營之新聞資訊. 摘要. 政治大. 近年來，由於網際網路的興起，網際網路已成為新聞媒體重要的傳播管道. 立. 之一，許多新聞網站如雨後春筍般的成立，而讀者也樂於使用這類更加便. ‧ 國. 學. 利、高互動性的新聞網站。但是媒體使用網路作為傳播管道，同時也面臨. ‧. 在傳統傳播模式所未遭遇的新挑戰，網路新聞媒體被迫需要創造獨特的內. y. Nat. er. io. sit. 容吸引使用者，也需發展具黏性的社群經營服務，才能與其他具有類似社. n. a 群互動機制的 Web 2.0 網站一較長短，留住廣大的使用者群。 v i l C n hengchi U. 本研究嘗試利用新聞為日常生活人們獲得資訊不可或缺管道的獨特優勢，提出一套有效利用新聞使用社群集體智慧(Collective Intelligence）機制，能夠自動化依據使用者顯隱性回饋，針對每篇新聞分析出分歧度、熱門度、話題性三個社群資訊，並以上述三個社群資訊挑選出合適的焦點新聞，以此促進新聞社群使用者對於焦點新聞的討論與互動，進而提昇新聞傳播的效益與新聞社群的凝聚力。實驗結果證實，本研究所提出的機制確實能夠. ii.

(5) 探勘出滿足大多數使用者關注焦點新聞資訊的需求，並且對於輔助記者掌握讀者對於新聞資訊需求及促進新聞社群經營方面都有很大的助益。. 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. iii. i n U. v.

(6) Mining Useful News Information Based on User Feedback for Building News Community. Abstract. 立. 政治大. In recent years, due to the rise of the information and communication. ‧ 國. 學. technologies, the internet has become one of most important communication. ‧. channel for Journalism. A long with drastically flourished on-line Journalism, models of readers’ information reception changed while they are enjoyed more. y. Nat. er. io. sit. convenient and interactive websites providing instant information.. n. At the same time, while as communication a mass media utilize internet v channel, it has also. i l C n brought h eunprecedented n g c h i U challenge. to traditional. communication. On-line Journalism has not only need to create unique content (information) to attract readers; but it also need to develop a more engaging community management services to interact with other communities with similar mechanisms of Web 2.0 sites to retain user’s attention. This study attempts to exam the proposed on-line journalism system for University Press community, which could automatically analyze readers’ community dataset of University newspaper; including opinion deviation indicators, popularity indicator, and topicality indicator of each news iv.

(7) (information). This system selects targeted news (information) according to above indicators to promote discussion and interactivity within readers’ community in hope to promote efficiency of news (information) communication and engagement within readers’ community. Experiment results reveal this proposed mechanism could satisfy most readers’ need for headline news; as well as assist Journalists’ understanding on their readers’ need while promoting on-line journalism social networking management.. 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. v. i n U. v.

(8) 目錄第一章緒論 ....................................................................................................... 1 1.1 1.2 1.3 1.4. 研究背景與動機 ......................................................................................................... 1 研究目的 ..................................................................................................................... 3 問題陳述 ..................................................................................................................... 4 章節架構 ..................................................................................................................... 4. 立. 政治大. 第二章文獻探討 ............................................................................................... 6. ‧. ‧ 國. 學. 線上新聞網站的發展與未來 ..................................................................................... 6 團體討論與決策行為 ............................................................................................... 10 使用者回饋之分類 ................................................................................................... 15 協同式推薦系統介紹 ............................................................................................... 18 隱性回饋 ................................................................................................................... 20 小結 ........................................................................................................................... 22. er. io. sit. y. Nat. 2.1 2.2 2.3 2.4 2.5 2.6. 第三章研究方法 ............................................................................................. 25. al. n. v i n Ch 3.1 新聞社群互動模式 ................................................................................................... 25 U i e h n gc 3.2 系統架構 ................................................................................................................... 27. 3.2.1 系統運作流程 ................................................................................................ 29 3.3 推論代理人 ............................................................................................................... 30 3.3.1 分歧度計算 .................................................................................................... 31 3.3.2 熱門度與話題性 ............................................................................................ 31 3.3.3 焦點分數 ........................................................................................................ 32 3.3.4 模糊邏輯推論 ................................................................................................ 33 3.3.5 決定模糊歸屬函數 ........................................................................................ 34 3.3.6 建立模糊規則 ................................................................................................ 36 3.3.7 解模糊化 ........................................................................................................ 38 3.4 系統實作 ................................................................................................................... 38. vi.

(9) 第四章實驗設計 ............................................................................................. 42 4.1 4.2 4.3 4.4 4.5. 實驗對象 ................................................................................................................... 42 社群分析 ................................................................................................................... 43 網站使用狀況探勘 ................................................................................................... 44 問卷調查及分析 ....................................................................................................... 46 研究限制 ................................................................................................................... 47. 第五章研究結果分析與討論 ......................................................................... 48 新聞基本資料分析 ................................................................................................... 48 讀者回饋資訊分析 ................................................................................................... 49 網站使用分析 ........................................................................................................... 56 社會網路分析 ........................................................................................................... 59 問卷分析 ................................................................................................................... 65 新聞案例分析 ........................................................................................................... 69 大學報實習記者訪談 ............................................................................................... 71. 立. 政治大. ‧. ‧ 國. 學. 5.1 5.2 5.3 5.4 5.5 5.6 5.7. sit. y. Nat. 第六章結論與未來展望 ................................................................................. 73. n. al. er. io. 6.1 結論 ........................................................................................................................... 73 6.2 未來展望 ................................................................................................................... 75. Ch. engchi. vii. i n U. v.

(10) 參考文獻 ............................................................................................................. 77 附錄一使用者問卷調查表 ............................................................................... 81 附錄二使用者問卷之對於本系統的意見調查表........................................... 83 附錄三新聞《人肉搜索揪關鍵人物》 ........................................................... 86. 政治大. 附錄四大學報實習記者與編輯訪談實錄 ....................................................... 88. 立. ‧. ‧ 國. 學. 附錄五大學報總編輯及副總編輯訪談實錄................................................... 93. n. er. io. sit. y. Nat. al. Ch. engchi. viii. i n U. v.

(11) 圖目錄圖 2.1 注意力經濟圖示 ............................................................................................................. 7 圖 2.2 使用者評分分類表[6] .................................................................................................. 16 圖 2.3 系統設計概念圖 ........................................................................................................... 24 圖 3.1 新聞社群互動環境三角模式 ....................................................................................... 25 圖 3.2 系統架構圖 ................................................................................................................... 27. 政治大圖 3.4 分歧度、熱門度及話題性之歸屬函數圖形[44] ........................................................ 34 立圖 3.3 模糊邏輯推論基本架構[21] ........................................................................................ 34. ‧ 國. 學. 圖 3.5 焦點新聞聚焦程度輸出歸屬函數圖形[44] ................................................................ 35 圖 3.6 系統首頁 ....................................................................................................................... 39. ‧. 圖 3.7 新聞瀏覽與註解介面 ................................................................................................... 40. sit. y. Nat. 圖 3.8 新聞回應介面 ............................................................................................................... 41. n. al. er. io. 圖 4.1 聚合樹表示圖[36] ........................................................................................................ 45. v. 圖 5.1 系統所選出的焦點新聞在使用者回饋上的表現 ....................................................... 53. Ch. engchi. i n U. 圖 5.2 平均瀏覽次數比較圖 ................................................................................................... 54 圖 5.3 平均回應次數比較圖 ................................................................................................... 54 圖 5.4 平均分歧度比較圖 ....................................................................................................... 54 圖 5.5 實驗組新聞瀏覽次數 ................................................................................................... 55 圖 5.6 對照組新聞瀏覽次數 ................................................................................................... 55 圖 5.7 實驗組新聞回應次數 ................................................................................................... 55 圖 5.8 對照組新聞回應次數 ................................................................................................... 55 圖 5.9 實驗組新聞分歧度 ....................................................................................................... 55 圖 5.10 對照組新聞分歧度 ..................................................................................................... 55 ix.

(12) 圖 5.11 巢狀回應設計 ............................................................................................................. 60 圖 5.12 使用者回應範例一 ..................................................................................................... 60 圖 5.13 使用者回應範例二 ..................................................................................................... 61 圖 5.14 使用者回應範例三 ..................................................................................................... 61 圖 5.15 實驗組基於議題討論社會互動網路圖 ..................................................................... 63 圖 5.16 對照組基於議題討論社會互動網路圖 ..................................................................... 64 圖 5.17 實驗組體育類新聞瀏覽次數 ..................................................................................... 70. 政治大. 圖 5.18 實驗組體育類新聞回應次數 ..................................................................................... 70. 立. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. x. i n U. v.

(13) 表目錄表 2.1 顯性回饋與隱性回饋之優缺點比較 ........................................................................... 18 表 2.2 可能被採用的隱性回饋資訊[26] ................................................................................ 21 表 3.1 分歧度、熱門度及話題性之歸屬函數定義 ............................................................... 35 表 3.2 模糊規則 ....................................................................................................................... 37 表 4.1 實驗組與對照組設計異同之處 ................................................................................... 43. 政治大表 5.1 新聞來源基本資料分析 ............................................................................................... 48 立表 4.2 問卷調查表類別與內容 ............................................................................................... 46. 表 5.2 使用者群組分析 ........................................................................................................... 49. ‧ 國. 學. 表 5.3 實驗組初始焦點新聞與系統推薦之焦點新聞列表 ................................................... 50. ‧. 表 5.4 系統推薦之焦點新聞與大學報之焦點新聞列表 ....................................................... 51. sit. y. Nat. 表 5.5 實驗組新聞讀者回饋資訊統計 ................................................................................... 51. io. er. 表 5.6 系統推薦之焦點新聞編號 ........................................................................................... 53 表 5.7 對照組新聞讀者回饋資訊統計 ................................................................................... 54. al. n. v i n C h ............................................................................... 表 5.8 實驗組與對照組平均分歧度差異 56 engchi U 表 5.9 網站Log檔範例 ............................................................................................................ 57 表 5.10 瀏覽路徑分析 ............................................................................................................. 58 表 5.11 兩組社群密度比較表 ................................................................................................. 65 表 5.12 使用者基本資料調查 ................................................................................................. 66 表 5.13 系統介面操作滿意度調查 ......................................................................................... 67 表 5.14 社群資訊滿意度調查 ................................................................................................. 67 表 5.15 焦點新聞滿意度調查 ................................................................................................. 68 表 5.16 實驗組個類別平均瀏覽及回應次數 ......................................................................... 69. xi.

(14) 1. 第一章. 緒論. 1.1 研究背景與動機隨著網際網路的發展與普及，網站數量也越來越多，讀者對於網路高品質內容的需求也. 政治大. 越來越高，同時，網路產業的發展潛力與創意導向，也吸引了各方的人才投入網路媒體，. 立. 相對的，傳統媒體正面臨巨大的挑戰。網際網路風行的趨勢，也同樣反映在新聞媒體的. ‧ 國. 學. 發展上，引發一波全球報業電子化運動熱潮，各家新聞媒體紛紛成立新聞網站，以因應網際網路發展潮流，如美國的 New York Times、CNN。而國內的傳統新聞媒體，如中. ‧. 時報系、聯合報系也紛紛跟進，將其原有的新聞上網，嘗試將網路即時互動的特性運用. io. sit. y. Nat. 在新聞報導上。. n. al. er. 由於線上新聞的許多特性，包括即時性、互動性、超文本（hypertext）等，使得新. Ch. i n U. v. 聞媒體經營模式產生改變，比如在新聞工作型態方面，記者因為新聞即時性的需求，需. engchi. 延長其工時；編輯需要改寫平面內容上網。在新聞內容方面，誠如 Pavlik[29]所言，線上新聞未來傳遞資訊的方式必然是不同於傳統媒體，這個差異並不單指資訊技術上的差異，而是線上媒體必須提供有別於傳統媒體的內容，以迎合網路需求。線上新聞所面對的競爭者是擁有整合資訊及便利性的入口網站、強調社群互動並且能提供獨特內容的 Web 2.0 網站，若新聞媒體僅以類似傳統平面內容作為吸引讀者最大賣點，是很難與之抗衡的。施盈庭[45]認為媒體所報導的新聞內容原本即為公共議題，與使用者息息相關，若能夠吸引使用者參與公共議題討論，並且媒體以中介者的身份有效的經營討論過程，將會是新聞媒體與其他競爭者對抗時，最佳的利器。當然，許多媒體也已經意識到這點，. 1.

(15) 陸續為其網站增加互動性，希望透過讀者互動產生有別於平面媒體之內容，藉以提升網站的質量。例如：聯合新聞網開闢「公共論壇」、中時電子報設計「新聞對談」的互動機制，但是在現有新聞網站中，往往只是形式上的設置，並未有效的利用使用者回饋之資訊提高網站質量。在期望透過公共事務的討論為網站加值的同時，需要關注於網站所提供的內容是否足夠吸引使用者參與，另一方面，這些參與討論的使用者是否產生所謂的團體極化的現象，因為在過去許多的研究中[15, 17, 35, 37, 38]，皆指出透過網路為媒介的討論，很容易形成所謂的團體極化甚至團體迷失現象，因此如何避免此一情況是非常重要的課題。. 立. 政治大. 要能夠吸引使用者主動貢獻資訊並不容易，維基百科（Wikipedia）被視為是以Web. ‧ 國. 學. 2.0觀念經營成功的案例，在Wales[40]的調查中曾經提及維基百科中有50%以上的編輯來. ‧. 自於0.7%的使用者，而最活躍的2%使用者參與了73.4%的編輯，剩下的26%由98%的使用者所完成，從這項數據中不難發現，即便是維基百科這樣具代表性的大型網站，願意. y. Nat. io. sit. 貢獻或參與討論的使用者往往不如想像中的多，大部分的使用者都處於觀看的狀態，僅. n. al. er. 有少部分的核心使用者願意積極的參與編輯活動，這樣的現象無疑成為以使用者貢獻為. Ch. i n U. v. 基礎網站的一道高牆，在中小型的網站中更是如此。除此之外，在Resnick[30] 與. engchi. Nichols[26]的研究中，也發現這類基於使用者回饋的應用，經常會面臨數據稀少的問題，而這更顯示出使用者貢獻的珍貴。因此，是否能夠從眾多的資訊中找出使用者所感興趣的主題並且吸引使用者貢獻資訊，進而產生有價值之內容，成為非常重要的議題。在過去網路並不盛行的時代，資訊是最有經濟價值的產物，然而由於網路的出現，改變了這一現狀，在這資訊爆炸的時代，我們並不缺乏資訊來源，缺乏的是能夠吸引使用者的資訊，新聞網站更是如此，新聞網站最擅長的便是提供資訊，新聞每日提供的資訊量遠超過使用者所能消化的範圍，因此，不論是站在媒體經營者的角度，或是站在讀者的角度，我們都希望能夠從眾多的資訊中挑選出能夠吸引讀者的主題，以符合使用者. 2.

(16) 需求，通常這一動作是由網站主編考量各方面因素後，挑選出合適的新聞作為頭條新聞。由一人所選出的新聞顯然不可能完全符合使用者需求，最瞭解讀者需求的必然是讀者本身，因此是否能夠透過資訊技術讓使用者自己來選出最合適的新聞作為焦點新聞。基於這個觀點，促使本研究提出「基於讀者回饋探勘有助於新聞社群經營之新聞資訊」想法，本研究希望透過結合資訊技術以及集體智慧，從眾多的新聞中，挑選出符合使用者期待之新聞資訊。. 立. 1.2 研究目的. 政治大. ‧ 國. 學. 儘管我們知道透過使用者對於公共事務的公共辯論能夠有效的創造吸引注意力的獨特. ‧. 內容，藉以提升新聞網站之質量，但是公共辯論的過程是一項極為複雜的程序，我們難以保證公共辯論的品質，甚至參與討論的使用者可能會陷入群體迷失的現象，並且要從. y. Nat. io. sit. 大量的資訊中找尋符合使用者需求的資訊，也需要一個好的解決方案。基於上述原因，. n. al. er. 本研究想要發展能夠從讀者瀏覽新聞過程所留下的使用者行為資訊，探勘出有利於新聞. Ch. i n U. v. 社群經營的潛在資訊方法。具體來說，本研究欲開發一個新聞平台，此平台除了能夠讓. engchi. 使用者方便閱讀新聞之外，也提供使用者進行新聞事件的討論，在使用者閱讀新聞時，系統會偵測讀者所留下的各式顯隱性資訊，進行資料探勘，歸納出有利於社群經營之資訊，最後回饋至系統中作為焦點新聞挑選之依據。本研究之目的為： 1.. 發展一套易於使用並且支援公共辯論之新聞平台. 2.. 探究基於使用者瀏覽行為之相關研究，決定合適的使用者資訊，作為探勘有助於新聞社群經營資訊的基礎。. 3.

(17) 3.. 探勘出「有助於公共辯論之資訊」，並且應用至系統中，驗證本研究所提出方法對於新聞社群經營的效益。. 4.. 歸納文獻分析與實驗結果，作為未來相關研究之參考。. 本研究以政治大學實習線上新聞為例，結合使用者閱讀行為與集體智慧貢獻，萃取出有利於公共辯論之潛在新聞資訊，並建構有助於新聞社群經營之網路新聞平台。. 1.3 問題陳述. 立. 政治大. ‧ 國. 學. 基於上述目的，本研究需要探討以下問題：. 如何建構一個具探勘「有助於公共辯論資訊」之新聞平台？. 2.. 如何選擇合適的使用者資訊。. 3.. 探勘出的新聞資訊對於新聞社群經營成效如何？. 4.. 探勘出的資訊如何影響使用者？. ‧. 1.. n. sit er. io. Ch. y. Nat. al. engchi. i n U. v. 1.4 章節架構本研究共分六章，每章探討的內容如下，第一章為緒論，說明研究背景、動機、目的、問題描述及論文架構；第二章描述了相關的文獻探討，包括了線上新聞網站的發展與未來、團體討論與決策行為、協同式推薦系統、顯隱性使用者回饋的研究；第三章具體說明系統設計與實作的細節，並且針對前一章所提到的問題，提出解決辦法；第四章則是根據本研究所提出的系統設計，進一步設計實驗方法，以驗證本研究所提出方法的正確性；第五章藉由統計數據、問卷及各種分析工具分析實驗最後的結果，具體說明本研究 4.

(18) 所提出方法所達到的效益；第六章總結本研究的貢獻及不足之處，並提出建議與未來研究方向，以利後續研究。. 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 5. i n U. v.

(19) 2. 第二章. 文獻探討. 由於網路發展日漸成熟，支援社群經營並且提供使用者進行互動的系統越來越多，學者也紛紛提出各種不同基於使用者回饋的應用與研究，故在本章中，將針對新聞網站的發展與未來作分析，並且針對團體討論與決策行為的議題作探討；也針對不同的使用者回. 政治大. 饋進行分析與探討；另外基於使用者回饋的應用是屬於協同式推薦系統，因此也開闢一. 立. 節的篇幅介紹協同式推薦系統；最後基於顯性回饋的不足介紹隱性回饋之相關研究。. ‧ 國. 學. 2.1 線上新聞網站的發展與未來. ‧. 隨著全球網際網路使用人口的不斷增加，使得網際網路繼報紙、廣播、雜誌與電視四大. sit. y. Nat. 媒體之後，成為第五大媒體[25]，各大新聞媒體紛紛成立新聞網站，如 News Time、BBC、. n. al. er. io. 聯合新聞網、中時電子報，新聞媒體也有充分的理由必須採網路作為新型態的傳播媒. i n U. v. 介，網際網路與傳統媒體有很大的不同，以下列舉網路新聞的主要特性： 1.. Ch. engchi. 即時性：以傳統報社為例，明日要刊登的新聞消息，大部分都是今天所發生的事件，但是在網路上，所有最新的消息都能迅速上網。. 2.. 不受空間限制：由於現今的行動設備日趨便利，越來越多的行動設備能夠上網瀏覽網頁，因此使用者可以在任何時間、任何地點上網閱讀新聞。. 3.. 客製化：新聞網站可依據使用者需求，為讀者提供量身訂製的個人化新聞，例如 Google News。. 4.. 低成本：比起報社印製與派送成本或是專業新聞節目的製作費，建立並且維護新聞網站的成本是相對低廉的。 6.

(20) 5.. 互動性：使用者可以透過網路高度的互動交換彼此意見與觀點。. 其中最重要的是網路具互動性，使用者可以透過評分、評論等功能反映意見或與其他讀者進行討論，當然電視、廣播、報章等傳統媒體也能夠透過電話 call-in 或者讀者投書等方式進行互動，但顯然這樣的互動相較於網路是比較受限的，例如在 call-in 節目中，因為媒體提供民眾表達意見的每一秒鐘都需要付出成本，在收視壓力的考量下，一般民眾僅能在很短的時間中，表達自己的想法，反觀在網路上，使用者擁有的互動空間與時間是不受限制的，人人皆可參與討論，而且提供這樣的互動所需的成本相較於傳統. 治政媒體是非常低廉的，從上述的幾個特性中，不難發現網路已成為新聞傳播最有力的平台大立之一。 ‧ 國. 學. Pavlik[29]指出，網路新聞媒體的發展可以分為三個階段：第一階段，新聞網站僅將. ‧. 傳統媒體原有的新聞內容重新包裝上網；第二階段，新聞網站開始結合網路技術製作新. sit. y. Nat. 的新聞內容，例如運用超連結（hyperlink）和搜尋引擎等互動形式，並嘗試某種程度的. io. er. 「客制化」（customization）功能，讓使用者可以依個人需要，選擇所欲接受的新聞或資. al. 訊；第三階段，新聞網站會以網路特性來規劃新聞內容，嘗試新的報導形式，以迎合使. n. v i n Ch 用者求新求變的需求，例如經營線上虛擬社群，Pavlik e n g c h i U認為第三階段是線上新聞網站未來發展的趨勢。. 圖 2.1 注意力經濟圖示 Goldhaber[9]在 1997 年時提出「注意力經濟」（attention economy），如圖 2.1 所示，指出過去「資訊經濟」（information economy）的學說在現今資訊泛濫的時代並不合適， 7.

(21) 根據經濟學的理論，稀少（scarce）之物才是經濟體系中具有價值的，在過去資訊缺乏的社會中，資訊的確成為經濟體系中最有價值的資源，但在現今社會中並不缺乏資訊甚至有過度氾濫的情況，注意力反而成為目前經濟體系中的稀少之物，因而我們需要更多的注意力來消化資訊，這一觀點得到了廣泛的認同，而網際網路更加速了此一現象的發展，如何吸引注意力已成為新經濟中最重要的課題。Bruns[5]在 2009 年時也提出其看法，認為「使用與滿足」的學說，已不再適合當前的研究需求。在工業時代，生產鍊是由「生產－分銷－使用」三個環節所構成，而網際網路的出現，使得生產與使用的分野. 政治大. 不再明顯，並且 Bruns 創造了「造用（produsage）」一詞來表明同時性生產（produce）. 立. 與使用（usage）的混合狀態，在網際網路時代，所謂的產品（production）已經不是工. ‧ 國. 學. 業時代那種具體的成品了，取而代之的是動態的造用過程，就像維基百科的詞條；開放源碼軟體（open source）的軟體包（package）；創用（creative commons）授權下的原創. ‧. 作品，這些都不是傳統意義上的產品，而是不停進化改變的作品，這些都是造用模式下. io. sit. y. Nat. 成功的範例。. n. al. er. 根據全球網站排名公司Alexa.com 1在 2009 年三月的統計，全球百大熱門網站中，由. Ch. i n U. v. 傳統媒體所建立的網站僅佔三名，分別是第 46 名的英國媒體BBC、第 50 名的CNN及第. engchi. 97 名的New York Times，而Yahoo、Google、Youtube、Wíkipedia、facebook、Myspace、 Blogger等入口網站與具Web 2.0 概念的網站占據了大部份前面的名次。再根據同一間公司的台灣網站調查，也可發現同樣的現象，在前 20 名中，僅第 19 名的聯合新聞網是由傳統媒體所建立的。從這項報告中，我們可以發現傳統媒體要以Pavlik所言的第二階段，也就是僅僅將網路作為傳播工具，是很難與入口網站、Web 2.0 網站相抗衡的。. 1. Alexa 網站排名的計算，是以網站的每天平均使用人數、人均訪問頁面數（與人數和人均頁數之乘積成正比）為基礎，以這二者的幾何平均數來排名。而正式名次，基於最近三個月之內資料的平均值。除全世界網站排名之外，Alexa 網站亦提供各種語言、地區、主題的分類排名。 8.

(22) Davenport[7]強調，在新經濟中，網站若要能吸引使用者，則必須具備「黏性」（stickiness），而要讓網站具黏性，則網站內容必須和使用者有關聯（relevance）、具便利性（ convenience ）、讓使用者「參與」（ engagement ），且讓使用者形成「社群」（community）。其中，前兩者是入口網站之所以勝於新聞媒體的關鍵因素，而後兩者則是 Web 2.0 網站的優勢，施盈庭[45]分析新聞網站若要在眾多競爭者中勝出，不能將那些與傳統新聞媒體幾乎雷同的新聞，當成是吸引使用者的利器，必須產出有別於其他資訊提供者的獨特內容，與其他競爭者有所區別。新聞媒體的優勢在於新聞是公共事務的. 政治大. 提供者，其所提供的事件原本就與大眾息息相關，新聞媒體可以透過使用者的參與和社. 立. 群形成，將公共事務內容與公共辯論過程作緊密結合，這無疑是其他內容提供者難以望. ‧ 國. 學. 其項背的優勢。. ‧. Rheingold[31]在其所著《The Virtual Community》中，描述虛擬社群是一群透過網路互相彼此交換有趣的話題與爭辯、參與討論的人們所形成的團體，而 Hagel[11]提出主. y. Nat. io. sit. 題的觀點，認為虛擬社群是在網路的環境中，經由社群成員針對一個特定的主題持續的. n. al. er. 經營，以使社群得以不斷地成長擴大；Adler[1]和 Inbari[14]則是以工具的觀點，強調人. Ch. i n U. v. 們透過電腦網路所提供的工具在虛擬社群上進行互動；此外 Lee[22] 則採用互動的觀. engchi. 點，定義虛擬社群為一個科技所支持的網路空間，以參與者的溝通與互動為主體，進而建立彼此之間的關係。綜合以上的觀點，一個虛擬社群的形成必須具有「主題」、「人」、「工具」和「互動」等四種重要特質。以經營新聞社群網站而言，新聞網站上眾多且廣泛的新聞早已具備社群討論所需的主題，並且這些主題足以吸引關心新聞事件或者對此感興趣的人們參與討論，但是我們仍然需要一個完善的工具支援社群間的互動與討論，更進一步為這些新聞內容與社群間的互動加值。. 9.

(23) 2.2 團體討論與決策行為由於網路科技具有不同於傳統大眾傳媒的互動性與即時性，許多人開始關注網路與民主參與，其中又可以區分為兩個陣營[12]，一方樂觀地認為網路可以帶來民主新契機，另一方則悲觀地認為網路將為民主帶來新的衝突及誤解。Rheingold[31]認為透過網路可以傳遞思想、辯論議題，以及動員公眾。Dahlgren[3]認為網路允許新的溝通空間產生，發展出一個另類的公共空間，也具有普遍性；Jason[19]也認同此一看法，認為網際網路就. 政治大左派與右派政治部落格各 20 個，發現這兩類的部落格之間很少有連結，結果是讓政治立是公民參與政府政策與決策的最好工具。相反的，Sunstein[37]在 2004 年的調查中分析. ‧ 國. 學. 偏左的更左，偏右的更偏右，真相並沒有越辯越明，反而是越辯越對立；Sunstein[38] 的觀點指出，在網路新傳播科技下，意見相同的人彼此會進行討論，到最後他們的想法. ‧. 和原先一樣，只是變得更極端；除此之外，Shenk[34]從網路使用者以及網路資訊的層面. sit. y. Nat. 提出批評，首先他認為網路雖然提供充足的資訊，但使用者如果不能找到適合、或是有. io. n. al. er. 用的資訊，那麼討論可能會存在偏見，無法進行有效的討論。. i n U. v. 一般的觀點很容易認為「群眾是盲目的」，群眾的智慧運作是複雜的，甚至容易受. Ch. engchi. 到某些影響而走調，但 Surowiecki[39]的看法是，在適當的條件下，可以讓群眾的智慧發揮其效力。Surowiecki 舉了一些簡單的例子說明他的看法，其中一個例子是在 1906 年科學家 Galton 出席的一場「西英格蘭家畜及家禽展」，會場舉辦一場猜牛隻重量的活動，在活動結束後，Galton 收集全部 787 人所猜測的重量加以平均後，發現竟然與牛隻真實重量僅相差一磅，換句話說，群眾的判斷幾乎接近完美；另一個類似但極為困難的例子：找出失蹤潛水艇的位置。1968 年，美國潛水艇天蠍號在北大西洋執行完勤務後失蹤，海軍軍官 Craven 召集不同背景的人，包括數學家、潛艇專家以及海難救難人員等，要求他們猜測潛艇可能的位置，他將所有猜測資料集中起來，利用貝氏定理（bayess. 10.

(24) theorem），評估潛艇下落，事後證實潛艇的位置距離克瑞文小組的評估地點，只有二百二十碼九誤差。雖然 Surowiecki 舉出了幾個發揮群眾智慧絕佳的例子，但是，在我們生活中卻存在更多的反例，顯然群眾智慧並不是在任何條件下都能運作的很好，有時其結果可能是相反的，因此 Surowiecki 也從眾多正反面的例子中，歸納出發揮群眾智慧的四個要素，說明如下：. 政治大由較多樣化成員組成的團隊。立. 多樣性：單由菁英組成的團隊，由於成員間具備的能力太相似，反而不會勝過. 2.. 獨立性：由於人類皆有從眾心理，在團體中即便自己有異議，寧願改變自己的. ‧ 國. 學. 1.. 意見也不願意破壞和諧，此一現象會與多樣性衝突[15]。獨立性對於群眾智慧. ‧. 非常重要，因為它能使一群人的錯誤不致發生關連，而不至因此危害到群體的. y. sit. n. al. er. 分權化：鼓勵多樣性獨立跟專業化以各司其職的方式運作，Linux 就是分權化. io. 3.. Nat. 判斷，獨立的個體也比較可能擁有新資訊。. i n U. v. 的好案例，每一個獨立的程式設計師都可以做出貢獻。 4.. Ch. engchi. 統合性：分權的缺點是某處發現的有用資訊，不一定能流傳到別的地方，所以這裡還需要一個能統合聚集的管道。. Surowiecki 分析一個團體會失敗，其可能的原因就是缺乏以上的四個要素，其中最容易發生的又是團體間失去多樣性以及獨立的意見，缺乏異議份子，進而產生團體極化（group polarization）或是團體迷思（groupthink）現象，以至於影響團體決策。尤其在網際網路世界中，常因為更多人的參與，群體極化的現象更勝於面對面的群體討論[35, 37]。. 11.

(25) 一般認為團體迷思這個概念是由美國心理學家 Janis 首先提出，Janis[17]認為當一個人處於凝聚力很強的團體中時，會由於過度追求維持團體間的和諧，而忽略團體決策的最初目標，以至於不能客觀的評估最好的決策方案。Janis[15]更藉由探究美國政府歷年外交決策事件，從各個事件的環境、決策過程、決策結果，歸納出八個團體迷思的模型，八個模型的成因與徵兆如下。八項誘發團體迷思的前置因素： 1.. 群體高度凝聚力. 2.. 群體隔絕外界資訊與分析. 3.. 命令式領導. 4.. 決策規範缺乏條理. 5.. 群體成員背景和價值觀的相似性. 6.. 來自外部威脅以及時間限制的壓力. 7.. 團體沒有信心挑戰領導所提出的方案. 8.. 成員自尊心低落：可能由於剛經歷失敗. 立. 政治大. 學. n. Ch. 八項團體迷思的表現形式： 1.. engchi. sit er. io. al. y. Nat. . ‧. ‧ 國. . i n U. v. 無懈可擊之錯覺：群體過份的自信和盲目的樂觀，忽視潛在的危險及警告，意識不到一種決策的危險性。. 2.. 集體合理化：群體通過集體將已經作出的決策合理化，忽視外來的挑戰。一旦群體作出了某個決策後，更多的是將時間花在如何將決策合理化，而不是對它們重新審視和評價。. 3.. 對群體道德深信不疑：成員相信群體所做出的決策是正義的，不存在倫理道德問題，因此忽視道德上的挑戰。. 12.

(26) 4.. 對外偏見：傾向認為任何反對他們的人或者群體都是邪惡和難以溝通協調，故不屑與之爭論；或者認爲這些人或者群體過於軟弱、愚蠢、不能夠保護自己，認為自己群體既定的方案則會獲勝。. 5.. 對異議者施加壓力：群體不欣賞不同的意見和看法，對於懷疑群體立場和計劃的人，群體總是立即給予反擊，但常常不是以證據來反駁，取而代之的是冷嘲熱諷。爲了獲得群體的認可，多數人在面對這種嘲弄時會變得沒有主見而與群體保持一致。. 6.. 政治大. 自我審查：成員對於議題有疑慮時總是保持沈默，忽視自己心中所產生的. 立. 疑慮，認為自己沒有權力可以去質疑多數人的決定或智慧。. ‧ 國. 學. 7.. 全體一致的錯覺：這是群衆壓力和自我壓抑的結果，是使群體的意見看起來是一致的，並由此造成群體統一的錯覺。表面的一致性又會使群體決策. ‧. 合理化，這種由於缺乏不同的意見而造成的統一錯覺，甚至可以使很多荒. Nat. sit. n. al. er. 心靈守衛（mindguards）：某些成員會有意地扣留或者隱藏那些不利於群體. io. 8.. y. 謬、罪惡的行動合理化。. i n U. v. 決策的資訊和資料，或者是限制成員提出不同的意見，以此來保護決策的合法性和影響力。 . Ch. engchi. 七項團體迷思對群體決策過程及結果的影響： 1.. 不全面研究替代方案. 2.. 不全面研究決策目標. 3.. 不考慮既定選擇的風險. 4.. 資訊蒐集不良. 5.. 資訊處理過程有偏頗. 6.. 不重新評估當初放棄的選擇. 13.

(27) 7.. 未制定突發情況的備用方案. 由於團體迷思的影響如此嚴重，Janis[16]也曾提出避免產生團體迷思的準則： 1.. 讓團員瞭解團體迷思的原因以及可能導致的後果；. 2.. 領導者應該保持中立；. 3.. 領導者應該引導成員提出批判性意見，並鼓勵提出反對意見和懷疑；. 4.. 應該指定一位或多位成員充當反對者的角色，專門提出反對意見；. 5.. 將群體分成小組，並將他們分別聚會擬議，然後再全體交流分歧；. 7.. 預備決議後，應召開「第二次機會」會議，並要求每個成員提出自己的疑問；. 8.. 決議達成前，邀請群體之外的專家與會，並請他們對群體意見提出挑戰；. 9.. 每個群體成員都應當向可信賴的有關人士就群體意向交換意見，並將他們的反. ‧. ‧ 國. 學. 6.. 治政如果問題涉及與對手群體的關係，則應花時間充分研究所有資訊，並確認對方大立會採取的各種可能行動；. y. Nat. io. sit. 應回饋至群體；. er. 10. 幾個不同的獨立小組，分別同時就有關問題進行決議。. al. n. v i n Ch 從以上觀點之中，可以得知要形成一個運作良好的團體，必須保持團體間的獨立 engchi U 性、多樣性、分權化及統整性，並且在團體討論的過程中符合必須由中立的領導者，不斷的鼓勵團員發表不同的意見與看法，彼此之間能夠交換意見，但又不會造成決策上的干擾，這些觀點正是本系統需要支援的，因此，本系統從使用者對於新聞的評分中，推論出新聞分歧度，並且應用於焦點新聞的推論之中，試圖將使用者看法較為分歧的新聞提升為焦點新聞，達到鼓勵團員發表不同意見的目的；並且在系統中使用者對於新聞的評分機制，是採取使用者必須在完成評分之後，才能夠看見其他使用者對於該篇新聞的評分，確保使用者的評分不會被他人所影響，以達到團體間獨立性的要求；另外，系統在推論的過程中，也採計了新聞被瀏覽的次數，作為新聞熱門度的依據，而新聞被瀏覽. 14.

(28) 次數，為一種隱性的使用者回饋，使用者不需明確的作出如評分或回應等動作，才能表達自身的意見，換句話說，系統中在焦點新聞的推論過程中已經考量了每一位使用者所作出的隱性回饋，這點對於保持團體間的多樣性有很大的助益；最後，本系統會統整使用者的評分、瀏覽、回應等顯隱性回饋作出合適的推論，以完成最重要的統整性要求。. 2.3 使用者回饋之分類. 治政一般而言使用者回饋（user feedback）可以分為兩種：一種為目標明確的顯性回饋（explicit 大立 feedback），另一種為隱含性回饋（implicit feedback）。 ‧ 國. 學. 具體而言，可分為下列幾種形式：. ‧. 顯性回饋：使用者審查某一目標物並且針對此目標物給予一個主觀的評分或一段文. y. sit. io. . Nat. 字描述。. 評分：要求使用者在閱讀過文件之後給予一個主觀的分數，GroupLens[30]與. n. al. er. 1.. Ch. Syskill & Webert [42]採用此方法。 . engchi. i n U. v. 文字描述：透過較自由的文字表達方式獲得使用者意見，例如：書評、電影評論或者問卷調查。. 2.. 隱性回饋：透過使用者的操作行為，估計使用者對於目標物的感興趣程度。 . 閱讀花費的時間：Morita與Konstan等人的研究[20, 24]。Morita將使用者閱讀項目的時間，與被使用者標示為感興趣的項目做比較，發現使用者閱讀時間與感興趣的項目有高度的正相關，並且將其應用於資訊過濾技術，使可能不會被使用者感興趣的項目濾除；另外，在Konstan的研究中，也得到類似的結果，而 Konstan是將此一結果應用於協同式推薦系統之中。採用此一方法最明顯的缺 15.

(29) 點是，透過簡單偵測技術所偵測到的使用者閱讀時間，不一定符合使用者實際閱讀時間，想要得到較準確的使用者閱讀時間，必須藉由眼動儀等較高成本的偵測設備。 . 滑鼠點擊行為：White與Joachims等人的研究[18, 43]採滑鼠點擊行為做為使用者對於項目的喜好與否之依據，並且應用於查詢語句的擴展；Joachims將滑鼠點擊行為做為查詢結果正確與否的判斷。兩者的研究皆顯示滑鼠點擊行為可做為隱性回饋之一，但並不能夠完全信賴此一回饋，並且此種作法將會受限於特定使用環境。. 立. 政治大. ‧ 國. 學. 圖 2.2 為學者 Claypool [6]所提出使用者評分分類，在這張二維的圖表中，橫軸代表評分值較接近明確或隱含；縱軸代表評分值是針對整體項目，例如網頁內容，向下則代. ‧. 表此評分值較針對項目的結構或內容，例如網頁的佈局（layout）或是字體顏色。. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 2.2 使用者評分分類表[6] 以實際的例子來說明，在 GroupLens 系統中[30]，會要求使用者針對閱讀過的新聞給予 1 到 5 分的評價，這個分數可以清楚的表示使用者對於該新聞的喜好程度；而 Syskill & Webert 系統中[42]，也以特定的符號來代表使用者喜歡或不喜歡某一網站。另一方面，. 16.

(30) 隱性回饋則是從使用者瀏覽網頁的動作或行為中，推論使用者對於某項目的喜好，例如 White[43]的研究中以使用者是否瀏覽某一網頁，判斷使用者是否對於該網頁有興趣。採用顯性或隱性使用者回饋資訊進行資料探勘，各有其優缺點。顯性回饋的優點在於回饋的動作與目標明確，回饋的資料容易瞭解且易於使用，透過系統的幫助使用者可以從其他人的經驗中得到好處；缺點在於這樣的回饋行為通常需要改變使用者的閱讀習慣、增加使用者負擔。Grudin[10]指出蒐集用戶回饋的成本及利用這些回饋資訊所產生出的效益之間的差距是非常重要的，若用戶不能感受到參與這樣的社群活動，並且感受. 治政貢獻資訊所得到的好處，則使用者可能會降低分享回饋的意願，轉換為僅閱讀文章的狀大立態，也就是所謂的冷啟動問題（cold-start problem）。更糟的情況是，這會導致數據稀疏 ‧ 國. 學. （sparsity）的現象，進而影響系統所能產生的效益，形成一個惡性循環，這樣的情形可. ‧. 能發生在任何需要顯性回饋的系統中[2]。隱性回饋的優點在於其回饋資訊是從使用者瀏覽行為中由系統推論所得到，因此降低了使用者回饋的成本；但缺點是不能保證由系統. y. Nat. n. al. er. io. sit. 推論出的數據的正確性。表 2.1 分別列出顯隱性回饋的優缺點比較。. Ch. engchi. 17. i n U. v.

(31) 表 2.1 顯性回饋與隱性回饋之優缺點比較顯性回饋. 隱性回饋. 優點. 1. 易於瞭解與使用、回饋數據較準確 2.. 缺點. 1. 2. 3. 4. 5.. 改變使用者閱讀習慣增加使用者回饋的成本降低使用者的使用意願可能面臨資料稀疏的問題可能面臨冷啟動的問題. 立. 無需改變使用者閱讀行為降低使用者回饋的成本. 無法保證資料正確性. 政治大. 從以上的分析中，我們可以知道顯性與隱性回饋各有其優劣，因此本研究所提出之. ‧ 國. 學. 研究方法將結合兩者，在使用者顯隱性回饋中進行資料探勘及推論，找出有利於公共辯論與提升網站社群經營之潛在資料。. ‧ sit. y. Nat. er. io. 2.4 協同式推薦系統介紹. al. n. v i n Ch 推薦系統是分享評價的一種應用，以他人意見為基礎幫助人們做出選擇。在日常生活之 engchi U. 中，我們會詢問朋友和同事對於書籍、電影、雜誌或汽車的意見，做為我們選擇的參考，顯然我們相信這樣分享評價行為有助於資訊的過濾，也應該被應用於資訊過濾（information filters）。一般而言，推薦系統是以「人們過去給予事物的評價可能也會在未來保有相同的喜好」概念為基礎進行推薦。推薦資訊有三個步驟，首先收集使用者資訊，並加以統計與分析；再依據前一步驟所得到的結果，進行相似度的計算，並推薦給使用者；最後使用者可以針對系統推薦之項目做喜好程度的評比，回饋給系統。. 18.

(32) 協同過濾推薦技術最早於 1992 年，由 Goldberg[8]等學者在 Tapestry 系統中所提出，該系統主要目的在於過濾電子郵件，後來延伸到所有的電子文件。使用者可以透過 TQL(Tapestry Query Language)的查詢語法進行查詢(Query)，使用者經由不同的 Query 過濾出自己有興趣的信件。但此系統仍需使用者被動的以建立查詢的方式來過濾使用者喜好的信件，而非系統主動的對使用者進行推薦。 Resnick[30]在 1994 年時提出一個開放式架構應用於 GroupLens，GroupLens 是一個具協同式過濾功能的電子新聞看板，允許使用者在閱讀完新聞之後，可以針對新聞做出. 治政評價，GroupLens 採兩個步驟進行協同式過濾，首先找出與使用者過去的評價相似的使大立用者，再觀察他們對於新事物的評價，進而預測該使用者可能給予的評價。另外，相似 ‧ 國. 學. 的使用者之間關聯度不全然相同，因此他提出的演算法也考量使用者過去評價的關聯度. ‧. 做為預測值的加權，由於 Resnick 所提出的推薦系統架構，可以很容易的被應用於其他系統之中，因此，在後續研究或實際應用之中皆可發現相似之處。. sit. y. Nat. io. er. Shardanand 等學者所發展的 Ringo[33]音樂推薦系統，提供使用者可以自行設定使. al. 用者日誌（user profile），以表達自身喜好音樂領域，藉此系統便可找出相似喜好的使用. n. v i n C hVideo Recommender[13]是一個影片推薦系統，由於者進行推薦或反推薦項目。Bellcore engchi U 影片本身以現有資訊技術而言很難採取有效的內容相似度計算，並且使用者對於影片的喜好經常帶有別於專家的個人風格，因此此系統是直接採以評分的方式，透過協同間相似度的計算進而推薦影片，其研究結果也顯示協同式推薦要優於專家推薦許多。其他類似的研究有 Fab[4]，Fab 是史丹佛大學數位圖書館的一個計畫之一，它是一個協同式及內容導向式（content-base）的混合式推薦系統，使用者可以設置自己的日誌檔描述自身的喜好，並且在讀取過文章之後給予評分，系統會根據使用者日誌以及評分推薦使用者尚未讀過的文章，若使用者在系統中由於相似的讀者太少使得系統無法推薦文章時，Fab 仍然可以從使用者曾經給予好評的文章中，採取內容相似度的計算進而推薦文章。. 19.

(33) 如上述所敘之諸多研究，推薦系統皆嘗試從使用者在系統上所留下的資訊歸納每位使用者的興趣與嗜好，將喜好類似的使用者群聚，再由相似群組中找出值得推薦的項目，為每位使用者在進行瀏覽或交易前提供推薦服務，使用者不再需要盲目的找尋其需要的項目，皆可從使用者回饋中得到，而此一做法也成為協同式推薦系統發展至今主要的核心，並且推薦系統的發展已趨於成熟，廣泛的被應用於各式各樣的商業系統之中，例如 Amazon、eBay 等，都是在電子商業網站中使用推薦系統成功的例子。但是從這些研究中，我們不難發現協同式推薦依然存在其缺點，像是新進的使用者尚未在系統中留. 政治大. 下評分紀錄，或者使用者不願意留下個人的喜好資訊，我們便無法採取有效的推薦策. 立. 略，這也是 Fab 推薦系統之所以同時考量協同式推薦與內容相似度計算之原因。. ‧. ‧ 國. 學. 2.5 隱性回饋. y. Nat. io. sit. 雖然協同式推薦系統已被廣泛的應用到實際的商業網站中，但這類基於顯性回饋的應用. n. al. er. 並不是沒有缺點，存在著幾個可能會遭遇到的問題，諸如：如何決定合適評分尺度、如. Ch. i n U. v. 何激勵使用者參與貢獻[2]、存在偏見的審查者（biased evaluators）[28]、如何避免過多. engchi. 使用者僅處於閱讀的狀態（free-riding problem）[27]、可能存在數據稀疏的問題、冷啟動問題等等。因此有許多的研究轉而思考是否能夠透過隱性回饋來避免上述的情況， Konstan[20]認為理想的解決方法是透過使用者的閱讀行為推論出隱性評分，希望透過隱性回饋能夠有效的降低使用者審查的成本，進而解決顯性回饋可能面臨的問題。過去已有許多類型的隱性回饋研究被提出，Nichols[26]針對這些使用者行為做了詳盡的分析，表 2.2 為 Nichols 所提出可以被採用的隱性回饋資訊，表中的使用者行為皆帶有較強烈的目標，例如：購買表示使用者對於目標物給予正面的評價；閱讀時間、存儲與列印則表示使用者可能對於目標物感興趣；而刪除則可代表使用者對於目標物可能. 20.

(34) 給予較負面的評價，或是較難引起使用者興趣。能作為隱性回饋的使用者行為眾多，選擇合適的使用者行為作為隱性回饋，才能夠有效的降低使用者審查的成本，以本研究而言，採用的是使用者閱讀文章時的點擊紀錄。表 2.2 可能被採用的隱性回饋資訊[26] Action. Notes. Purchase (price). Bus item. Assess. Evaluates or recommends. Repeated Use (Number). e.g. multiple check out stamps. Save / print. Saves document to personal storage. 政治大. 立. Delete. Deletes document to personal storage. Reply (time). Replies to item. Mark. Add to a ‘marked’ or ‘interesting’ list. Examine / read (time). Looks at whole item. Consider (time). Looks at abstract. ‧. ‧ 國. Cites or otherwise refers to item. 學. Refer. Nat. Sees title / surrogate in list. Associate. Returns in search but never glimpses. er. io. sit. y. Glimpse. Query. n. al. Association of terms from queries. Ch. engchi. i n U. v. ProfBuilde的研究[41]分別以協同過濾式與內容導向式的演算法為使用者產生兩組推薦清單。內容導向式的推薦方法主要針對使用者瀏覽的網站，根據網站的內容與使用者的喜好，推薦使用者相似性高的網站。而協同過濾式的方法主要針對使用者瀏覽網站的路徑，從眾多使用者中群聚相似的網站瀏覽路徑，為使用者推薦相關的網站。同時提供兩種不同方法所產生的推薦結果，以彌補單一方法的缺點與不足。 White[43]在2002年的研究中，針對兩種截然不同的回饋機制－明確的回饋、隱性的回饋在查詢語句擴展中的應用做出了比較。將使用者是否查看文件作為隱式回饋的依據，在對照組方面，則是直接採用明確的要求用戶指定哪些文件是其感興趣的，兩組皆. 21.

(35) 採用相同的演算法作為語意擴展的排序，其研究結果指出在他們的研究假設下，隱性回饋是能夠代替明確的顯性回饋，但隱性回饋是否能夠完全的取代明確回饋則需要更多的研究佐證。 Joachims[18]嘗試以點擊資料判斷使用者搜尋時所得到的查詢結果是否相關，另外結合眼動儀（eye tracking）作為實驗分析的工具，而他們的實驗就果顯示點擊紀錄在一定程度上是能夠作為查詢結果相關性的判斷，但是並不完美。. 政治大的好處與成本，根據其研究中的證據表明隱性評比有很大的潛力作為顯性評比的替代方立 Nichols[26]在研究中討論了採用各種隱性評比（implicit rating）對於資訊過濾應用. ‧ 國. 學. 案，Nichols建議隱性評比可能結合現有的評價系統組成一個混合系統，是比較好的方法。而其中一種方法是使用隱含的數據作為一種檢查率，如果評比是明確的項目，那麼. ‧. 應該有一些對應的隱性數據，以確認文件實際上已經審查，如果沒有證據證明評估審查. sit. y. Nat. 的項目，那麼他們的評價應該被忽略或減少其重要性。反過來說，一個相對較長審查的. io. n. al. er. 時間，可能需要提高其重要性。. 2.6 小結. Ch. engchi. i n U. v. 本章已針對傳統新聞網站面對擁有各式新穎功能的網路新聞入口網站時的劣勢進行深入探討，並歸納出結合「社群」與「新聞內容」是一種增加網站黏性，促進新聞傳播與良性互動的方式，並且使用者也期待獲取更多讀者新聞觀點、新聞脈絡、值得關注新聞等重要新聞資訊。因此，本研究期望使用者透過本研所發展具新聞社群經營機制之新聞平台所提供的包括讀者評論及回饋、讀者評分、新聞閱讀標註等互動功能，留下多樣化的意見為網站內容加值，然而牽涉到團體間的互動討論就有可能面臨前面章節所描述的團體極化或迷思現象，所幸研究學者已提出了一些建議準則來避免這些現象，而本研究也基於上述互動機制所提供的使用者回饋資訊，推論出包括熱門度、分歧度及焦點分數. 22.

(36) 等支援社群經營之隱含資訊，以有效支援社群互動，且本研究收集使用者回饋資訊的策略一併考量了專家所提出之建議，系統設計概念如圖 2.3 所示，詳述如下： 1.. 使用者回饋選擇：本研究選擇新聞的評分、回應及瀏覽次數三個使用者回饋，其中評分及回應是屬於顯性回饋，新聞的瀏覽次數是屬於隱性回饋，同時考量了顯隱回饋，因此可以互補兩者的優缺點，進而推論出分歧度、話題性及熱門度三個社群分數。. 2.. 新聞分歧度設計：分歧度的考量是根據使用者給予新聞的評分，評分的方式是採取. 治政大此一設計是為了保持使用者每一次的評分完全是出於自身對於新聞的獨立看法，並立未受到他人評分的影響，以符合 Surowiecki[39]所提出的團體間獨立性要求。. 使用者必須先對新聞做出評分後，才能夠看到他人對於該篇新聞的分數方式進行，. ‧ 國. 學. 3.. 新聞熱門度設計：在新聞的熱門度上我們考量了顯性的使用者回應及隱性的使用者. ‧. 點擊紀錄，由於點擊紀錄是一種隱性回饋，因此，即便使用者在社群中不是最活躍的一群，較少做出明確的評分、回應等顯性回饋，其點擊紀錄也會被系統作為焦點. y. Nat. io. 焦點分數推論：焦點分數是整合分歧度、話題性及熱門度三個社群分數所推論出來. n. al. er. 4.. sit. 新聞推論的依據，此作法符合 Surowiecki[39]所建議的保持團體間多樣性。. i n U. v. 的，將被用於焦點新聞的排序上，這個推論機制即是 Surowiecki[39]所提出的整合. Ch. engchi. 性要求，並且推論過程考了分歧度及話題性兩個社群分數，試圖將能夠引起多方不同看法的新聞，提昇至焦點新聞，鼓勵社群成員多發表不同的意見，此一作法符合 Janis[15]所提出避免團體迷思的建議。透過這些使用者回饋收集策略，設計出基於讀者回饋探勘有助於新聞社群經營之新聞資訊平台，並探討此一平台對於新聞社群經營的效益。. 23.

(37) 立. 政治大. ‧ 國. 學圖 2.3 系統設計概念圖. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. 24. i n U. v.

(38) 3. 第三章. 研究方法. 本研究採取較容易收集的使用者資料作為系統的回饋資訊，以降低數據收集的困難，收集的使用者資料包括使用者對於個別新聞的評分、使用者對於新聞的回應次數及使用者. 政治大. 點擊新聞紀錄，並從這些使用者回饋資料推論出新聞事件的分歧度、熱門度及焦點分. 立. 數，作為提昇新聞社群討論熱度促進互動的有效機制。. ‧ 國. 學. 3.1 新聞社群互動模式. ‧. 本研究目的在於建構一個支援新聞讀者互動的新聞社群平台，根據前一章所統整的促進. y. Nat. sit. 社群互動概念，提出如圖 3.1 所示之新聞社群互動環境三角模式，在此模式中，構成社. n. al. er. io. 群互動主要的元素有系統、社群機制與新聞內容，並從三要素彼此互動的過程中，建構出專屬於新聞社群經營的獨特模式。. Ch. engchi. i n U. v. 圖 3.1 新聞社群互動環境三角模式. 25.

(39) 1.. 系統：系統是整體新聞社群互動環境的基礎建設，是由網頁伺服器、伺服器端程式與資料庫管理系統所構成。. 2.. 社群：在系統中的社群是由管理者、記者及讀者所組成的，讀者是指在系統中閱讀新聞，並且參與討論的使用者，而記者則負責編輯與發佈新聞，管理員則是具有文章刪除/恢復/鎖定、帳號封鎖/開放、系統設定/維修等較高權限的使用者，三種使用者角色形成新聞社群主要經營對象。. 3.. 政治大別之中，每一類別均為不同的主題，而類別中的新聞則是該類別報導的新聞事立新聞內容：新聞內容是由記者所發佈的，依據不同的內容發佈到不同的新聞類. ‧ 國. 學. 件集合，社群中的成員可以針對其感興趣的主題，透過系統所提供的功能進行瀏覽與互動，這些互動行為將作為探勘有助於新聞社群經營資訊之用。. ‧. 而系統、社群、內容三要素之間的運作過程，則是由「平台技術」（Platform. Nat. sit. y. Technology）、「知識組織」（Knowledge Organization ）和「互動機制」（ Interaction. n. al. er. io. Mechanism）三大面向加以串接，形成完整體系，簡述如下： 1.. Ch. i n U. v. 平台技術：在「系統」與「社群」間透過平台技術做為媒介，將新聞內容及社. engchi. 群資訊完整呈現並提供利用，在新聞社群互動環境裡，無論是讀者、記者、管理者皆須對系統有所瞭解。 2.. 知識組織：「新聞內容」經由主編分類組織後發佈於新聞系統平台，以作為新聞社群網站吸引讀者閱讀主要內容。. 3.. 互動機制：「社群」可以藉由系統所提供的各種互動機制，以達社群成員對於新聞內容的回饋，並且社群成員之間也能針對彼此的看法互相交換意見。. 26.

(40) 「系統」、「社群」及「新聞內容」三個元素，在經過互動之後，原先的「新聞內容」將轉變為動態的「造用內容(Produsage Content)」，而這個動態的作品即是 Bruns[5]所提出的造用概念，以符合網路使用者隨創隨用的需求。如上所述，在新聞社群互動三角模式中，已經具備形成一個社群所需的四項特質「人」、「主題」、「互動」及「工具」，新聞內容即是主題，而被主題所吸引並且參與討論的人則是三角模式中的社群成員，而系統必須完善的支援三者間的互動，關於系統如何支援一個新聞社群互動的細節，將在後續章節說明。. 立. ‧ 國. 學. 3.2 系統架構. 政治大. ‧. 圖 3.2 為系統架構圖，本系統由三個資料庫與五個代理人所構成，三個資料庫分別為：. sit. y. Nat. 存放原始新聞的新聞資料庫（News Database）、負責儲存使用者顯隱性回饋資訊的使用. io. al. er. 者回饋資料庫（User Feedback Database）及存放由使用者回饋資訊中所推論出的潛在資. n. 訊資料庫（Latent Information Database），而代理人的說明如下：. Ch. engchi. 圖 3.2 系統架構圖. 27. i n U. v.

(41) 1.. 資訊萃取代理人（Information Extraction Agent）：本研究是以政治大學大學報作為新聞的來源，利用資訊萃取技術將新聞資訊從 HTML 網頁中萃取出來，主要可以分為兩個步驟： . 以 Crawler 程式從大學報網站上擷取含有新聞內容的 HTML 頁面。. . 針對上一步驟所取得的新聞網頁，透過 HTML 標籤分析，取出新聞內容、發布日期及記者姓名等有用資訊，進而存入新聞資料庫中。. 2.. 政治大. 新聞顯示代理人（News Display Agent）：依據系統考量的新聞熱門程度、分歧. 立. 程度及討論的熱烈程度進行焦點分數推論，決定哪些新聞為焦點新聞，並將焦. ‧ 國. 學. 點新聞放在新聞網站首頁供使用者瀏覽，同時系統也提供以新聞熱門程度及分歧程度為基礎的排序列表，新聞熱門程度可以顯示哪些新聞被熱烈討論，分歧. ‧. 程度可以顯示哪些新聞讀者的意見分歧度較高，或是讀者可由系統所推薦的焦. Nat. sit. y. 點新聞列表中針對他所感興趣的項目進行瀏覽，而新聞瀏覽介面除了提供新聞. n. al. er. io. 內容之外，系統也會列出相關的各項顯隱性統計，例如：新聞被瀏覽次數、評分狀態統計、回應與詞彙註解等。 3.. Ch. engchi. i n U. v. 顯性回饋紀錄代理人（Explicit Feedback Record Agent）：本系統提供多種顯性回饋的機制供使用者發表意見及互動，包括評分、回應新聞事件、新聞詞彙註解，其中評分功能劃分為 1~5 分，每位使用者僅能對一文件做一次評分的操作，並且使用者在完成對新聞評分之前無法看見其他人的評分，此一作法能夠降低其他人對於使用者評分的影響，使用者必須以自身對於新聞的看法作評分，如此能確保團體間的獨立性。最後，這些使用者回饋資訊都將被記錄下來存於使用者回饋資料庫。. 28.

(42) 4.. 隱性回饋偵測代理人（Implicit Feedback Detection Agent）：除了顯性回饋之外，本系統也有隱性回饋偵測代理人負責監測使用者的閱讀行為，其偵測的項目是使用者瀏覽的點擊紀錄。採用隱性回饋主要目的是降低冷啟動的影響，使用者不需要直接的做出明確回應，在其瀏覽的過程當中，系統便會自動擷取每一位使用者的瀏覽路徑，所有使用者都能夠貢獻其回饋，此做法符合團體多樣性的要求。推論代理人（Implicit Feedback Detection Agent）：此代理人為本系統之核心，. 治政負責從使用者回饋資訊中推論出各項潛在訊息，如焦點新聞列表、焦點分數、大立熱門度及話題性等，推論方法將在後面章節說明。學 ‧. ‧ 國. 5.. 3.2.1 系統運作流程. y. Nat. al. er. io. sit. 圖 3.2 中的三個資料庫與五個代理人交互運作的過程，說明如下：. n. 步驟 1 由資訊萃取代理人從原始的大學報網站擷取新聞資訊。. Ch. engchi. 步驟 2 將新聞資訊存入新聞資料庫。. i n U. v. 步驟 3 由新聞顯示代理人從新聞資料庫中，將新聞組織分類。步驟 4 將組織後的新聞，透過使用者介面以合適的排版方式呈現給讀者。步驟 5 顯隱性回饋代理人，從使用者介面收集並擷取系統所需的各項顯隱性回饋資訊。步驟 6 將顯隱性回饋資訊存入使用者回饋資料庫。. 29.

(43) 步驟 7 透過推論代理人，從使用者回饋資訊中推論出有助於社群互動的潛在資訊，並存入潛在資訊資料庫。步驟 8 顯示代理人根據步驟 7 所推論出的潛在資訊將新聞內容重新組織，並且更新顯示出最新社群資訊，然後送交使用者介面，以排版顯示呈現給讀者進行新聞閱讀。其中，步驟 3 到步驟 8 是一個重複執行的迴圈，而每一位使用者所看到的包含熱門. 政治大系統依據所收集到的使用者資訊所統計、推論或累積閱讀知識的結果，並且這些資訊是立新聞排序、分歧度新聞排序、焦點新聞排序、新聞點閱率及新聞註解等新聞資訊，都是. ‧ 國. 學. 以動態更新方式呈現，經由不斷的累積使用者資訊、改變其焦點列表、更新社群資訊，藉此達到結合「系統」、「內容」及「社群」三方的資訊造用過程。. ‧. n. al. er. io. sit. y. Nat. 3.3 推論代理人. i n U. v. 焦點新聞不論是在報紙或是新聞網站中，都扮演非常重要的角色，是使用者瀏覽重要新. Ch. engchi. 聞事件的開端，與一般新聞網站不同，本研究所發展系統希望從使用者回饋自動調整決定出焦點新聞列表，並且驗證此一機制支援團體互動討論之效益。其基本概念是焦點新聞應是被使用者熱烈討論和點閱的，同時，如 Surowiecki 所述[39]，在團體討論過程中，應該盡量鼓勵不同意見的發言，也就是說意見分歧的狀態從社群經營角度屬於一種良性的互動，可促使社群成員更熱烈的參與其中，因此，本研究提出分歧度來量化使用者意見分歧的程度，整合意見分歧高並且被使用者熱烈討論及點閱的新聞，將其放置於焦點新聞列表之中，讓使用者更熱烈的參與新聞事件的討論。簡言之，本研究提出的焦點新聞演算法考量因素有三：首先是焦點新聞應是大眾看法較為分歧的新聞；其次是焦點新. 30.

(44) 聞應為社群中討論較熱烈的新聞；最後一個因素是焦點新聞應是受到較多人關注的新聞，藉由模糊推論機制，考量以上三者，以推論出支援團體討論的焦點新聞列表。. 3.3.1 分歧度計算分歧度代表大眾意見的分歧程度，以本研究為例可以視為評分狀態的混亂程度。在資訊理論中熵（Entropy）常常被用來量化資訊的混亂程度，因此本研究採用 Shannon’s. 政治大. Entropy[32]來量化讀者對於新聞評價分歧的程度。評分行為最能代表使用者對於一則新. 立. 學. ‧ 國. 聞的喜好，因此我們對於不同的評分行為計算其 Entropy 值作為分歧度，計算一篇文件的分歧度公式如（3-1）所示。. ‧. E = −∑ Pi × log(Pi ) ………...…………..………（3-1） i∈T. Nat. sit. y. 其中 E 為新聞分歧度， T 為所有使用者可以執行評分行為的評分等第集合，本研究將評. n. al. er. io. 分劃分為 1~5 分，因此 T ∈ {1,2,3,4,5} ，而 Pi 為觀看此文件的讀者執行第 i 種評分行為的. i n U. v. 機率。透過 Entropy 的計算，可以得到社群讀者對於每則新聞看法的意見分歧程度。. Ch. engchi. 3.3.2 熱門度與話題性本研究考量新聞的熱門程度可以分為兩個面向，一是從使用者瀏覽新聞時所留下的紀錄中歸納出「熱門度」分數，雖然點擊瀏覽是一種不穩定的隱性回饋，但是過去許多研究也常採用使用者是否點選瀏覽文件，作為使用者是否對於此文件感興趣的依據，以降低收集使用者回饋的門檻，因此本研究也採計算文件被使用者點選閱讀的次數作為其熱門程度的指標，並且此方法對所有社群中的成員皆適用；二則是從新聞被討論的狀態中歸納出「話題性」分數，而系統所提供參與討論的方式有回應、詞彙註解及社群成員間的 31.