網路評價搜尋結果的正負意見分類系統 - 政大學術集成

全文

(1)國立政治大學資訊管理學系. 碩士學位論文指導教授:楊亨利博士. 立. 政治大. ‧ 國. 學. 網路評價搜尋結果的正負意見分類系統. ‧. A Sentiment Classification System on. y. Nat. n. al. er. io. sit. Search Results of Web Opinions. Ch. engchi. i n U. v. 研究生：黃泓彰中華民國 103 年 8 月.

(2) 謝辭完成這篇論文，首先我必須感謝楊亨利老師給予我的學術上的指導。從大三的專案開始至今一共四年，我從老師身上獲取了相當多學術上的建議，使我知道如何完成一個學術研究，並鉅細靡遺地將研究過程表達清楚。我也要感謝 KILL Lab 的林青峯學長，感謝您在這幾年中給我的學術上和技術上的建議，以及許多大小事情上的協助。接著，我要感謝我最好的一群朋友，請恕我不一一點名。我要謝謝 97 級政大彰友會的夥伴們，以及同在政大的高中同學們，謝謝你們這幾年的陪伴，給予我精神上的支持。雖然你們其中許多人已不在政大，但我們也還是會常常聚在一. 政治大段貧乏難耐的時期。這段和你們一起度過的歡樂時光，是我在完成論文的過程中立起吃吃喝喝、唱唱歌、聊聊天、打打嘴砲。如果沒有你們，我想我可能會度過一. 最大的動力來源。. ‧ 國. 學. 最重要地，我要感謝我的父母給予我這多年來生活上與精神上的支持。謝謝. ‧. 你們不斷地支持我，讓我可以完成各種我想做的事。. n. al. er. io. sit. y. Nat. 最後，再次謝謝你們所有人。遇見你們是一種幸運，也是幸福。. Ch. engchi U. i. v ni. 泓彰 2014. 8. 15..

(3) 摘要本研究嘗試建置一個包含兩個主要功能的系統，分別是網路評價搜尋以及情感分類。在網路評價搜尋的部份，我們使用 Google 搜尋並蒐集一攜帶型智慧裝置（智慧型手機、平板電腦與筆記型電腦）的網路評價搜尋結果；情感分類的部分則是將搜尋結果依照對該產品的意見分類為，共有正面／負面／中立、正面／負面、正面／非正面，以及負面／非負面等四種分類方式。為了建置此系統，我們首先從知名的網路論壇 Mobile01 和批踢踢蒐集和攜帶型智慧裝置有關的網路文章以及產品名稱，接著以人工的方式標記每篇文章，以及部分文章中的句子的情感。本研究設計了兩個層次的情感分類實驗，我們首先從語句層次出發，以監. 政治大進入文章層次，將句子的意見彙整，並同樣以監督式機器學習法訓練四種不同文立督式機器學習法訓練將句子分為正面／負面／中立等三個類別的分類模型後，再. 章層次的分類模型：正面／負面／中立、正面／負面、正面／非正面，以及負面. ‧ 國. 學. ／非負面。我們分別選出四種分類實驗中表現最佳的模型，並用於系統建置，其中表現最佳的是分類為正面／負面的分類模型，平均的 F-measure 為 0.87；其次. ‧. 是分類為負面／非負面的模型，對負面類別的 F-measure 為 0.83；接著是分類為. Nat. sit. y. 正面／非正面的模型，對正面類別的 F-measure 為 0.81；表現最差的是正面／負. er. io. 面／中立的分類，平均的 F-measure 為 0.77。在正面／負面分類的準確率上，本. al. 研究的表現並不壞於過去以英文為主要語言的相關研究。最後，我們也以過去不. n. v i n Ch 經過語句層次的分類方法進行實驗並比較，其結果發現經過語句層次的情感分類 engchi U 比不經過語句層次的情感分類較佳。關鍵詞：意見探勘、情感分析、情感分類、網路評價. ii.

(4) Abstract In this research, we implemented a system that retrieves the search results of mobile phones, tablets, and notebooks from Google, and then classifies them as: (1) positive, negative, or neutral, (2) positive or negative, (3) positive or non-positive, (4) negative or non-negative. To build this system, first we collected some documents about mobile phones, tablets, and notebooks on two popular web forums: mobile01.com and ptt.cc. Next, a sentiment label (positive, negative, or neutral) is attached to each document and each sentence of these documents. We designed a two-level supervised sentiment classification experiment. At sentence level, we trained classifiers that classify sentences as positive, negative, or neutral. The best. 治政 labels of the sentences in documents are used. We trained 大 classifiers in four different classification problems: (1)立 positive, negative, or neutral, (2) positive vs. negative, (3). sentence classifier was then used at document level. At document level, the sentiment. ‧ 國. 學. positive vs. non-positive, (4) negative vs. non-negative. The best is the second classifier with an average F-measure of 0.87. The next is the fourth classifier with an. ‧. F-measure of 0.83 on negative class, and then comes with the third classifier with an F-measure of 0.81 on positive class. The last is the first classifier with an average. Nat. sit. y. F-measure of 0.77. Our accuracy is not worse than the past English study on the. io. er. classification of positive vs. negative. Finally, we conducted another classification experiment using document-level-only classification method, and the results showed. n. al. Ch. i n U. v. that our two-level sentiment classification (first sentence level, then document level). engchi. outperforms document-level-only sentiment classification.. Keywords: Opinion mining, sentiment analysis, sentiment classification, web opinion.. iii.

(5) 目錄. 一、. 研究背景及動機-------------------------------------------------------------------------------------------- 1. 二、. 研究目的與問題-------------------------------------------------------------------------------------------- 3. 三、. 研究方法與架構-------------------------------------------------------------------------------------------- 4. 四、. 研究限制------------------------------------------------------------------------------------------------------ 4. 文獻探討---------------------------------------------------------------------------------------------- 6 一、二、. 學. 攜帶型智慧裝置名稱蒐集----------------------------------------------------------------------------- 17. 二、. 語料庫蒐集------------------------------------------------------------------------------------------------- 19. 三、. 網路文本處理---------------------------------------------------------------------------------------------- 22. 四、. 人工標記---------------------------------------------------------------------------------------------------- 30. 五、. 情感詞庫的蒐集與建立-------------------------------------------------------------------------------- 32. ‧. 一、. io. y. al. n. 伍、. 實驗資料蒐集與處理---------------------------------------------------------------------------- 17. Nat. 肆、. 治政大意見探勘與搜尋系統的相關研究------------------------------------------------------------------15 立. sit. 參、. 意見探勘與情感分析-------------------------------------------------------------------------------------- 6. er. 貳、. 緒論 ---------------------------------------------------------------------------------------------------- 1. ‧ 國. 壹、. Ch. engchi. i n U. v. 情感分類實驗 ------------------------------------------------------------------------------------- 39 一、. 語句層次特徵抽取--------------------------------------------------------------------------------------- 39. 二、. 語句層次分類實驗--------------------------------------------------------------------------------------- 44. 三、. 文件層次特徵抽取--------------------------------------------------------------------------------------- 49. 四、. 文件層次情感分類--------------------------------------------------------------------------------------- 52. 雛型系統建置 ------------------------------------------------------------------------------------- 71 一、. 系統架構與建置環境------------------------------------------------------------------------------------ 71. 二、. 系統處理流程與介面------------------------------------------------------------------------------------ 72 iv.

(6) 三、陸、. 系統處理效率---------------------------------------------------------------------------------------------- 74. 結論 -------------------------------------------------------------------------------------------------- 76 一、. 研究成果---------------------------------------------------------------------------------------------------- 76. 二、. 研究貢獻---------------------------------------------------------------------------------------------------- 77. 三、. 未來研究方向---------------------------------------------------------------------------------------------- 77. 參考文獻 ------------------------------------------------------------------------------------------------------ 79. 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. v. i n U. v.

(7) 表目錄表 1 情感詞庫詞彙數量統計 ------------------------------------------------------------- 12 表 2 智慧型手機的品牌、系列、型號關鍵字列表---------------------------------- 20 表 3 平板電腦的品牌、系列、型號關鍵字列表------------------------------------- 20 表 4 筆記型電腦的品牌、系列、型號關鍵字列表---------------------------------- 21 表 5 斷句方法整理 ------------------------------------------------------------------------- 24 表 6 語料庫的文章數與句數統計 ------------------------------------------------------- 24 表 7 文章的情感標記結果 ---------------------------------------------------------------- 31 表8. 治政大句子的情感標記結果 ---------------------------------------------------------------32 立. 表 9 意見詞數量統計 ---------------------------------------------------------------------- 35. ‧ 國. 學. 表 10 搭配詞數量統計 -------------------------------------------------------------------- 37. ‧. 表 11 程度詞與否定詞數量統計 -------------------------------------------------------- 38. sit. y. Nat. 表 12 其他詞彙數量統計 ----------------------------------------------------------------- 38. n. al. er. io. 表 13 語句層次特徵（FS）列表--------------------------------------------------------- 44. i n U. v. 表 14 語句層次分類實驗結果 ----------------------------------------------------------- 45. Ch. engchi. 表 15 混淆矩陣範例 ----------------------------------------------------------------------- 48 表 16 文件層次特徵（FD）列表 -------------------------------------------------------- 53 表 17 T1（正面／負面／中立）的文件層次分類實驗結果----------------------- 54 表 18 T2（正面／負面）的文件層次分類實驗結果 -------------------------------- 56 表 19 T3（正面／非正面）的文件層次分類實驗結果 ----------------------------- 58 表 20 T4（負面／非負面）的文件層次分類實驗結果 ----------------------------- 60 表 21 文件層次情感分類實驗結果 ----------------------------------------------------- 62 表 22 T1（正面／負面／中立）的特徵選擇實驗結果 ----------------------------- 63 vi.

(8) 表 23 T2（正面／負面）的特徵選擇實驗結果 -------------------------------------- 63 表 24 T3（正面／非正面）的特徵選擇實驗結果 ----------------------------------- 64 表 25 T4（負面／非負面）的特徵選擇實驗結果 ----------------------------------- 64 表 26 T1 至 T4 的特徵選擇對照表 ----------------------------------------------------- 65 表 27 未經過語句層次的文件層次特徵 ----------------------------------------------- 68 表 28 未經過語句層次的文件層次情感分類實驗結果 ----------------------------- 69 表 29 執行時間統計 ----------------------------------------------------------------------- 75. 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. vii. i n U. v.

(9) 圖目錄圖 1 全球網路使用者最常參與的網路行為（資料來源：GO-GULF.COM） ----- 2 圖 2 SAMSUNG GALAXY NOTE 3 於 GOOGLE 的部分搜尋結果 ------------------------ 2 圖 3 研究流程 --------------------------------------------------------------------------------- 4 圖 4 GOOGLE 搜尋結果網頁與部分原始碼（以三星為例） ----------------------- 21 圖 5 MOBILE01 網頁與部分原始碼 ----------------------------------------------------- 23 圖 6 不對等分級比較句的測試結果 ---------------------------------------------------- 27 圖 7 對等比較句的測試結果 ------------------------------------------------------------- 27 圖8. 治政大最高級比較句的測試結果 ---------------------------------------------------------27 立. 圖 9 人工標記畫面 ------------------------------------------------------------------------- 31. ‧ 國. 學. 圖 10 MOBILE01 文章範例 ---------------------------------------------------------------- 66. ‧. 圖 11 EIRINAKI 等人（2012）與本研究之準確率比較------------------------------ 68. sit. y. Nat. 圖 12 正面／負面／中立意見（T1）的分類實驗比較 ----------------------------- 69. n. al. er. io. 圖 13 正面／負面意見（T2）的分類實驗比較 -------------------------------------- 69. i n U. v. 圖 14 正面／非正面意見（T3）的分類實驗比較 ----------------------------------- 70. Ch. engchi. 圖 15 負面／非負面意見（T4）的分類實驗比較 ----------------------------------- 70 圖 16 雛型系統架構 ----------------------------------------------------------------------- 71 圖 17 T1 分類介面呈現方式 ------------------------------------------------------------- 73 圖 18 T2 分類介面呈現方式 ------------------------------------------------------------- 73 圖 19 T3 分類介面呈現方式 ------------------------------------------------------------- 74 圖 20 T4 分類介面呈現方式 ------------------------------------------------------------- 74. viii.

(10) 壹、緒論一、. 研究背景及動機. 當人們試圖尋找可用的資訊以輔助決策時，別人的想法或意見往往是一個常見的選擇（Liu, 2012; Pang & Lee, 2008a），所以「別人怎麼想」（What Other People Think）成為我們在決策過程中的一項重要的資訊（Pang & Lee, 2008a）。過去獲取他人意見的方法被侷限於個人生活的周遭，如親朋好友或報章雜誌等。然而，在全球資訊網出現後，全球的網頁數量開始激增。隨後 Web 2.0 的興起帶動了部落格、網路論壇及社群網站的發展，使得人們很容易就可以在網路上針對各類事物發表各式各樣的意見與產品評論。如今，網路上存在著大量的，且具有分析價. 政治大. 值的使用者生成內容（User-generated Content; UGC），而對這些文字意見進行分. 立. 析並從中取得可用資訊的研究領域，則被稱為意見探勘（Opinion Mining）或是. ‧ 國. 學. 情感分析（Sentiment Analysis）。. 另一方面，由於搜尋引擎的進步，與各類商品相關的意見與評論被快速且準. ‧. 確地呈現在人們面前，於是人們可以輕易地從網路上取得不同來源的意見。根據. sit. y. Nat. GO-Gulf 於 2012 年的調查（圖 1），在全球的網路使用者中，有 92%的使用者會使用搜尋引擎，而有 78%的使用者會搜尋購買商品的相關資訊。搜尋引擎儼然成. io. er. 為人們取得他人意見的主要工具之一。. al. n. v i n 然而，如果我們從使用者的角度，以搜尋商品的相關意見或評論為目的來觀 Ch engchi U 察目前的主流搜尋引擎 Google 的搜尋結果，則可以發現這些搜尋結果尚有一個 1. 不足之處，就是其意見太過雜亂，給予好評的文章與給予負評的文章相互夾雜，其中也不乏單純的產品介紹，如圖 2。對於正處在螢幕前面使用搜尋功能的使用者而言，這樣的呈現方式並不完善，因為使用者必須逐一瀏覽搜尋結果才能夠知道這些文章對於該商品的評價如何。此舉相當耗費時間。原因在於有的時候做決策並不需要考慮所有評價，比如選擇餐廳時，可能有人認為不要太差就能接受，此時只要參考餐廳的負面評價，而正面評價則相對較不重要；又比如選擇 3C 產品時，有人會想避開網路寫手的文章，所以會傾向參考較為中立的意見或是產品. 1. https://www.google.com.tw. 1.

(11) 規格。也就是說，不同的使用者對於各類評價的需求並不是相同的。因此，不同的意見評價有應有分開呈現的必要。 Demartini 與 Siersdorfer（2010）提出四個理想中的搜尋結果的呈現方式。這些呈現方式分別為：正負平衡觀點（Balanced）、中立觀點（Neutral）、現實觀點（Realistic），以及個人化觀點（Personalized）等四類。其目的都是為了能符合不同使用者對意見的需求而設計。. 立. 政治大. ‧. ‧ 國. 學. io. sit. y. Nat. n. al. er. 圖 1 全球網路使用者最常參與的網路行為（資料來源：GO-Gulf.com2）. 圖2. 2. Ch. engchi. i n U. v. Samsung Galaxy Note 3 於 Google 的部分搜尋結果. How People Spend Their Time Online [Infographic]，http://www.go-gulf.com/blog/online-time/. 2.

(12) 如果能夠建置一個系統，把商品的搜尋結果依好壞的評價分別呈現，讓使用者將能夠一目瞭然地知道哪些網路文章給予該商品正面評價，而哪些網路文章則給予負面評價，又有哪些網路文章僅是單純的商品介紹，或是好壞各半。這樣的呈現方式對於個人的使用者或是企業組織而言皆有良好的助益。個人的使用者將能夠清楚地看到一個商品的好壞評價分配如何，進而協助他們進行購買決策，或是根據自己對於評價的需求點閱文章。同樣地，企業組織也能夠快速瞭解自己的商品在網路上有哪些負面評價，並加以改善或修正。我們認為以現在的意見探勘與情感分析技術，應能將搜尋引擎的搜尋結果分類並呈現給使用者，期望帶給正在尋找網路意見的使用者一個更清楚，更方便的體驗。. 政治大本研究的目的是建置一個將商品的網路評價搜尋結果依照對該商品的評價立. 二、. 研究目的與問題. ‧ 國. 學. 分類為正面／負面／中立意見的系統。我們最主要的研究問題是：. ‧. 如何將網路文章分類為正面／負面／中立意見？. sit. y. Nat. 當我們以文章為處理單位時，就會遇到無法處理個別句子與我們搜尋的商品. io. er. 無關的情況。為了解決此問題，我們將以句子為處理單位出發，經過判別各句子的意見之後，再將各句子的意見彙整，並加入其他因素用以判別文章的意見。. al. n. v i n Ch 此外，由於使用者對於不同類別的意見應有不同的需求，為了能將不同類別 engchi U. 的意見以不同的方式呈現，我們將對文章嘗試不同類型的分類。因此，我們的研究問題可分為以下幾個相關的子問題： 1.. 如何將一個句子的意見分類為正面／負面／中立意見？. 2.. 如何將一篇文章分類為正面／負面／中立意見？ (1) 如何將一篇文章分類為正面／負面意見？ (2) 如何將一篇文章分類為正面／非正面意見？ (3) 如何將一篇文章分類為負面／非負面意見？. 3.

(13) 三、. 研究方法與架構. 本研究採用系統開發的研究方法。我們將在第二章探討與意見探勘和情感分析相關的研究，以及適用於本研究的方法。接著，本研究於第三章開始的研究流程如圖 3 所示。為了找出適合用於系統建置的分類方法，必須要進行情感分類的實驗。因此我們在系統建置前設計了兩個階段的研究流程，第一階段是實驗用的資料蒐集以及文章的處理，第二階段為情感分類的實驗設計以及實驗結果。這兩階段將分別在第三章與第四章介紹。第五章為雛型系統的建置，我們將第三章的處理方式與第四章的實驗結果實作後，介紹系統的架構、介面與效率。最後一章則提出本研究的結論，以及對未來的建議。. 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 3 研究流程. 四、. 研究限制. 為了將本研究的核心研究問題置於句子和文章的意見的分類上，我們將限制其他的因素，比如商品的類型、搜尋引擎的選擇，以及網路評價的來源等。因此 4.

(14) 我們將搜尋的目標商品限制為攜帶型智慧裝置，也就是智慧型手機、平板電腦與筆記型電腦；搜尋引擎則採用 Google；而網路評價的搜尋範圍則限制為特定的網路論壇，台大批踢踢實業坊與 Mobile01。本研究意見分類的有效範圍將受到上述的因素限制。. 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 5. i n U. v.

(15) 貳、文獻探討一、. 意見探勘與情感分析. 意見探勘，或稱做情感分析，是指從文字中分析人們對目標個體的意見、情感、評價和態度，而目標個體可以是指一個產品、服務、組織、個人、事件、議題、主題，以及個體的屬性（Liu, 2012）。由於分析過程以電腦作為主要的分析工具，也因此與資料探勘、文字探勘、網路探勘、資訊檢索，以及機器學習等領域有相當大的關係（張育蓉，2012；Dave et al., 2003; Liu, 2012; Pang & Lee, 2008a; Pang et al., 2002）。意見探勘一詞最早出現於 Dave 等人（2003），而情感分析一詞最早則見於 Nasukawa 與 Yi（2003）。有趣的是，和意見或情感有關的研究在. 政治大. 更早之前就已經開始（Das & Chen, 2001; Pang et al., 2002; Turney, 2002）. 立. （一）何謂「意見」？. ‧ 國. 學. 「意見」由五個主要的元素所構成，如第 1 式（Liu, 2010; Liu, 2012;. ‧. Moghaddam & Ester, 2012）。. sit. y. Nat. 2.. 目標個體（Target Entity; ej）. 3.. 個體的屬性（Entity Aspect; ajk）. 4.. 時間（Time; tl）. 5.. 情感取向（Sentiment Orientation; soijkl）. n. er. 持有者（Holder; hi）. io. 1.. al. Ch. (1). engchi. i n U. v. 第 1 式可以用文字的形式解釋為「意見是由持有者 hi 在時間 tl 對目標個體 ej 的屬性 ajk 所表現的情感取向 soijkl」。其中，目標個體及個體的屬性都可以被稱為意見目標（Opinion Target）。首先，我們所分析的意見來源是網路論壇的文章，其意見持有者應為該文章的作者（Liu, 2012; Pang & Lee, 2008a）。雖然文章中可能包含引用句，或是陳述事實，但我們認為這些用法也是該作者為了輔助表達自己的意見而使用。因此，在本研究中我們不考慮意見持有者的問題。 6.

(16) 接著，意見目標是本研究所關心的元素之一。由於在網路論壇的文章中會加入別的產品做比較，在不知道意見目標的情況下，如果我們假定文章中所有意見的目標都是我們所要分析的對象，就有可能造成意見的分類錯誤。為了避免這樣的現象，意見目標的辨識是一個必須解決的問題。另外，在本研究中我們僅分析對意見目標的綜合意見，而不考慮意見目標個別屬性的優劣。時間是另一個會影響意見的元素。同一個作者對同一個產品在一年前的評論和昨天的評論可能會有很大的差別。然而，本研究的目的並非探討不同時間點的意見變化，所以時間不是本研究所考慮的元素。最後，情感取向是最重要的元素。本研究的核心問題，也就是將意見分類為. 治政 Classification）。Pang & Lee（2008a）認為，情感分類一詞可以指任何探討情感大立取向的分類問題，包含兩類別分類、多類別分類、迴歸分析，以及排名等，而將. 正面／負面／中立意見，正是探討情感取向的問題，稱為情感分類（Sentiment. ‧ 國. 學. 情感取向分為正面／負面兩個類別，或是包含中立在內的三個類別，則又稱為意見的極性分類（Polarity Classification）。情感分類是目前意見探勘領域最廣為研. ‧. 究的主題（Liu, 2012; Pang & Lee, 2008a），其問題與方法將在稍後做介紹。. Nat. sit. y. 另一方面，在進行意見的情感分類時，常常有許多非必要的詞彙存在於大量. er. io. 文字中，而這些詞彙對意見並無影響，只會使分析變得複雜；相對地，在文字中. al. 所包含的一些能夠表現情感或意見的詞彙則相當重要，是用來判斷該意見的情感. n. v i n Ch 取向的依據，這些詞彙被稱為意見詞（Opinion Words; Sentiment Words）（Ding et engchi U. al., 2008）。為了要專注於分析意見詞彙，將意見詞蒐集成詞彙列表是一個重要的. 工作，而意見詞彙列表則稱為情感詞庫（Sentiment Lexicon）（Liu, 2012）。綜上所述，本研究所關心的重要元素為意見的目標個體和情感取向，而必須討論的問題則有情感分類、情感詞庫和意見目標辨識。我們將在後面的小節進一步討論相關研究。. （二）意見探勘的層次意見探勘發展至今，我們可以從許多角度檢視意見探勘的類型。從語言結構來看，意見探勘可以依分析的語言單位由大到小分為文件層次、語句層次、子句 7.

(17) 層次、片語層次與字詞層次等。另外，當分析的意見目標是個體的屬性時，則又稱為屬性層次（Aspect Level; Feature Level）（Ding et al., 2008; Liu, 2012; Pang & Lee, 2008a; Su et al., 2008）。本研究的情感分類屬於文件層次以及語句層次，並不探討屬性層次的意見探勘。不論是文件層次或是語句層次的意見探勘，情感分類都是主要的研究主題（Liu, 2012; Pang & Lee, 2008a）。情感分類關心的主要問題是：給定一篇文章或一個句子，判別該文章或句子的情感取向為正面或負面（或加上中立）。Pang 等人（2002）將電影意見評論在文件層次分類為正負兩類。Turney（2002）蒐集意見評論網站 Epinions3中的評論，分類為正負兩類。Na 等人（2004）則是分析產品評論，並同樣分類為「推薦」（正面）與「不推薦」（負面）兩類。Dave 等人. 政治大. （2003）將從 C|NET 4與 Amazon5 的產品評論切割為句子以進行意見的分類。. 立. Demartini 與 Siersdorfer（2010）蒐集 3 個主流的搜尋引擎（Google、Yahoo!6、. ‧ 國. 學. Bing7）對 14 個爭議性議題的搜尋結果，並分別探討以詞庫為基礎的情感評分方式和 SVM 的分類方式在結果上的不同。. ‧. 由於近年來微型部落格（Microblogging）的發展，情感分類的研究領域有逐. sit. y. Nat. 漸往這方面發展的跡象。Pak 與 Paroubek（2010）分析推特（Twitter）上使用者. io. er. 推文的情感取向（Tweet），並分類為正面／負面／中立三類。Kouloumpis 等人（2011）分析的資料來源為推特，所以直接將每一則推文視為一個句子，並將其. n. al. Ch. i n U. v. 分類為正負與中立三類。張育蓉（2012）從 Plurk 和圖書館討論區蒐集意見的文. engchi. 章，並在斷句後分類其情感取向。. 在文件層次甚少考慮意見目標的問題，也就是通常假設一篇文章的意見目標為已知（Liu, 2010）。但是語句層次則要考慮意見目標的問題。如同本研究的研究問題，語句層次通常僅是一個過渡階段，而非最終目的。因此在分析句子的意見時，如果不知道意見目標，那麼這樣的分析和文件層次的分析差異不大，其用途將是有限的（Liu, 2012）。和意見目標有關的研究將在稍後的小節探討。 3 4 5 6 7. http://www.epinions.com/ http://www.cnet.com/ http://www.amazon.com/ https://www.yahoo.com/ https://www.bing.com/. 8.

(18) 主觀分析（Subjectivity Analysis）是語句層次的另一個研究主題。主觀分析是指將一段意見分為主觀與客觀兩類（Liu, 2010; Wiebe et al., 1999）。雖然也有文件層次的主觀分析（Pang & Lee, 2008b; Yu & Hatzivassiloglou, 2003），但整體而言，語句層次的主觀分析較為重要且常見。然而，主客觀和意見的有無並無絕對的關係（Liu, 2010）。對於本研究的目的而言，產品的意見是優先於主觀和客觀的。我們認為，在一篇網路論壇的文章裡，不論是陳述客觀意見或是表達主觀意見，都是作者企圖表示對該產品的意見。因此，本研究將不考慮主觀分析。不論是中文或英文，比較句和反諷句一直都是語句層次較難以處理的問題（張育蓉，2012；Liu, 2012）。我們認為中文的反諷句尚未存在一個可自動化的辨識方法，因此本研究將不討論反諷句。過去關於比較句意見探勘的文獻多是探. 政治大. 討比較的意見目標雙方的關係，如 Ganapathibholta 與 Liu（2008）探討比較句中. 立. 意見持有者的偏好為何者。其定義了以下四種比較句：. ‧ 國. 學. 1.. 不對等的分級比較句（Non-equal Gradable）是指偏好一方優於另一方的比較句。如：. ‧. 「我覺得 iPad mini 比 Galaxy note 3 好。」. y. Nat. io. 「我覺得 iPad mini 和 Galaxy note 3 一樣好。」. al. n. 3.. Ch. sit. 對等比較句（Equative）是指偏好一樣的比較句。如：. er. 2.. i n U. v. 最高級比較句（Superlative）是指偏好一方優於其他全部的比較句。如：. engchi. 「iPad mini 是我心目中最好用的平板。」 4.. 不可分級的比較句（Non-gradable）是指沒有表示偏好的比較句。. 「iPad mini 在使用上跟 Galaxy note 3 還是有點不一樣。」對於本研究而言，我們關心的並不是要找到偏好的目標，而是要找到句中意見詞的意見目標。比如上述第一個例句中的「好」的意見目標為「iPad mini」；若將「好」置換成「差」時，其意見目標依舊不變。由於不可分級的比較句則沒有意見詞，故本研究不討論。至於其它三種比較句的意見目標，我們將在第三章介紹意見目標辨識方法時再詳細討論其處理方式。. 9.

(19) （三）情感分類的方法情感分類的主要過程如下：首先是先從大量資料中抽取能表現資料的特徵；然後定義類別，也就是情感取向；最後就是選擇分析的方法並進行分析。特徵的抽取必須和分析的目的有關。常見於情感分類的特徵有（Liu, 2010）：詞庫特徵或一字詞（Unigram）（張育蓉，2012；Demartini & Siersdorfer, 2010; Kouloumpis et al., 2011; Pak & Paroubek, 2010）、多字詞（N-gram）或搭配詞（Collocation）（張育蓉，2012；Dave et al., 2003; Kouloumpis et al., 2011; Pak & Paroubek, 2010）、詞性數量統計（Kouloumpis et al., 2011）、語句結構特性（Liu & Seneff, 2009）等等。. 政治大句子中的正負意見詞彙數量，並依此計算出一個分數。另一種方式則是將詞庫中立. 詞庫特徵是指以情感詞庫為基礎計算的特徵。其中一種方式是統計該文章或. 的每一個詞彙皆作為一個特徵，也就是代表該詞彙有出現（特徵值為 1）或沒有. ‧ 國. 學. 出現（特徵值為 0）在這一篇文章或句子中，此計算方式為二元法。另外也有計. ‧. 算 TF-IDF 的方式。TF-IDF 是過去在資訊檢索領域經常被使用的計算方式，其算法是詞頻（Term Frequency; TF）與逆向文件頻率（Inversed Document Frequency;. Nat. sit. y. IDF）的乘積。TF 是指一個字 w 在文章 d 內的出現次數除以 d 的總字數，所以. er. io. TF 越高代表 w 在 d 裡面越常出現，自然也就越重要。IDF 則是語料庫中的文章. al. 數量除以含有 w 的文章數量的對數值。IDF 越高代表 w 這個字在語料庫中越少. n. v i n Ch 出現，所以對 d 而言越重要。因此，TF-IDF i U e n g c h的意義就是計算一個字在一篇文章內的重要性。其算法如下：. (2) 和情感詞庫有關的特徵抽取尚有否定詞（Negation）和程度副詞（Intensive Adverb）等，我們將在下一小節作介紹。過去在情感分類領域常見的監督式（Supervised）分類方法有：支持向量機（Support Vector Machine; SVM）分類（張育蓉，2012；Dave et al, 2003; Demartini & Siersdorfer, 2010; Pang et al., 2002）、簡單貝氏（Naïve Bayes）分類（張育蓉，. 10.

(20) 2012；Dave et al, 2003; Pang et al., 2002; Pak & Paroubek, 2010）、K 最近鄰（K-nearest Neighbor; KNN）分類（張育蓉，2012）、最大熵（Maximum Entropy; ME）分類（Pang et al., 2002）、AdaBoost.HM 分類（Kouloumpis et al., 2011）等相當多種方法。以下將介紹本研究採用的 SVM 分類、簡單貝氏分類器，以及 KNN 分類。 SVM 是一種監督式的機器學習法，屬於線性分類器。線性分類器基礎的概念是找出一個能夠將多維空間中的點分割的超平面，而 SVM 定義為最佳解的超平面有一個條件，就是使切割後不同類別的點之間的距離最大化。由於 SVM 會嘗試將多維空間的點再放射到更高維的空間，因此有較高的機會找出最佳平面。 SVM 目前在意見探勘領域中效果顯著（Pang et al., 2002）。. 治政簡單貝氏分類器是從機率的觀點著手。其原理是根據第 3 式的貝氏定理大立（Bayes Theorem），目的是計算在給定特徵向量 F 的條件下，其屬於類別 C 的條 ‧ 國. 學. 件機率，並依此找出在不同的特徵組合下的最佳分類方法。簡單貝氏分類在意見探勘領域中經常被使用。其優點是採用機率的觀點較容易提供一個具有說服力的. ‧. 分類方式。. er. io. sit. y. Nat. (3). al. n. v i n Ch 的點，而一個點周圍某一個類別的點越多，則這個點越有可能和這些點屬於同一 engchi U. KNN 是一個簡單且直覺的分類方法，其想法是將資料視為是在多維空間中. 個類別。參數 k 正是周圍要參考的點的數量。所以當一個新的資料點 F 要進行分類時，則找出 k 個距離 F 最近的點的類別，採用加總平均的方式計算。當這個值較接近類別 C 時，則把 F 分類至類別 C。KNN 雖然簡單，但在情感分類時仍有不錯的效果（張育蓉，2012）。. （四）情感詞庫建立在一般情況下使用的情感詞庫主要的方法如下（Ding et al., 2008; Liu, 2012）。首先給定一些在一般情況下為正面意義的詞彙與負面意義的詞彙，作為種子（Seed）詞彙表。接著，從這些種子詞彙表中的字出發，從詞網（WordNet） 11.

(21) 和線上字典等資源中蒐集每個種子詞彙的同義詞或反義詞，然後將這些蒐集到的詞彙再加入種子清單。如此重複，直到沒有新的詞彙被蒐集到為止。如此一來，就可以蒐集到在一般情況下可使用的正面詞彙與負面詞彙表。國立台灣大學意見詞辭典（NTU Sentiment Dictionary; NTUSD）（Ku & Chen, 2007）是以 General Inquirer8（GI）與 Chinese Network Sentiment Dictionary（CNSD）作為種子詞彙表，並以同義詞詞林（梅家駒等人，1982）和中央研究院的中英雙語知識本體詞網9（Academia Sinica Bilingual Ontological WordNet; BOW）做同義詞擴充而成。 NTUSD 共計有 20,595 個意見詞彙，分別為 9,365 個正向詞與 11,230 個負向詞。目前適用於中文的情感字典尚有知網10（HowNet）創建者董振東先生於 2007 年發布的情感分析用詞語集（beta 版）（Chinese/English Vocabulary for Sentiment. 政治大種語言都分為六個類別，其中中文的詞彙數量統計分別為：正面情感詞語 836 立. Analysis; HowNet-VSA）。HowNet-VSA 有提供中文與英文兩種語言的詞彙，每. ‧ 國. 學. 個、正面評價詞語 3,730 個、負面情感詞語 1,254 個、負面評價詞語 3,116 個、程度級別詞語 219 個，以及主張詞語 38 個，總共 9193 個詞彙。本研究將正面情. ‧. 感詞語及正面評價詞語統稱為正向詞，負面情感詞語及負面評價詞語統稱為負向詞。兩個字典的統計數據如表 1。. n. al. er. io 詞庫名稱. sit. y. Nat. 表 1 情感詞庫詞彙數量統計. i n U. v. 正向詞負向詞程度詞語主張詞語. Ch. e n g c 未收錄 hi. NTUSD. 9,365. 11,230. HowNet-VSA. 4,566. 4,370. 219. 總計. 未收錄 20,595 38. 9,193. 然而，有些字在一般情況下跟在特定的領域下意義有可能相反。比如：. 「筆電產品的本質就是輕薄好攜帶加上優異的效能表現。」「這男的總是在用言語輕薄和調戲別人。」前者的「輕薄」是正面意義，但後者的「輕薄」卻是負面意義。因此，對於. 8. http://www.wjh.harvard.edu/~inquirer/ http://bow.sinica.edu.tw/ 10 http://www.keenage.com/ 9. 12.

(22) 本研究而言，蒐集而來的情感詞庫有重新定義情感取向的必要。此外，即使是同一領域，同樣的意見詞也有可能是不同的意思。這樣的關係與屬性層次的意見探勘有關。當同一個意見詞用來指不同的屬性時，其產生的情感取向可能會不同（Ding et al., 2008）。比如：. 「這支手機的電池可以用很久。」「這支手機的瀏覽器讀網頁讀很久。」前者的「久」是正面意義，但是後者的「久」卻是負面意義。從廣義的角度來看，這樣的現象並不僅存在意見詞跟屬性之間。當意見詞與其他詞彙共同出現卻能夠表現出特定的情感取向時，則稱這樣的現象為搭配詞（張育蓉，2012）。. 政治大算兩個字 w 與 w 之間的獨立性，其計算方法為：立. Church 與 Hanks（1989）的 PMI（Pointwise Mutual Information）可用來計 2. 學. ‧ 國. 1. (4). ‧. P(w1, w2)表示 w1 與 w2 同時出現的機率，P(w1)表示 w1 出現的機率，P(w2)表. y. Nat. 示 w2 出現的機率。當 PMI 值為 0 時，代表兩個字相互獨立，也就是其中一個字. io. sit. 的出現不會影響另一個字的出現；而 PMI 越大代表兩個字越容易共同出現；反. n. al. er. 之 PMI 越小則代表兩個字越不容易共同出現。因此 PMI 可被用來尋找適合特定領域用的搭配詞（Popescu & Etzioni, 2005）。. Ch. engchi. i n U. v. Turney（2002）根據 PMI 演變出 SO（Semantic Orientation）的計算方法。 SO 是計算一個未知情感取向的字 w 與正面意見詞的 PMI 和 w 與負面意見詞的 PMI 的差，其算法為： (5) 此處的 w+與 w-代表已知為正向和已知為負向的意見詞，在 Turney（2002）的文中分別以「excellent」和「poor」為例。當 SO 大於 0 時，代表 w 是正面意見；反之，當 SO 小於 0 時，代表 w 是負面意見。因此 SO 可用於重新定義意見詞的情感取向（Turney & Littman, 2002）。. 13.

(23) 除了意見詞和搭配詞之外，有一些會影響情感取向的詞彙也應納入考慮，如否定詞與程度副詞。過去有相當多的文獻視否定詞為影響情感取向的因素之一（張育蓉，2012；Das & Chen, 2001; Ding et al., 2008; Liu, 2010; Liu, 2012; Na et al., 2004; Pang & Lee, 2008a; Eirinaki et al., 2012）。否定詞很容易就能顛覆一個意見的情感取向（Liu, 2010），如「好」和「不好」；「差」和「不差」。程度副詞是另一個影響情感取向的因素（張育蓉，2012；Liu & Seneff, 2009）。儘管程度副詞對於只有一個意見的句子並不影響情感取向，但是當複合句出現時，程度副詞便可以平衡該句子的情感取向。比如：. 「我最近買的新手機很好用，只可惜貴了一點。」. 治政言是正面意見，但在只觀察意見詞數量的情況下，這句則可能因為各含有一個正大立向詞彙與一個負向詞會而被分類為中立意見。綜上所述，否定詞與程度副詞都是「很好用」的正面意義應超過「貴了一點」的負面意義，因此這句話整體而. ‧ 國. 學. 本研究應納入考量的詞彙。. ‧. （五）意見目標辨識. y. Nat. 過去關於意見目標辨識的文獻其方法相當多樣，而中文的意見目標辨識則大. er. io. sit. 多採用以規則為基礎的方法（Lin & Chao, 2010; Lu, 2010; Ma & Wan, 2010）。 Lin 與 Chao（2010）分別探討規則式以及機器學習的辨識方法於擷取部落格. n. al. Ch. i n U. v. 中關於旅遊的意見與旅遊景點，也就是意見目標。在蒐集資料的時候，其發現在. engchi. 部落格文章中，作者會以景點的部分名稱、景點的別稱，或特別的關鍵字指代（Corefernce）該景點，因此蒐集景點的相關關鍵詞是必要的工作。在實驗的部分，其結果發現機器學習的方法整體而言較規則式方法為佳，而規則式方法的準確率雖然較低，但其回傳率卻也高於機器學習法。其最佳的規則依序如下： 1.. 首先定義可能的意見目標範圍是所有的景點關鍵詞。. 2.. 該句出現一到多個可能的意見目標時，以最後者作為意見目標。. 3.. 在該句的前五句取距離該句最近的可能意見目標。. 4.. 在該句的後五句取距離該句最近的可能意見目標。. 5.. 此句無意見目標。 14.

(24) Lu（2010）提出一個簡單的啟發式規則以擷取新聞文章中的意見目標。其首先取得主張動詞的詞彙表，如：說、表示、認為……等等詞彙，共 308 個動詞。接著將句子經過句法剖析處理，得到句法結構樹。最後再套用其依照句法結構建立的主詞、主張動詞、受詞和子句之間的關係所建立的規則。其規則依序如下： 1.. 取出該句中作為主張動詞之受詞的子句。 (1) 取出該子句的主詞作為意見目標。 (2) 取出位於主張動詞之後，且母節點是意見詞的主詞作為意見目標。. 2.. 取出該句的主詞作為意見目標。. 3.. 取出該句的受詞作為意見目標。. 治政新聞評論中可能的意見目標，接著將這些可能的意見目標評價並排序，以取得最大立有可能的意見目標。. Ma 與 Wan（2010）則採用定心理論（Centering Theory）的規則搜尋在辨識. ‧ 國. 學. 有趣的是，我們發現過去的規則式方法之間皆具有共同的關鍵要素。在 Lin 與 Chao（2010）以及 Ma 與 Wan（2010）的規則中，皆具有相同的概念，指出. ‧. 之前提過的意見目標可能是當前句子的意見目標，惟前者採用前五句，後者僅採. Nat. sit. y. 用前一句。又，在 Lu（2010）和 Ma 與 Wan（2010）的規則中，皆指出句法結. al. er. io. 構對於意見目標辨識的重要性，乃是主詞的重要性大於受詞，最後才考慮句子中. n. 的其他詞彙。我們認為，這些規則之間乃是有組合使用的可能。本研究將嘗試結. Ch. 合上述的規則，應用於本研究以辨識意見目標。. 二、. engchi. i n U. v. 意見探勘與搜尋系統的相關研究. Dave 等人（2003）認為，一個理想的意見探勘工具要具備以下幾個特點： 1.. 取得並分析一個產品的搜尋結果。. 2.. 列出該產品的屬性。. 3.. 將各個屬性的意見加總。. 根據以上的描述，一個可稱為意見探勘與搜尋系統的的工具會牽涉到兩個研究領域。其一是資訊檢索，也就是作為資料來源的搜尋功能；其二是情感分析，也就是分析意見的功能。至於排序功能則和排序的依據有關，比如依相關性排序 15.

(25) 乃是資訊檢索領域廣為研究的主題，而依情感排序則屬於情感分析領域。雖然在上一節中提到許多過去採用搜尋引擎蒐集網路評論並進行情感分析的研究，但我們發現將情感分析的結果與搜尋功能相結合，並建置出一個可稱為意見探勘與搜尋系統的研究並不多見。 Eirinaki 等人（2012）建置了一個從意見搜尋到評分和分類的意見搜尋引擎 AskUs。AskUs 分析的層次為語句層次和屬性層次。其採用 HAC（High Adjective Count）演算法找出常和形容詞共同出現的名詞，並依此指派給每個名詞一個分數，這些名詞便是潛在的產品屬性。對於一篇網路評論，AskUs 的系統處理過程如下，首先逐句取出每個句子中的意見詞以及該意見詞可能對應的目標屬性。接. 治政內文皆是分開處理，最後再進行加權平均和分類。其系統針對三種產品評論的分大立類準確率在 87%至 97%之間。著計算每個屬性的意見分數，並依此計算出該篇評論的分數。每篇評論的標題和. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 16. i n U. v.

(26) 參、實驗資料蒐集與處理一、. 攜帶型智慧裝置名稱蒐集. 本研究定義的攜帶型智慧裝置包含智慧型手機、平板電腦，以及筆記型電腦三種產品。這些裝置是本研究在情感分類時可能的意見目標。為了後續與意見目標辨識有關的分析，我們必須知道和這些產品有關的名稱以及關鍵字。名稱的部分可分為品牌、系列、型號，以下面的句子為例：. 「大家所期待的 HTC Desire 816 價錢應該多少？」此處的「HTC」是品牌名稱，「Desire」是 HTC 的智慧型手機的系列名稱，. 政治大慧型手機為例，目前市面上有多個品牌，如 Apple、HTC 等；而一個品牌下可能立有一到多個不同的產品系列，比如 HTC 有 One 系列與 Butterfly 系列，而 Apple 而「816」則是 Desire 系列下的一個型號。這三者之間是母子集合的關係。以智. ‧ 國. 學. 只有 iPhone 系列；最後，一個系列下則又有多個不同的型號，如 iPhone 4s、iPhone 5s、iPhone 5c 等。這些名稱都是本研究在分析時可能的意見目標。. ‧. 首先是品牌。在文章中可能會以品牌名稱代表該品牌的所有產品，如：. y. Nat. io. sit. 「Apple 手機的爆炸次數遠高於其他廠商。」. n. al. er. 這裡的「Apple」應是所有 Apple 的智慧型手機產品的總稱。另外，在一篇. Ch. i n U. v. 文章有指出多個不同品牌的產品時，有時候只要以品牌名稱就可以識別特定產品。比如：. engchi. 「想換手機，目前看上兩支手機，HTC New One 或三星 s4。想請大家推薦一下，要用 HTC 還是三星。」此處由於在前面提過了「HTC New One」與「三星 s4」兩種型號，因此後面就以「HTC」和「三星」兩種品牌名稱代替前面的型號名稱。其次是系列。跟品牌的用法一樣，系列名稱也會用來作為該系列所有產品的代稱，如：. 「新一代 SONY Xperia 系列拍照可否調無聲？」. 17.

(27) 此處「Xperia」應是 SONY Xperia 所有產品的代稱。同樣地，在一篇文章中如果已提到不同系列的產品時，系列名稱也可以用來識別特定的產品，如：. 「受夠了 iPhone 4s 麼小小的螢幕, 所以就買了 Note3。」… …「有點想賣掉 Note3 換回 iPhone，但那個螢幕好小好小。」最後一句的「iPhone」很顯然不是指 iPhone 系列的所有產品，而是指前面所提過的「iPhone 4s」最後是型號。每一款攜帶型智慧裝置都有一個獨特的型號，所以型號是識別意見目標的最佳方式。在網路論壇中，許多文章都會含有產品型號，原因在於同系列的型號之間仍然會有較大的差異。如果未指出特定型號，則閱讀者亦難以分. 政治大「Butterfly s 更新 4.3立後，電腦使用手機網路問題。」. 辨。通常型號會伴隨品牌名稱或是系列名稱一起出現，如：. ‧ 國. 學. 此處「Butterfly s」是以系列加型號名稱指出特定的產品。另外，有時也可見到單獨以型號代表特定產品的用法，雖然較為少見，但仍應處理，如：. sit. Nat. 大家覺得要續用 4S 嗎？還是換 5C 呢？」. y. ‧. 「最近看到 5C 發表，還蠻心動的！. er. io. 這裡的「5C」和「4S」應是指 iPhone 5c 與 iPhone 4s 兩種產品型號。. al. n. v i n Ch 「蘋果」以及上面例子中提過的「三星」等等。此外，一些品牌、系列、型號會 engchi U 雖然目前網路論壇中以英文名稱最為常見，但中文的名稱仍然不可忽略，如. 擁有英文或中文的別稱。這些都是指代的問題，並且會影響意見目標辨識的效果（Lin & Chao, 2010）。中文的諧音字是一種常見的用法，如 iPhone 也被寫做「哀鳳」，DELL 則被寫做「呆鵝」。中文的簡稱如小米 3 又可被稱為「米 3」，而英文的簡稱如 Sony 的 Xperia 系列常被簡寫為「X」加上型號，如「XZ」代表 Xperia Z，「XJ」代表 Xperia J 等。綜上所述，品牌、系列、型號的中文與英文以及別稱都是本研究可能的意見目標，因此我們將從各大品牌的網站資訊蒐集該品牌的所有系列與型號的正式中英文名稱，並從網路論壇逐一蒐集常見的別稱，以供意見目標辨識使用。. 18.

(28) 二、. 語料庫蒐集. 本研究的實驗是以搜尋引擎的搜尋結果作為實驗用語料的來源。因此事前決定的搜尋關鍵字與文章來源是一個影響語料庫文章來源的重要工作。首先是搜尋關鍵字。攜帶型智慧裝置的各類產品各自由不同的品牌主導，如手機市場有 HTC、Samsung 等等，筆記型電腦市場則有 Asus、DELL、HP 等等。此外，也有一些品牌跨足多類智慧型攜帶裝置產品，如 Apple 有 iPhone、iPad 與 Mac 橫跨三類產品。每一個產品的品牌、系列、型號名稱都是有可能的搜尋關鍵字，因此我們將以這三種關鍵字的類型分別蒐集文章。接著是文章來源。我們將鎖定文章的來源為兩個國內主要的網路論壇，分別. 政治大布告欄系統（Bulletin Board System; BBS）台大批踢踢實業坊的網頁版本，也是立. 是台大批踢踢實業坊網頁版11（下稱「批踢踢」）以及 Mobile0112。批踢踢是電子. ‧ 國. 學. 國內最大的 BBS 站。根據官方的流量統計13，批踢踢每日平均有 8 到 9 萬人同時在線。其站內討論的主題相當廣泛，而各個不同的討論主題之間則以「看板」的. ‧. 形式區隔，其中和攜帶型智慧裝置有關的綜合看板主要有 nb-shopping（筆記型電腦與平板電腦交易板）以及 MobileComm（手機板），而較知名的廠商也可能. Nat. sit. y. 會擁有專屬的看板，如 iPhone、Android、BlackBerry、WindowsPhone 等等。. er. io. Mobile01 是國內知名的以網路和 3C 為主的綜合性網路論壇，其中和攜帶型智慧. al. v i n Ch 踢踢類似，各大廠商會有各自專屬的討論區。此外，由於 e n g c h i U Apple 橫跨多類產品， n. 裝置有關的綜合討論區主要有攜帶型電腦綜合討論區以及智慧型手機綜合。和批. Mobile01 也為 Apple 開設一個專屬的分類。本研究的語料庫文章數量將在兩個論壇之間平衡，但是由於各論壇的產品分類方式不同，所以我們不在各討論區和看板之間做平衡。. 我們設計的搜尋方式如下。首先，對於 3 種產品類型，我們從每個產品類型中選擇 6 個品牌作為關鍵字；其次從每個品牌選擇 1 個系列作為關鍵字；接著，每個系列選擇 1 個產品型號作為關鍵字。由於一個系列的第一個產品可能與其系. 11 12 13. http://www.ptt.cc http://www.mobile01.com/ http://www.ptt.cc/statistics.html. 19.

(29) 列同名，如 iPad，導致在搜尋時無法確認該文章的意見目標是系列或型號。因此在選擇型號名稱時，我們指定與系列名稱不同的產品型號作為搜尋目標。本研究對於各類產品所選擇的品牌、系列、型號關鍵字如表 2 至表 4 所示。我們使用的搜尋引擎為目前主流的搜尋引擎 Google，而在搜尋之前，必須先刪除瀏覽器中所有的 Cookie 與瀏覽紀錄，以避免前面的搜尋干涉到後面的搜尋結果。此外，在蒐集來自 Mobile01 論壇的文章時，必須在查詢的欄位加上關鍵字「site:www.mobile01.com/topicdetail.php」；同樣地，在蒐集來自批踢踢的文章時，也必須加上「site:www.ptt.cc/bbs/」。如此才能鎖定搜尋範圍到論壇中由使用者發布在討論區或看板上的文章。. 政治大. 表 2 智慧型手機的品牌、系列、型號關鍵字列表. 立. 系列. 型號. 學. Butterfly. Butterfly s. Lumia. Lumia 920. Samsung. Galaxy. Galaxy s4. Sony. Xperia. Xperia Z. io. al. n. 華為. y. Nokia. sit. HTC. ‧. iPhone 5s. Nat. iPhone. er. Apple. ‧ 國. 品牌. Ascend. Ch. i n U. v. Ascend G700. engchi. 表 3 平板電腦的品牌、系列、型號關鍵字列表品牌. 系列. 型號. Acer. Iconia. Iconia A1. Apple. iPad. iPad mini. Asus. Nexus. Nexus 7. LG. G Tablet. G Tablet 8.3. Samsung. Galaxy Note. Galaxy Note 3. Sony. Xperia Tablet. Xperia Tablet Z. 20.

(30) 表 4 筆記型電腦的品牌、系列、型號關鍵字列表品牌. 系列. 型號. Acer. Aspire. Aspire S7. Apple. MacBook. MacBook Air. Asus. ZENBOOK. ZENBOOK UX301. DELL. Inspiron. Inspiron 14. Lenovo. ThinkPad X. ThinkPad X230. Toshiba. PORTEGE R. PORTEGE R930. 治政大尋後，取得 Google 的搜尋結果網頁，而 Google 的搜尋結果都位於 HTML 的標立題標籤「<h3 class=”r”>」內的超連結標籤「<a>」中（圖 4）。接著程式從每一筆. 本研究以自行撰寫的網路爬蟲程式蒐集文章。由程式對 Google 下關鍵字搜. ‧ 國. 學. 搜尋結果中取得該標籤的文字和超連結網址。針對每個網址，我們將同樣以網路爬蟲連至對應的網站並蒐集其 HTML 檔。. ‧. n. er. io. sit. y. Nat. al. 圖4. Ch. engchi. i n U. v. Google 搜尋結果網頁與部分原始碼（以三星為例）. 根據表 2 至表 4，我們應有 54 個關鍵字，但其中部分的品牌關鍵字有重複出現，如 Apple。扣除重複出現的品牌後，共計有 48 個關鍵字。每個關鍵字則. 21.

(31) 分別在 2 個網路論壇上搜尋，並蒐集位於第 1 頁的前 10 筆搜尋結果14。因此預計應有 960 筆搜尋結果，但由於不是每次搜尋都能得到 10 筆搜尋結果，本研究實際得到的搜尋結果為 946 筆。其中一些文章可能因涉及多個產品而重複出現。我們認為這樣的現象有其研究價值。原因在於這些重複的文章是以不同的關鍵字搜尋到的，應可讓我們以不同的搜尋目標的角度觀察其情感取向的變化。. 三、. 網路文本處理. 經由搜尋引擎取得各個搜尋結果的 HTML 檔後，我們必須將的網頁從 HTML 檔轉換為易讀性高的純文字檔（.txt），以便後續的人工標記工作。接著以中央研究院的句法剖析系統將文字檔轉換為斷詞後，且具有詞性標記和語意角色的句法. 政治大. 結構樹，以便後續的辭典建置和意見目標辨識工作。. 立. （一）文本擷取與斷句. ‧ 國. 學. 對於每一筆搜尋結果的 HTML 檔，我們將標題以及本文儲存為純文字檔。 Mobile01 的本文是指該討論串的第一篇文章，不含下方的回覆文章；批踢踢的. ‧. 本文則是指該文章本身，不含下方的推文、噓文和留言。以 Mobile01 為例，其. sit. y. Nat. 文章標題位於網頁的第一個標題標籤「<h2 class=”topic”>」內；而本文則位於分. io. er. 隔標籤「<div class=”single-post-content”>」內的第一個分隔標籤「<div>」內，. al. 如圖 5。另外，現今以網頁為介面的網路論壇或社群網站多有提供由該網站自訂. n. v i n 的圖片式表情符號，Mobile01C即是一例。這些表情符號應是作為意見的重要參 hengchi U 考依據，而且這些圖片式表情符號也有附加文字標籤以註明其中文意義，因此我們亦將其轉為文字的格式儲存。. 在搜尋結果中仍有部分無效的連結，如 Google 也會傳回在 Mobile01 或批踢踢上與關鍵字相同名稱的看板的文章列表，或是文章已被刪除等。在移除無效的連結後，實際剩餘的可用文章篇數為 934 筆。在擷取文章後，我們將這 934 篇文章斷句。本研究觀察網路文章的寫作方式和風格，設計了三種適用於不同情況的斷句方法。. 14. Google 搜尋結果的每頁預設筆數為 10 筆。. 22.

(32) 政治大. 立 Mobile01 網頁與部分原始碼. 圖5. ‧ 國. 學. 第一種斷句方法是針對正規寫作方式而設計，也就是依標點符號斷句。我們在文章中出現全形及半形的句號、問號、驚嘆號、冒號，以及分號等五種符號的. ‧. 位置斷句。. Nat. sit. y. 第二種斷句方法是針對批踢踢，以及少部分 Mobile01 的文章而設計。在批. er. io. 踢踢上，即使作者在文章編寫時採用正規的寫作方式，但是在網頁呈現時，批踢. al. 踢會自動將文章中過長的句子以<br>標籤斷行。另外，不論是在批踢踢或. n. v i n Ch Mobile01，也有一些作者會為了排版而自行換行。這些文章共同的特性是會有連 engchi U 續多行在視覺上的長度相近。以批踢踢而言，批踢踢的字體採用等寬字體，也就. 是每個全形或半形的字寬度相同，且 1 個全形字寬度剛好等於 2 個半形字。批踢踢的版面寬度是每行最多可容納 79 個半形字元或 40 個全形字元。而 Mobile01 的字體為非等寬，版面寬度約為 90 個半形字元，也就是約 45 個全形字元。我們將連續兩行以上，且寬度差距小於 3 的行合併為一行後，再依標點符號斷句。最後一種斷句方法是針對非正規的文章寫作方式。在大多數的網路論壇，尤其是批踢踢上，許多文章的作者並不會使用正規的標點符號，而是單純地以空白作為逗號，以換行作為句號。對於這些文章，我們將每一行中，介於兩個中文字之間的空白以逗號取代，並在每一行的最後一個字不是正規標點符號時，自動補 23.

(33) 上句號。上述方法的整理如表 5。表 5 斷句方法整理寫作方式. 斷行方式. 處理方式. 斷句依據. 正規寫作. 未斷行. 正規寫作. .。（句號）自行斷行或被合併長度相近的多行 ?？（問號）網頁斷行為一行. 非正規寫作. 無. !！（驚嘆號） 1. 將中文字之間的空 :：（冒號）白以逗號取代. 未斷行. 2. 在行末非標點符號 ;；（分號）時補上句號. 學. 表 6 語料庫的文章數與句數統計項目. 數量（單位） 946（筆）. 可用文章. 934（篇）. er. io. sit. y. Nat. 搜尋結果. ‧. ‧ 國. 政治大經過文章擷取與斷句處理後，相關的語料庫統計數字如表 6。立. 總句數. al. 33,425（句）. n. v i n Ch 每篇平均句數 i U e n g c h35.79（句）. （二）智慧型攜帶裝置名稱辨識由於智慧型攜帶裝置名稱和本研究在語句層次分析時的搜尋目標與意見目標有相當大的關係，因此辨識這些名稱是相當重要的。我們根據本章第一節蒐集而來的名稱以品牌、系列、型號的樹狀結構的 XML 儲存，英文一律採取半形小寫，如 Apple 的 iPhone 4s 可表示為： <brand name=”apple”> <series name=”iphone”> <product name=”4s”/> 24.

(34) </series> </brand> 為了能用準確的方式辨識這些名稱，我們採用列舉法，也就是把所有可能的名稱組合一一列出。藉由將品牌、系列、型號組合成各種可能的字串，並定義一標準的格式，我們在這些名稱的前後，以及品牌、系列，或型號之間以半形的底線「_」銜接。使品牌的標準格式為「_品牌_」；系列的標準格式為「_品牌_系列 _」；而型號的標準格式則是「_品牌_系列_型號_」。如此一來可使系統便於偵測這些名稱。以 Apple iPhone 4s 為例，除了以「Apple iPhone 4s」表示之外，也可以用「iPhone 4s」表示，而型號也可用於表示特定產品，如「4s」通常也可以直接指 iPhone 4s。我們將這些字串一律以標準格式「_apple_iphone_4s_」取代。但. 政治大等，因此純數字或純英文的型號將不作為辨識用。立（三）斷詞、句法剖析與意見目標辨識. 學. ‧ 國. 是純數字或純英文的產品型號容易與數量詞或英文單字混淆，如「5」或「pro」. ‧. 在本研究後續的情感詞庫建立之前，需要先將語料庫斷詞，並取得詞性標記的資訊，而意見目標辨識的工作則和句法剖析有關。由於句法剖析的系統也具有. Nat. sit. y. 斷詞以及詞性標記的功能，若是採用句法剖析系統，就可以一次完成斷詞、詞性. er. io. 標記，以及句法剖析等三項工作。然而，句法剖析系統在處理上因為比斷詞系統. al. v i n Ch 目的，也就是建置一情感分類的系統而言，時間是一個重要的指標。為了減少系 engchi U n. 多了語句結構的資訊，自然需要消耗比斷詞系統更多的時間。對於本研究的研究. 統處理的時間，同時又不捨棄語句結構的資訊，我們在句法剖析和斷詞之間採取. 了折衷的方式。在實驗的前置工作階段，我們採用中央研究院的句法剖析系統15 對語料庫斷詞，並取得詞性標記和句法結構的資訊。此時，我們將先根據對句法剖析結果的觀察，設計一個不需要句法結構資訊的意見目標辨識方法。最後在系統建置時，我們就可以採用中央研究院的斷詞系統16對系統蒐集到的文章斷詞和取得詞性標記，並以設計好的方法辨識句子的意見目標。. 15 16. http://parser.iis.sinica.edu.tw/ http://ckipsvr.iis.sinica.edu.tw/. 25.

(35) （四）意見目標辨識規則我們在第二章曾經提到，對語句層次的分析而言，意見目標是一個相當重要的因素。因為在網路文章中，許多人並不會自始至終都只撰寫同一個產品，而會以舉例、比較等方式，指出和其他產品的不同之處。對於本研究要建立的情感分類系統而言，當一個句子的意見目標與目前搜尋的搜尋目標不同時，其情感取向也應有不同。比如當我們在搜尋「Xperia Z」時，一個意見目標為「Galaxy s3」的句子，其意見不論是正面或負面，對我們而言可能是中立意見，因為這個句子與我們的搜尋目標並無關聯，但這個句子也可能隱含著相反的意見。也就是說，當一個句子對「Galaxy s3」為正面意見時，可能也隱含著對「Xperia Z」的負面意見；同樣地，當一個句子對「Galaxy s3」為面向意見時，可能隱含著對「Xperia. 政治大. Z」的正面意見。因此，分析句子的意見目標對本研究而言是相當重要的。我們. 立. 觀察句法剖析系統後的結果，並結合 Lin 與 Chao（2010）、Lu（2010）以及 Ma. ‧ 國. 學. 與 Wan（2010）的規則式方法及其概念，發展出一套用於本研究系統建置上的意見目標辨識規則。這些規則將用於後續語句層次的特徵抽取。. ‧. 首先，我們根據 Lin 與 Chao（2010）的方法定義可能的意見目標集合為本. sit. y. Nat. 章第二節蒐集的攜帶型智慧裝置廠牌、系列、型號的中英文與別稱，以下稱為候. io. al. er. 選意見目標集合。. n. 定義：候選意見目標集合為產品名稱資料庫中已蒐集的廠牌、系列、型號的中英文與別稱。. Ch. engchi. i n U. v. 接下來，當目前的句子含有候選意見目標時，Lin 與 Chao（2010）認為應選擇最後出現者，而 Lu（2010）則認為應從句法結構著手。在第二章曾提到比較句的問題。在經過簡單的測試後，我們發現 Lu（2010）的方法在比較句的處理上表現較為優秀。因為不論是不對等的分級比較句（圖 6）、對等的比較句（圖 7），或是最高級比較句（圖 8），經過中文的剖析後都能找出其意見的受體。. 26.

(36) 圖 6 不對等分級比較句的測試結果. 立. 政治大. ‧. ‧ 國. 學 er. io. sit. y. Nat. n. a圖l 7 對等比較句的測試結果i v n Ch U engchi. 圖 8 最高級比較句的測試結果. 27.

(37) 根據中央研究院詞庫小組的語意角色說明文件17。圖中的 theme 是「表靜態及分類述詞敘述的對象或動態事件中描述存在或位移的主事者，以及因事件動作造成物體的狀態從無到有的受事者，皆使用這個語意角色。」 Lu（2010）的規則是： 1.. 取出該句中作為主張動詞之受詞的子句。 (1) 取出該子句的主詞作為意見目標。 (2) 取出位於主張動詞之後，且母節點是意見詞的主詞作為意見目標。. 2.. 取出該句的主詞作為意見目標。. 3.. 取出該句的受詞作為意見目標。. 政治大受詞子句中，其主詞同時也被定為該句的 theme 角色。由此可見，theme 角色和立. 對於規則 1，從圖 6 和圖 7 的例子中我們可以發現，在主張動詞「覺得」的. 主張動詞有著相當程度的關係。因此，我們將規則 1 改寫為依賴主張動詞的意見. ‧ 國. 學. 目標辨識規則。. ‧. 規則 1：以位於主張動詞之後的候選意見目標作為該句的意見目標。. y. Nat. 然而，theme 角色可能是複合的名詞片語（如對等比較句），此時可能有多. io. sit. 個同等地位的意見目標。在圖 7 的例子中，「好」對「_Apple_iPad_mini_」與. n. al. er. 「_Galaxy_note_3_」兩者都是正向意見。在只能取一個意見目標的情況下，自. i n U. v. 然會希望意見目標和我們的搜尋目標一致。為了處理這樣的情況，我們自行設計. Ch. engchi. 了優先順序高於規則 1 的規則，用以處理對等比較句的情形。此處我們會需要能夠表現對等關係的詞彙，關於這些詞彙的蒐集我們將在第五小節介紹。規則 0：如果句中含有對等關係的關鍵字（一樣、相同），且句中有搜尋目標時，則將該句的意見目標指定為搜尋目標。. 「我覺得 iPad mini 跟 Galaxy Note 3 一樣好。」在搜尋目標為「Galaxy Note 3」的情況下，此句因含有對等關係的關鍵詞彙「一樣」，且句中有「iPad mini」和「Galaxy Note 3」兩個候選意見目標，因此. 17. http://turing.iis.sinica.edu.tw/treesearch/. 28.

(38) 將直接以「Galaxy Note 3」作為意見目標。對於規則 2，我們需要判別主詞的位置，但是句法剖析系統並不包含主詞的資訊，而是以語意角色取代。但是我們根據對語料庫中的句子的觀察，發現當候選意見目標出現在句首時，其有相當大的機會就是主詞。. 「Galaxy s4 mini 好小巧可愛啊。」「iPhone 5S 開賣開箱開機拍照簡單試玩」因此我們以候選意見目標的位置簡單地改寫規則 2。規則 2：以位於句首的候選意見目標作為該句的意見目標。對於規則 3，我們的發現則和 Lu（2010）不同。Lu（2010）認為受詞也可. 政治大. 能作為意見目標。然而，如果我們將圖 6 的句子改寫為下面的句子：. 立. 「我覺得這支手機比 Galaxy s3 好。」. ‧ 國. 學. 此時會發現「Galaxy s3」是作為介係詞「比」的受詞。但是「Galaxy s3」卻不會是「好」這個意見詞的受體。又如：. ‧. 「這支手機的效能勝過 xperia J。」. y. Nat. io. sit. 在這一句中，作為受詞的「xperia J」也不是意見詞「勝過」的受體。我們. n. al. er. 發現，雖然在這些句子中存在候選意見目標，但是這些候選意見目標的優先程度. i n U. v. 仍不足上兩句中的「這支手機」。因此，我們應排除位在介係詞或動詞後，作為. Ch. engchi. 受詞的候選意見目標，而規則 3 則修改為排除式的規則。規則 3：當候選意見目標出現在介係詞或動詞之後時，則不作為該句的意見目標。最後，當該句仍然有其他候選意見目標時，我們以規則 4 直接採納為該句的意見目標。若此時仍有多個候選意見目標，便可套用 Lin 與 Chao（2010）的規則，也就是選擇最後出現者。規則 4：以該句中最後出現的候選意見目標作為該句的意見目標。在處理完句中有候選意見目標的句子後，我們再依序處理句中不含候選意見目標的句子。Lin 與 Chao（2010）的方法是先往前五句，再往後五句尋找候選意 29.

(39) 見目標，並選擇距離目前的句子最近者，而 Ma 與 Wan（2010）則指出前一句的意見目標很有可能是目前句子的意見目標。我們結合兩者，也就是以之前已辨識的意見目標作為目前句子的意見目標，而至多依序往前搜尋三句。當前三句皆無可用的意見目標時，則以搜尋目標做為預設的意見目標。規則 5：從該句的位置開始，依序往前搜尋已辨識的意見目標作為該句的意見目標。至多搜尋三句。. 「我覺得 iPad mini 比 Galaxy Note 3 好用。畢竟解析度比較高，照相比較清楚。」第二句的句中並未含有任何候選意見目標，此時將往前面的句子搜尋已辨識. 政治大. 的意見目標，而第一句的意見目標為「iPad mini」，因此第二句的意見目標將同. 立. 樣被指定為「iPad mini」。. ‧ 國. 學. 規則 6（Default）：以搜尋目標作為意見目標。. 最後，當無法以上述的規則取得任何意見目標時，我們便採用文件層次情感. Nat. y. 人工標記. sit. 四、. ‧. 分類的假設，指定這些句子的意見目標皆為搜尋目標。. n. al. er. io. 在文件層次，我們要分析文章整體而言對於搜尋目標的情感取向，也就是每. i n U. v. 篇文章對於搜尋目標是正面／負面／中立意見。過去情感分類的研究中，若資料. Ch. engchi. 來源為意見評論的網站，則通常網站上會有星級或分數的設計，可做為類別的依據。但是本研究的資料來源為一般的網路論壇，在 Mobile01 和批踢踢上皆無星級或分數的設計。因此為了後續的情感分類實驗，必須將語料庫中的文章以人工的方式標記類別。我們對語料庫中的 934 篇文章都進行情感標記。文章的情感標記的規則如下： 1.. 如果該文章的情感取向對於搜尋目標為正面意見，則標記為 1。. 2.. 如果該文章的情感取向對於搜尋目標為負面意見，則標記為-1。. 3.. 以上皆非，則標記為 0，代表該文章為中立意見或不含意見。. 文章在人工標記後的結果如表 7。 30.

(40) 表 7 文章的情感標記結果情感標記文章數量正向. 273. 負向. 259. 中立. 402. 總計. 934. 在語句層次，本研究要分析網路論壇文章中每個句子的情感取向，也就是每個句子對於搜尋目標是正面／負面／中立意見。但在本研究的 934 篇文章中共有. 政治大代表其他句子的資料，我們將文章依 3 種產品類型（智慧型手機、平板電腦、筆立記型電腦）、3 種搜尋目標類型（品牌、系列、型號）、2 種論壇（Mobile01 與批 33425 個句子，若是全數標記需要極大的工作量。為了以較少的工作量挑出足夠. ‧ 國. 學. 踢踢），以及 3 種情感標記（正面／負面／中立）分為 54 類，並在每類中選擇 4 到 5 篇具代表性的文章，共計 227 篇文章與 11012 個句子。我們對這 11012 個句. ‧. 子進行情感標記。人工標記的時候將顯示每個句子及當前的搜尋目標，其畫面如. n. al. er. io. sit. y. Nat. 圖 9。. Ch. engchi. i n U. 圖 9 人工標記畫面 31. v.

(41) 句子的情感標記的規則如下： 1.. 如果該句子的情感取向對於搜尋目標為正面意見，則標記為 1。. 2.. 如果該句子的情感取向對於搜尋目標為負面意見，則標記為-1。. 3.. 以上皆非，則標記為 0，代表該句為中立意見或不含意見。. 我們將每個句子分別給 3 個人標記，並採取多數決的方式決定每個句子的情感取向。比如當一個句子被 A 標記為 1，被 B 標記為 0，被 C 標記為 1 時，則此句應為正向句。為了避免過多的誤判，若句子的三個標記同時出現 1 和-1 時，則由我們檢查句子的情感標記是否正確，並給予對應的調整。句子在人工標記和調整後的結果如表 8，其中完全一致是指同一個句子的三個標記皆相同，而部分一. 政治大. 致是指兩個相同，其中一個不同的標記。. 立表 8. 句子的情感標記結果. ‧ 國. 學. 情感標記句子數量完全一致部分一致 1,601. 842. 759. 負向. 1,083. 616. 467. Nat. 8,328. 7,042. 1,286. 11,012. 8,500. n. al. 五、. C. hengchi 情感詞庫的蒐集與建立. y. sit. io. 總計. er. 中立. ‧. 正向. i n U. 2,512. v. 本研究採用 NTUSD 和 HowNet-VSA 作為基礎的情感詞庫來源。其中 HowNet-VSA 為簡體中文，但語料庫中的文章皆由正體中文撰寫，所以必須先將 HowNet-VSA 的詞語轉為正體中文後才能使用。另外，在 HowNet-VSA 中還有和情感取向無關的主張詞語和程度級別詞語，在此先不討論，此處僅使用正向詞與負向詞。. （一）意見詞辭典首先是建立意見詞辭典，本研究建立意見詞辭典的方法如下： 1.. 將 NTUSD 與 HowNet-VSA 視為兩個詞語的集合並比對。 32.

(42) (1) 由於 HowNet-VSA 有同時出現在正向詞與負向詞的詞彙，我們先將這些詞取出，加入初始中立詞集合 Oraw。 (2) 當一個詞只出現在 NTUSD 或 HowNet-VSA 時，則將該詞語依照其原本的分類加入初始正向詞集合 Praw 或初始負向詞集合 Nraw。 (3) 當一個詞同時出現在 NTUSD 與 HowNet-VSA，且其分類相同時，則將該詞語依照其原本的分類加入初始正向詞集合 Praw 或初始負向詞集合 Nraw。 (4) 當一個詞同時出現在 NTUSD 與 HowNet-VSA，但其分類不同時，則將該詞語加入初始中立詞集合 Oraw。 2.. 把初始正向詞集合 Praw、初始負向詞集合 Nraw、初始中立詞集合 Oraw. 政治大、N 、O 。. 等三個詞彙集合跟已斷詞的語料庫中的詞彙交集，以過濾沒有出現在語. 立. 料庫中的字，稱為 Pfilter. filter. filter. ‧ 國. 學. 在第二章中曾經介紹重新定義情感取向的方法，也就是 SO。此處我們將 SO 中 PMI 的算法稍做更改。原本 SO 中的 PMI 是計算一未知情感取向的詞彙和一. ‧. 已知的正向或負向詞的獨立性，但在本研究中，我們已經先行以人工標記的方式. y. Nat. 取得句子的情感取向，因此本研究將此處的 PMI 改為計算詞彙與正向語句和負. io. sit. 向語句的獨立性，分別稱為 PMI+與 PMI-，如第 6 式與第 7 式，其中 s+和 s-分別. n. al. er. 代表人工標記後的正向句和負向句。. Ch. engchi. i n U. v. (6). (7) 因此 SO 的計算方法將更改為第 8 式。 (8) 其中機率的計算是採用最大似然估計法（Maximum Likelihood Estimation; MLE），如第 9 式至第 11 式。. 33.