監督式情緒偵測

第二章文獻回顧

2.2 情緒分析

2.2.1 監督式情緒偵測

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

情緒分析的研究方法可分為兩類：監督式 (Supervised) 與非監督式 (Unsupervised)之情緒偵測。此兩種方式之最大差別，為監督式情緒偵測依照分析之標的，使用訓練資料(Training Dataset)訓練出分類器，以分類正向與負向之情緒，如圖 6 所示；而非監督式沒有針對標的訓練分類器，而使用既有情緒辭典或統計方法區別情緒之正負向，如圖 7 所示。

圖 6 監督式情緒偵測

圖 7 非監督式情緒偵測

2.2.1 監督式情緒偵測

監督式情緒偵測使用已標籤的訓練資料(Training Dataset)訓練分類器，而後透過所訓練出的分類器將目標資料分類為正向或負向。在將監督式學習法應用於情緒偵測時，通常需要考慮：該選用那些屬性以代表整份評論、如何取得已知

Training

Data Set 訓練分類器

資料分類器

_{（正向、負向）}^分類

資料字典或

統計方法

^{（正向、負向）}

^分類

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

情緒極性的評論作為訓練資料，以及該使用何種分類器等三個問題。以下將針對

「屬性別」、「訓練資料來源」與「分類器」等三點進行討論。

i. 屬性別(Attribute)：

情緒分析亦可視為將一份評論分類為正向或負向的分類問題。然而，不同於一般分類問題，在分類一則評論的情緒時，較為困難的問題是：「我們要使用那些屬性來代表一則評論？」(Mejova, 2009)。過去研究通常使用字詞向量(vocabulary vector)來代表一則評論。假設{f¹, f², f³, …, f^m}為所有評論所包含的 m 個不同字詞所形成的集合，nⁱ(d)為字詞 fⁱ出現在評論 d 中的頻率，則評論 d 可用向量 d := (n¹(d), n²(d),…, n^m(d))來表示。除了字詞出現頻率外，其它常被用來定義屬性的有：「存在與否」、「N-Gram」以及「詞性」。

 頻率或出現與否(Frequency or Presence)：傳統訊息檢索系統 (Traditional Information Retrieval systems)已長期強調頻率之重要性，其中廣為使用之量測方式為 TF-IDF(Term Frequency - Inverse Document Frequency)[Jones, 1972]。TF-IDF 為一種統計方法，用來評估一個字對於一份文件之重要性。當此字詞在目標文件中出現頻率越高，而出現在資料庫中其他文件之頻率越低時，

此字詞針對目標文章之重要性越高。然而，在 Pang et al.(2002) 的實驗結果中，只使用字詞出現與否(若某字詞曾出現在文件中，

則其在向量中的對應值為 1；否則為 0)做為屬性值的結果反而優於使用字詞出現頻率。Wiebe et al., (2004)提到，「顯然的是，當

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

人們越是主觀時，則越能產生創意。」意味著低頻率在主觀文章中之重要性日趨重要。

 N-Gram：一個字詞所表達的情緒，可能會隨著字詞前後所緊鄰的其它字詞而有所變化，例如字詞之前有否定詞的時候。因此使用由兩個字詞、三個字詞，甚至多個字詞所組成的項目(term)做為屬性，

可能有助於更精確的分別不同前後文下，字詞所表達的情緒。有鑑於此，Wiebe et al., (2004)使用 N-Gram(N=1,2,3…)為屬性之單位，其 N 值的選擇以兩大原則為基礎：第一，使用 N-Gram 之精確度必頇大於基礎精確度；第二，在 N-Gram 的精確度必頇大於其組合元素之最大精確度。其研究結果顯示，考慮 N-Gram 之方式能使精確度提高。

 詞性(Part-of-Speech)：研究證實，形容詞為消費者表達主觀情緒時最常使用的詞性[Hatzivassiloglou and Wiebe, 2000; Benamara et al., 2007]。且在過去十年的研究中，透過詞性找尋情緒面相的方式也已應用於情緒分析的範疇中[Mullen and Collier, 2004;

Whitelaw et al., 2005]。

ii. 訓練資料來源：

適合用於情緒分析的訓練資料大致有兩種來源：「現成訓練資料」與消費者評論之「星等系統(Star System)」。

 現成訓練資料：個別研究人員或相關研究室建立了許多現成的訓練資料，其中包含：

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

 Congressional floor-debate transcripts：Thomas and Pang (2006)收集了政治演說的資料，並以演說者支持或反對進行中的立法討論作為類別。

 Cornell movie-review datasets：由 Pang and Lee (2008) 提出，包含 1000 份電影評論之正面意見文件(Document)與 1000 份電影評論之負面意見文件。以及各 5331 個正負意見之句子。

 MPQA Corpus：由不同來源所收集到的 533 筆新聞，並標誌以個人意見或情感狀態（例如：信念、情感、揣測等）作為類別。

 Multiple-aspect restaurant reviews ： Snyder and Barzilay(2007)所提出，包含 4488 篇餐廳評論，針對食物、

氣氛、服務、價值、與整體評價，皆具有完整的 1~5 星評分。

 星等系統：目前網路上大部分提供評論功能的網站，如 Amazon、

C-Net、EBay…等，皆具有為整體商品評分的星等系統。研究者可直接依據評論人所給予的星等判斷整體評論為正向或負向，不需經由人工判斷。因此也成為有力之訓練資料來源。

iii. 分類器：

取得合適之訓練資料後，可以使用機器學習(Machine Learning)之演算法訓練分類器。其中最廣為應用於情緒分析的演算法有三種，分別為 SVM (Support Vector Machines) [Pang and Lee, 2002; Dave et al., 2003; Gamon, 2004; Kudo et al., 2004; Airoldi et al., 2006]；

NB (Naive Bayes) [Wiebe et al., 1999; Yu and Hatzivassiloglou,

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

2003; Melville et al., 2009] 與 ME(Maximum-entropy-based Classifiers) [Nigam et al., 1999; Pang and Lee, 2002]。其各自有適合使用之情境，Pang and Lee (2002)的研究比較了各式分類器在不同情境下的表現。

監督式演算法的好處在於，不需要使用額外的情緒辭典或模型，只需取得數量足夠、已知情緒類別的評論做為訓練資料，即可產生用來分辨情緒的分類器。

然而，並非所有的情境都可取得適用的訓練資料。因此，另有一部分研究，發展非監督式的情緒偵測演算法。

在文檔中隱藏意見萃取--辨識多世代商品之關鍵特色 - 政大學術集成 (頁 23-27)

第二章 文獻回顧

2.2 情緒分析

2.2.1 監督式情緒偵測

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

2.2.1 監督式情緒偵測

Training

Data Set 訓練 分類器

資料 分類器

資料 字典或

統計方法

分類

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第二章文獻回顧

立政治大學

Data Set 訓練分類器

資料分類器

資料字典或

^分類

立政治大學

立政治大學

立政治大學

立政治大學