• 沒有找到結果。

第二章 文獻回顧

2.2 情緒分析

2.2.1 監督式情緒偵測

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

23

情 緒 分 析 的 研 究 方 法 可 分 為 兩 類 : 監 督 式 (Supervised) 與 非 監 督 式 (Unsupervised)之情緒偵測。此兩種方式之最大差別,為監督式情緒偵測依照分 析之標的,使用訓練資料(Training Dataset)訓練出分類器,以分類正向與負向 之情緒,如圖 6 所示;而非監督式沒有針對標的訓練分類器,而使用既有情緒 辭典或統計方法區別情緒之正負向,如圖 7 所示。

圖 6 監督式情緒偵測

圖 7 非監督式情緒偵測

2.2.1 監督式情緒偵測

監督式情緒偵測使用已標籤的訓練資料(Training Dataset)訓練分類器,而 後透過所訓練出的分類器將目標資料分類為正向或負向。在將監督式學習法應用 於情緒偵測時,通常需要考慮:該選用那些屬性以代表整份評論、如何取得已知

Training

Data Set 訓練 分類器

資料 分類器

(正向、負向) 分類

資料 字典或

統計方法

(正向、負向)

分類

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

24

情緒極性的評論作為訓練資料,以及該使用何種分類器等三個問題。以下將針對

「屬性別」、「訓練資料來源」與「分類器」等三點進行討論。

i. 屬性別(Attribute):

情緒分析亦可視為將一份評論分類為正向或負向的分類問題。然而,不 同於一般分類問題,在分類一則評論的情緒時,較為困難的問題是:「我 們要使用那些屬性來代表一則評論?」(Mejova, 2009)。過去研究通常 使用字詞向量(vocabulary vector)來代表一則評論。假設{f1, f2, f3, …, fm}為所有評論所包含的 m 個不同字詞所形成的集合,ni(d)為 字詞 fi出現在評論 d 中的頻率,則評論 d 可用向量 d := (n1(d), n2(d),…, nm(d))來表示。除了字詞出現頻率外,其它常被用來定義屬 性的有:「存在與否」、「N-Gram」以及「詞性」。

 頻率或出現與否(Frequency or Presence):傳統訊息檢索系統 (Traditional Information Retrieval systems)已長期強調頻率 之重要性,其中廣為使用之量測方式為 TF-IDF(Term Frequency - Inverse Document Frequency)[Jones, 1972]。TF-IDF 為一種統 計方法,用來評估一個字對於一份文件之重要性。當此字詞在目標 文件中出現頻率越高,而出現在資料庫中其他文件之頻率越低時,

此字詞針對目標文章之重要性越高。然而,在 Pang et al.(2002) 的實驗結果中,只使用字詞出現與否(若某字詞曾出現在文件中,

則其在向量中的對應值為 1;否則為 0)做為屬性值的結果反而優於 使用字詞出現頻率。Wiebe et al., (2004)提到,「顯然的是,當

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

25

人們越是主觀時,則越能產生創意。」意味著低頻率在主觀文章中 之重要性日趨重要。

 N-Gram:一個字詞所表達的情緒,可能會隨著字詞前後所緊鄰的其 它字詞而有所變化,例如字詞之前有否定詞的時候。因此使用由兩 個字詞、三個字詞,甚至多個字詞所組成的項目(term)做為屬性,

可能有助於更精確的分別不同前後文下,字詞所表達的情緒。有鑑 於此,Wiebe et al., (2004)使用 N-Gram(N=1,2,3…)為屬性之單 位,其 N 值的選擇以兩大原則為基礎:第一,使用 N-Gram 之精確 度必頇大於基礎精確度;第二,在 N-Gram 的精確度必頇大於其組 合元素之最大精確度。其研究結果顯示,考慮 N-Gram 之方式能使 精確度提高。

 詞性(Part-of-Speech):研究證實,形容詞為消費者表達主觀情緒 時最常使用的詞性[Hatzivassiloglou and Wiebe, 2000; Benamara et al., 2007]。且在過去十年的研究中,透過詞性找尋情緒面相 的方式也已應用於情緒分析的範疇中[Mullen and Collier, 2004;

Whitelaw et al., 2005]。

ii. 訓練資料來源:

適合用於情緒分析的訓練資料大致有兩種來源:「現成訓練資料」與消 費者評論之「星等系統(Star System)」。

 現成訓練資料:個別研究人員或相關研究室建立了許多現成的訓練 資料,其中包含:

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

26

 Congressional floor-debate transcripts:Thomas and Pang (2006)收集了政治演說的資料,並以演說者支持或反對進行中 的立法討論作為類別。

 Cornell movie-review datasets:由 Pang and Lee (2008) 提出,包含 1000 份電影評論之正面意見文件(Document)與 1000 份電影評論之負面意見文件。以及各 5331 個正負意見之 句子。

 MPQA Corpus:由不同來源所收集到的 533 筆新聞,並標誌以 個人意見或情感狀態(例如:信念、情感、揣測等)作為類別。

 Multiple-aspect restaurant reviews : Snyder and Barzilay(2007)所提出,包含 4488 篇餐廳評論,針對食物、

氣氛、服務、價值、與整體評價,皆具有完整的 1~5 星評分。

 星等系統:目前網路上大部分提供評論功能的網站,如 Amazon、

C-Net、EBay…等,皆具有為整體商品評分的星等系統。研究者可 直接依據評論人所給予的星等判斷整體評論為正向或負向,不需經 由人工判斷。因此也成為有力之訓練資料來源。

iii. 分類器:

取得合適之訓練資料後,可以使用機器學習(Machine Learning)之演算 法訓練分類器。其中最廣為應用於情緒分析的演算法有三種,分別為 SVM (Support Vector Machines) [Pang and Lee, 2002; Dave et al., 2003; Gamon, 2004; Kudo et al., 2004; Airoldi et al., 2006];

NB (Naive Bayes) [Wiebe et al., 1999; Yu and Hatzivassiloglou,

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

27

2003; Melville et al., 2009] 與 ME(Maximum-entropy-based Classifiers) [Nigam et al., 1999; Pang and Lee, 2002]。其各自 有適合使用之情境,Pang and Lee (2002)的研究比較了各式分類器在 不同情境下的表現。

監督式演算法的好處在於,不需要使用額外的情緒辭典或模型,只需取得數 量足夠、已知情緒類別的評論做為訓練資料,即可產生用來分辨情緒的分類器。

然而,並非所有的情境都可取得適用的訓練資料。因此,另有一部分研究,發展 非監督式的情緒偵測演算法。

相關文件