• 沒有找到結果。

第三章 研究方法

3.4 意見詞與屬性詞類別配對

3.4.4 特徵選取

我們觀察哪些特徵的組合是對辨識屬性類別比較有幫助的,共有五個分類特 徵,使用 Le et al. [20004]所提出的 Forward Sequential Selection Algorithm 來做特 徵選取,這個特徵選取的方法是首先定一個特徵的空集合 SF(Selection Feature),

然後我們對每一個分類特徵做分類實驗,挑一個最高正確率的特徵 Fi加入 SF 集 合中。接著下一步我們將 Fi跟每一個分類特徵搭配,挑選最高分類正確率的組 合來當作第二個要放入 SF 中的特徵,一直反覆這步驟直到最後正確率不再比前 面特徵組合高為止,最後 SF 就是我們最佳的特徵組合。

我們利用 Forward Sequential Selection Algorithm 比較分類器分類效果,首先 對單一特徵做實驗找出最佳的分類特徵,如表 21 所示。

表 21:分類結果第一回合

單一特徵 正確率

F1.意見詞在評論中的第一小句 65.00%

F2.意見詞前一小句的屬性詞 72.22%

F3.在一個電影評論內,評論者常會評論到某一種類別的屬性詞 65.00%

F4.一個意見詞常形容哪一類屬性類別 85.87%

F5.利用網路資訊,計算意見詞和屬性類別的關連性 78.83%

我們根據表 21 的實驗結果,我們在第一回合挑選出 F4“一個意見詞常形容 哪一類屬性類別”這個特徵,將此特徵加入我們的 SF 集合,這時候 SF={F4}再與 其它特徵配對,進行第二回合實驗。

表 22:分類結果第二回合

雙特徵 正確率

F4+F1 86.67%

F4+F2 86.67%

F4+F3 87.78%

F4+F5 86.11%

在表 22 第二回合中,我們挑選 F3“在一個電影評論內,評論者常會評論到 某一種類別的屬性詞”這個特徵,將此特徵加入我們的 SF 集合,這時候 SF={F4、

F3}再與其它特徵配對,進行第三回合實驗。

27

表 23:分類結果第三回合

三特徵 正確率

F4+F3+F1 86.94%

F4+F3+F2 87.22%

F4+F3+F5 86.39%

我們可以看出在表 23 第三回合中沒有更高的正確率,所以特徵選取結束,

我們以第二回合選出的 SF={F4、F3}為最佳的特徵組合。在這特徵組合下,我們 得到正確率 87.22%,而在使用全部特徵的情況下正確率是 86%,代表這特徵選 取可以得到更好的分類效果。

我們觀察選取特徵過程,發現 F4“一個意見詞常形容哪一類屬性類別”為主 要增加分類效果的特徵,以及搭配 F3“在一個電影評論內,評論者常會評論到某 一種類別的屬性詞”特徵可以達到最好的分類效果。我們觀察其它分類特徵,F1 特徵在意見詞在第一小句,這種情況相對來說比較少數,對分類效果沒有很大的 助益,而 F2 特徵在意見詞前一小句的屬性詞,也不一定是此意見詞所形容的屬 性詞,F5 特徵利用網路資訊計算詞彙關連性,沒有明顯的助益效果。

3.5 意見

意見意見意見評分評分評分評分

在這節中我們會利用 3.3 節擷取的意見詞,對每個意見詞會給它一個意見分 數。意見分數範圍是一到五分,一分是最低評價並偏向負向意見,而五分偏向正 向情緒。我們考慮修飾意見詞的副詞及意見詞前的否定詞的影響,所以在這些影 響下去修改意見詞分數,最後我們觀察意見詞所處的小句位置、小句內的轉折語 當作這意見詞在整個評論的權重,最後產生整個評論的評分。

3.5.1 意見詞計分

意見詞計分意見詞計分 意見詞計分

我們參考[Marneffe et al. , 2010]的方法產生每一個意見詞的分數,此篇方法 是收集奇摩電影評論一到五顆星各約兩千篇,計算這意見詞在各個星等的評論出 現的機率,機率乘上目前星等的顆星數加總為此意見詞分數,但我們觀察產生的 意見分數,不少意見詞的分數都在三分左右,這些意見詞分數沒有很明顯地偏向 五分或者一分,而這些分數在後續的評論自動評分實驗中效果也不太好。所以我 們修改產生意見詞分數的方法。

我們單純把評論語料中四、五顆星當作正向語料,一、二顆星當作負向語料,

各別算出意見詞在正負語料中出現的機率,如果是正向語料的機率是乘上 5 分,

而負向語料機率則是乘上 1 分,兩個數值相加當作意見詞分數。如果意見詞含有 強烈的正向意見會靠近 5 分,如果意見詞比較沒有強烈正向意見則會遠離 5 分,

反觀負向意見也是如此,而意見分數越靠近 3 分則代表意見極性越中立,意見分 數產生如公式 4、5、6。

28

Fw, t = #>"?@,

#>" (4) Pw, t =B′ϵC-?-?@, @, (5) Word_scorew = ∑ S × PwϵF , t (6)

正向語料為 8000 篇,負向語料為 7189 篇。在公式 4 中是計算意見詞在語料 t 中出現頻率,w是指這意見詞,t 是指正負語料,而countt 是指在語料 t 中全 部詞彙出現數量, countw, t 代表在語料 t 中詞彙w出現數量。公式 5 利用w

語料 t 出現頻率,來計算意見詞w在正負語料出現的機率。公式 6 在正向語料 S 為 5,負向語料 S 為 1,把意見詞出現正向語料的機率乘上 5 分,加上出現在負 向語料的機率乘上 1 分加總起來,當作此意見詞的意見分數。

計算意見詞分數範例:

假設正向語料 t 詞彙量為 10000 個,負向語料 t 詞彙量為 8000 個 意見詞w在正向語料出現數量為 100 個,負向語料為 20 個 t 是正向語料:F(w, t)=100/10000=0.01

t 是負向語料:F(w, t)=20/8000=0.0025

t 是正向語料:P(w, t)=0.01/(0.01+0.0025)=0.8 t 是負向語料:P(w, t)= 0.0025/(0.01+0.0025)=0.2

計算意見詞 w 的分數:Word_score(w)=(5×0.8)+(1×0.2)=4.2

產生各個意見詞的意見分數之後,我們做一個意見極性判斷實驗,利用之前 兩千篇評論標記的評論語料,收集正向意見詞及負向意見詞當作測試語料,正向 意見詞為 451 個,負向意見詞為 255 個,把這些標記意見詞與自動產生的意見詞 分數比較,我們定 Word_score(w)大於等於三視為正向意見詞,Word_score(w) 小於三則視為負向意見詞,觀察意見分數的極性辨別效果,實驗結果如表 24。

表 24:意見詞情緒極性實驗

意見詞極性 人工標記 結果

系統正確 標記

系統

標記 Recall Precision F-score 正向

意見詞 451 396 435 87.8% 91% 89.3%

負向

意見詞 255 216 271 84.7% 79.7% 82.1%

實驗結果中我們發現單純判別意見詞極性效果 F-score 都有 80%以上甚至 90%,這說明自動產生的意見詞分數在意見極性辨識有相當的準確度。

我們列舉一些意見詞及它的意見分數,如表 25 所示,我們可以發現利用意 見分數辨別極性的錯誤情況中,這些意見詞分數大多都是靠近三分左右,某方面

29

來說這些意見詞都靠近中立分數,以致於會有辨識極性錯誤的情況。

表 25:意見詞分數舉例 人工標

記意見 詞極性

系統產生 意見詞分 數

意見詞分數舉例

正向意 見詞

系統正向 意見詞

完美 超好 震撼力 享受 歡樂 好笑 歡笑 4.1 4.2 4.2 3.9 3.9 3.5 4.5 系統負向

意見詞

好評 分明 清晰 典型 奇妙 頗好 尖叫 2.6 2.5 2.8 2.9 2.1 2.0 2.5 負向意

見詞

系統正向 意見詞

醜女 遺憾 不屑 機車 倉促 暸草 複雜 3.3 3.8 3.1 3.2 3.1 3.1 3.4 系統負向

意見詞

牽強 糟糕 抄襲 無理 納悶 乏味 狗屁 2.5 1.8 1.0 2.6 2.8 2.2 1.2 我們利用訓練語料標記的結果,找出同時有兩種極性的意見詞,這些意見詞 需要前後文判斷情緒極性。例如: 老、芭樂、大、深、少、簡單、平淡、太多、

平平淡淡、誇張...等,及情緒中立詞,例如: 普通、還可以、還算可以、普普通 通...等,我們收集這些詞彙作為後續評分處理。

3.5.2 評論評分

評論評分評論評分評論評分

3.5.1 節產生出每個意見詞的意見分數,我們參考 Zhang et al. [2009]考慮修 飾意見詞的副詞及否定詞的影響。我們在處理副詞部分,對意見詞極性有加強作 用的副詞作處理,如表 26 所示,定義這些副詞詞彙為副詞集合。從 3.3.3 節詞性 序列 ADV+V 收集而來,這些副詞對意見詞的極性有加強的作用,所以對意見詞 的分數也有所影響。我們設參數為α來對意見詞分數修改。在否定詞部分,否定 詞出現在意見詞前面,這個否定詞有反轉這意見詞的意見極性效果,我們設參數 為β。如果沒有副詞、否定詞,則參數預設值為 1。否定詞列表如表 27,定義這 些詞彙為否定詞集合。

30

表 26:修飾意見詞副詞

很 非常 最 太 好 還

滿 真是 都 有夠 夠 真的

真 那麼 挺 更 這麼 比較

蠻 絕對 極力 越 實在 極為

更加 如此 多麼 一直 頗 多

十分 相當

表 27:否定詞列表

不覺得 不要 不可能 不 不是 勿

缺乏 缺 了無 很少 不會 難

否認 比不上 全無 難以 絕無 無

缺乏 不至於 少 毫無 毫不 萬萬不

請勿 從不 不再 決不 不用 怎會

沒有 哪有 原本 本來 以為 別

沒 無 不會 過於 哪裡

利用公式 7 修改意見詞分數,原本 Word_score 範圍是[1,5]轉換成[-1,+1],之 後乘上α、β參數修改意見詞分數,產生 Modified_score 來達到加強或反轉意見極 性的作用。

ModiHied_scorew = α× β× Word_scorew (7)

α = J 1.5, 如果意見詞w前面兩個詞中有包含副詞集合的詞彙 1, 如果意見詞w前面兩個詞中沒有包含副詞集合的詞彙 N

β = J −0.4, 如果意見詞w前面三個詞中有包含否定詞集合的詞彙 1, 如果意見詞w前面三個詞中沒有包含否定詞集合的詞彙

N

我們考慮意見詞所位處的小句及轉折語。意見詞所處的小句位置,在整個評 論意見詞位於在開頭或結尾的句子中,通常會比中間句子有重要性,更能表達整 個評論的意見方向,所以我們對位在開頭或結尾的意見詞給予較大的權重,評論 中開頭、結尾的句子定義為評論前面兩小句及後面兩小句,權重值設為λ,如果 句子位置不是位在開頭或結尾,則權重λ預設值為 1。

在轉折語方面,我們收集開頭含有這些轉折語的句子,例如:含有假設語氣 的詞彙等,如表 28 所示,定義為轉折語集合。[林宇中,2003]論文中,提出含 有這類轉折語的句子通常不是整個評論所要主要表達的語意,而 Narayanan et al.

[2009]也探討著轉折語對意見的影響。例子:“雖然這部電影演員都不是巨星,但 整部電影很棒!”。實際上訴的評論主要表達的語意是“電影很棒”,而不是“演員 都不是巨星”這句話。在意見詞小句中如果含有這類轉折語,則給予這意見詞較

31

小的權重,權重值設為γ,如果句子中沒有這些轉折語,則權重γ預測值為 1。

表 28:轉折語列表

縱使 原本 假設 否則 要不 要不然

儘管 不然 縱 雖然 雖 縱然

如果 假設 想說 以為 本來

我們計算整個評論的分數如公式 8,假設一個評論內有 n 個意見詞,每個意

我們計算整個評論的分數如公式 8,假設一個評論內有 n 個意見詞,每個意

相關文件