第二章 文獻探討
第三節 心理動詞及愛類情感詞語的相關研究
本節主要討論心理動詞和情感的議題研究,一類屬於情感分析的主題,
和情感詞典相關,但用在語言學討論得少,以語用或社會議題討論為主;一 類則根據語料提出心理動詞(恐懼類動詞)的情感詞語強弱程度的排序。
一、心理動詞的相關研究
(一) 情感詞典(sentiment dictionary)及情感分析(sentiment analysis)
近來情感詞典的研究興起,並同時帶動情感分析的議題。與情感詞典相 關 的 工 具 , 一 是 詞 網 ( 俞 士 汶 等 , 2003 ) 或 廣 義 知 網 ( HowNet- ehownet.iis.sinica.edu.tw),二是台灣大學中文通用情感詞典 (NTUSD- http:
//www.datatang.com/data/43460),前者從詞語的角度進行解釋或分類,後 者情感詞典也包括程度副詞的詞語集,表示這類的詞語已經注意到情感強弱
的差異性。主要功能是根據詞語直接訂出褒貶評價,然後擷取各篇章裡的情 感詞語,再依據情感詞典的詞語正負向歸類分析,此法常用來作為文本分析 及機器翻譯使用,類別很簡單,直接把情感詞語以正向(positive)、負向
(negative)和中性(neutral)分類,利用詞語的類別,進行情感分析,但 由於分類只有三種,又礙於機器目前的功能還是和人類的認知距離太遠,分 析上並不符合人類的情緒習慣,因此各家研究無論寫出多少程式,能真正顯 示人類情緒的結果總是有限,只能作為參酌輔助的工具。
情感詞典帶動了情感分析(sentiment analysis)的研究,研究的方式是 截取文本的文字,相關的主題包括:分析詞彙、語意及句法特性等來決定句 子、文章甚至文本的情感或主觀訊息(subjective information)(Devitt &
Ahmad, 2007)、或測試受試者的情緒反應(Wilson, Wiebe & Hoffmann, 2009),
或利用英語詞網(WordNet)的近義詞組測試情感向度(Esuli & Sebastiane, 2006)。
中文方面的情感分析研究目前用於電影評論的喜惡判定(張莊平,
2011)、財經領域詞典的判斷(林宜萱,2013)、臉書粉絲的專業討論(謝 佩庭,2014)、牛肉麵的評價(徐筱雁,2014),上述研究都得到肯定的結 論,但所使用的詞典都面臨同樣的問題,除了翻譯的詞語及詞類不一致,全 部混和討論,判別時直接以該詞語的字面上語義做為正、負向的判別標準。
陳立(2010)曾提出情感詞語應納入觀察程度副詞及否定詞的使用,因 為此類詞語彙左右句子意見的情緒程度,例如「非常、十分、最」等詞,已 經開始注意到了情感強度(emotion intensity) 分類的雛型。李啟菁(2010)
注意到單就詞語正負向的分類過於武斷,遂以情感詞語的前後四個字的程度 副詞做為意見的修正,如「這碗非常不可口超難吃牛肉麵。」,「可口」屬 於正向詞語,但這個句子明顯屬於負面的評價;蔡偉棋(2011)把程度副詞 的強度分類,如很好吃(1*1.5)、不好吃(1*(-1))、很不好吃(1*1.5*
(-1))、不很好吃(1*1.5*0.5),最後一類使用(0.5)的判斷是因為「不」
沒有直接影響極性,卻削弱強度,以數字將程度強弱分類,以表示強弱的概 念,上述研究主要印證 Draght & Fellbaum(2014)的說法,該文提出副詞 本身並不帶正負向情緒,但會因詞語及語境而強化其所修飾的詞語。
以上分析都建立在詞語具有正負向度的預設上,這類的研究,對於某些 詞語確實如此,如英文的 enjoy(享受:正向)、pencil(鉛筆:中性)、pain
(痛苦:負向),因為都具有明顯的情緒標籤,易於標示,但並非所有的詞 語都如此,例如前述的程度副詞 very、fairly,詞語的本身沒有太多正反情 緒的隱含,只能作為強化的功能指標。
使用公式判定情緒還有一個未能解決的問題,造成判斷上的困擾,即詞 語的正負向會受到領域的不同而失準,同一個詞語在不同的領域會轉換正負 向,舉例而言,一般判定為負向的詞語,如「刺激」一詞,放在電影評論的 語境,卻被視為正向的詞語;如英語「指紋」(fingerprint)一詞在犯罪的 語境裡屬於正向詞語,因為案情可能有所突破(breakthrough),換到了智 慧 型 手 機 的 語 境 卻 成 了 令 人 頭 痛 的 問 題 ( http : //uk.businessinsider.com/android-phones-fingerprint-scanners-have-serious-secu rity-vulnerabilities-2015-8),因為以指紋辨識的手機防護系統並不安全,駭 客從遠端即可竊取使用者資料,進而盜取手機使用者的出入境資料、銀行資 料訊息,換言之,「指紋」一詞在手機的語境中,恰好是個負面詞語。
上述詞語的預設會影響結果,如 Esuli & Sebastiane(2006)利用英語詞 網 WordNet 的近義詞組測試情感向度,Wilson et al.(2005)則測試作者的 情緒,但這些分析都建立在詞語具有正負向度的預設上,測試出來的結果符 合只能代表在特定的語境也許成立,也就是領域的不同會影響詞語的判斷。
同時 Draght & Fellbaum(2014)就提出並非每個詞語都符合正負向的假設,
該研究認為情感分析也和共現詞(collocation)、修飾語(modifier)相關,
這種說法比較符合一般語言使用的現象,換言之,正負向的概念,還必須涉 及了語境(或稱專業領域)的判斷。另一方面,一般無法從單詞斷定情緒的 正負向和強弱程度,以「愛」字為例,如肯定程度副詞「很 + 愛」,否定 副詞如「不 + 愛」,或者雙重否定,如「不是不愛」,或者肯定加否定詞
「不很愛」的說法,表達情感十分多元,至少還有深有淺、有強有弱,應該 有更細緻的分析才能趨近人類情感的真正表達方式。
就語言學的角度而言,詞網缺乏較細膩的分析和論述(鄭錦全,2010b),
而情感詞典與程度副詞的編纂,涉略的分析討論也僅止於是否符合正負向類
別,相對於人類情感的表達而言,情緒不會只有正負向的極端化,如此方式 顯得過於粗糙。鄭錦全認為詞網語義分類屬於表層,情感方面的語言表達必 須進入分析和論述,才真正合乎語言使用的目的;Polanyi & Zaenen (2006)
便舉例表示詞語無法直接以正負向代替,詞語的正負向還必須考慮三個層面,
一是共現的詞語(the presence of other lexical items),其次是文本的類別及 篇章的結構(thegenre type and discourse structure of the text),最後是文化 因素(cultural factors)。由於漢語經常受到上下文語境的影響,甚至是程度
astonish < surprise < amaze < astound < strike < stun < floor
< dumbfound < flabbergast < stupefy 恐懼類
fear verbs
intimidate < scare < frighten < alarm < terrify
困擾類 annoy verbs
irk < nettle < irritate < annoy < anger < exasperate
< infuriate < enrage < incense
該文提出近義詞群 間應具有相似的詞 彙語義模式 (lexical-semantic
(Y)” 便是上位詞。此模式仿效英語詞網 WordNet(Miller, 1988)設立時 所採用的「概念-語義關係」(conceptual-semantic relations),該文認為有 了固定的模式便容易尋找語料 (Snow et al., 2006),並適合擷取大量資料
(Hearst, 1992;Fellbaum, 1990;Chklovski & Pantel, 2004)。類似上述的模 式曾於第一節的等級差異提過程度副詞的研究模式,如 K. Miller(1988)、
Horn(1989)、Sheinman et al.(2013)和 Schulam & Fellbaum(2010),
本節則專論情感詞語研究。Fellbaum & Mathieu(2014)以 fear(恐懼類)
動詞的近義詞群論,先行依直覺排序強度差異如下:
intimidate < scare < frighten < alarm < terrify
作者說明將 terrify 按排序在動詞最右邊,但表示 terrify 不是恐懼的最強
作者進一步利用該模式搜尋網路語料,以兩兩比對的方式查詢恐懼類動 詞,結果顯示,兩兩比對下總有一個動詞的情感強度高於另一個動詞,同一 類的情感類別,同時具有等級特徵(scalar quality),下列是搜尋語料的前 後動詞比較排序。
表 二-8 英語恐懼類近義動詞語料搜尋前後之對比 intimidate < scare < frighten < alarm < terrify (搜尋前)
intimidate < alarm < scare < frighten < panic < terrify (搜尋後)
上述以詞彙語義模式搜尋語料後,比原來人工排序的動詞多了一個動詞 panic,順序同時也改變,結果說明直覺的語感可能比實際使用上有落差。
作者也提出一些問題,如 panic 的句法和其他動詞不同,其他動詞屬於及物 動詞,但 panic 經常以不及物動詞的型態出現,而且 panic 以名詞出現的頻 率比當動詞來得高,諸如此類的問題,都會在類似的研究上出現而難以斷定 排序。
除了上述英語類,和漢語情感詞語相關的論述中,主要參考的文獻是蔡 美智等(1999)、Chang et al.(2000)及黃居仁(2009)的論述。蔡美智等
(1999)利用語意、語法、及「平衡語料庫」觀察情感詞語「高興、快樂」、
「難過、痛苦」的近義詞組,主要是從句法的分析中,利用詞頻的比例分布,
觀察各詞語的語法行為。作者從語料庫中抽取用例,觀察句法的不同結構,
其中「高興、快樂、難過、痛苦」在語料庫的詞頻分別有 280 筆、365 筆、
83 筆及 185 筆。以「高興、快樂」為例,其中「高興」做為謂語的分布,
在 280 筆共有 224 筆(80%),而作為補語只有 8 筆(3%)、名物化 1 筆
(0.3%),兩者的比例非常低。相對下,「快樂」作為定語 119 筆(32%)
和名物化 83 筆(23%),對照下,「快樂」作為定語和名物化的比例較「高 興」高出許多,如下表 二-9,括弧中的數字表語料庫中的詞頻及比例。
表 二-9「高興、快樂、難過、痛苦」的句法功能分佈
表 二-11 七種情緒在語料庫中的分布
2003;Hanks, 1996)。雖然語言不同,但以漢語而言,近義詞語彼此語義 靠近,使用不同的詞語,確實也表示細微處的差異,否則近義詞語也無存在 必要,就此點而言,或可表示不同語言間的共性。
從上述針對情緒詞語的討論,可以得出一些應用的結論,蔡美智等人研 究的詞語「高興、快樂、難過、痛苦」是一組近義詞或反義詞的對照組,研 究著重的部分在不同的句法行為或結構;Chang et al. 與黃居仁則進一步比 較了不同的情緒詞詞群,而且進入了漢語的特殊構詞結構比較,此為英語研 究近義詞時,因為不具構詞結構而無法延伸的特點。因此,依據前述的研究 方向,本研究以情感詞語「愛」字的近義詞群為主題,同時利用語料比較句 法行為、構詞結構,也試圖提出近義詞群間是否具有情感強弱的排序可能 性。
二、漢語愛類詞語相關研究
漢語「愛」字的詞性,有三個演變的過程,首先,「愛」被趙元任(1994)
列為性質動詞與助動詞;接著,許世瑛(1954)將「愛」分入動詞類中的精 神行為一類(另一類為事件);最後一個說法,則是呂叔湘(1974)的說法,
列為性質動詞與助動詞;接著,許世瑛(1954)將「愛」分入動詞類中的精 神行為一類(另一類為事件);最後一個說法,則是呂叔湘(1974)的說法,