以情緒為中心之情境資訊觀察與評估
劉吉軒、吳建良 國立政治大學資訊科學系
摘要
情境感知計算必須具備一個完善的情 境資訊模型,以做為情境運算的知識基 礎。情境資訊模型發展的最大困難之一,
在於缺乏一個有效的情境資訊來源,同時 也無法自動取得情境資訊的種類及彼此的 關聯。本研究以情緒為情境資訊之焦點,
嘗試從大量文本中建立人的情緒與事物概 念之關聯性,並以問卷調查驗證其關聯是 否符合一般之情緒感受認知。我們以情緒 詞與特定詞性之字詞為節點,將文本轉換 為網路結構,同時,提出四種節點關聯指 標,以評估特定情緒節點與相關事物概念 節點之關聯強弱。實驗結果顯示,本研究 方法能有效的從文本中取得影響人的情緒 之事物概念之相關資訊。
關鍵詞:情境感知計算、情緒、情境資訊 一、序論
電腦的功能發展一直以能滿足人的需 求為目的,協助我們進行各種資訊的處 理,提供各種工作上及生活上的服務,幫 助我們解決問題,甚至開創各種前所未有 的應用。前瞻性的研究指出,人與電腦之 間的互動方式,將從使用者操作式的直接 控制,進展為電腦體貼式的主動服務。這 種人機互動能力必須以對使用者的需求、
行為模式、環境等面向的掌握為基礎,才 能適時的、準確的推論使用者在當下場景 所需的功能與服務,進而提供讓使用者感 到貼心及滿意的過程與結果。情境感知計 算(context aware computing)是近幾年興起
的研究領域,其目的即在掌握使用者問題 之情境,提供適切之服務,滿足其真正之 需求。
許多研究都指出,情境的概念還缺乏 一個清楚而明確的具體定義,很大的原因 是情境的概念橫跨了許多不同的領域,包 括哲學、心理學、語言學、語用學、電腦 科學、及人工智慧等,而各領域到目前為 止都還無法發展出一個通用的、統一的、
正式的情境模型。在電腦科學領域中,情 境的定義大致可以分為三類。第一類是以 應 用 (applications) 為 情 境 的 焦 點 , 例 如 Moran & Dourish [12]定義情境為計算裝 置被包覆的物理與社會狀況,而 Chen &
Kotz [5]定義情境為決定應用行為或關係 使用者的應用事件之相關狀態與設定。第 二類是以使用者(users)為情境的焦點,例 如 Dey, Abowd, and Wood [8]定義情境為 使用者的物理、社會、情緒、及資訊狀態。
第三類是以事物(entity)為情境的焦點,例 如 Schmidt [13]定義情境為與應用、使用 者、或裝置有關的事實資訊。到目前為止,
最詳盡而複雜的情境模型大概是 Bradley
& Dunlop [4]嘗試結合各個領域的情境定 義,而將情境區分為工作任務的情境、物 理環境的情境、社會關係的情境、時間的 情境、使用者認知的情境、及應用的情境 等。然而其模型仍是以概念性為主,著重 於觀念的建立、分類、對應、與描述,尚 無法轉換為實質的運作機制。
情境感知計算的進一步發展至少面臨 著兩個問題,第一個問題是目前研究中情 境資訊的少量而薄弱。情境的構成除了時 與地之外,還有許多的面向,例如人、事、
物等,而每一個情境建構的面向又可以展
開出更多的變數。例如在人的面向中,除 了使用者的身份之外,還有性別、年齡、
喜好、工作、甚至情緒等因素。在所有可 能的情境變數所構成的空間中,目前許多 情境計算研究所考慮的情境資訊可以說只 佔了很小很小的比例。第二個問題是情境 變數與應用目的之間的關連。當情境變數 有什麼樣的狀態時,應該提供什麼樣的適 當資訊、功能、或服務。例如,在下午三 點時提供的餐飲服務資訊以下午茶或輕食 為主,而在夜間十點以後提供的餐飲服務 以宵夜為主。這些情境狀態與系統輸出之 間的對應關係,目前只能依賴系統發展者 個別的設計。這種特製式(ad hoc)的方法只 能處理少量的情境狀態的對應關係,如果 我們要考慮更多的情境面向與變數,就必 須具備更通用的、更有結構性的、更有邏 輯性的關連建立方式。這兩個問題都根基 於缺乏一個良好而完整的情境資訊模型,
造成目前情境變數的使用受到相當的限制 並且顯得零散,同時,情境狀態與系統回 應的關連也只能仰賴薄弱的人為設計,而 無法達成以強健的結構性質與關係為依據 的自動引導與啟動。
情境資訊模型發展的最大困難之一,
在於缺乏一個有效的情境資訊來源,同時 也無法自動取得情境資訊的種類及彼此的 關聯。目前大部分的研究是以應用目的之 需求做有限的考量,其來源是發展者的主 觀想像,並且是以人工的方式做單一目的 及有限範圍的建構,在通用性與延伸性上 有明顯的不足。情境資訊既然是以人事時 地物為主的資訊,其來源除了個人本身的 經驗之外,更多人的經驗,甚至從過去到 現在的全體人類的認知經驗,都可以是情 境資訊來源。事實上,這些廣泛的、長期 的認知經驗除了存在於人心中之外,也被 記錄於大量的各種文字描述中,包括文 章、故事、報導、日記等。因此,我們認 為各式各樣的文件可以被利用為情境資訊 的有效來源,提供各種應用目的所需的情 境資訊種類及其相關概念之連結關係,同 時,也兼具範圍大小可依應用目的所需而 彈性調整或擴充之優點。
本研究將聚焦於情緒為中心的情境資 訊,希望從大量文本中取得事物概念與特 定情緒之關聯性。我們於第二節探討情境 模型及情緒與文本之相關研究,第三節提 出文本中之情緒與情境資訊關聯建構方 式,並設計四個關聯強度指標,以評估特 定情緒與相關事物概念之關聯強弱。於第 四節中,我們以問卷調查的方式驗證情緒 之情境資訊是否符合一般人之情緒感受認 知,並進行實驗結果之說明與分析。最後,
我們於第五節總結研究成果,並規劃未來 之研究方向。
二、相關研究
在情境模型的建構方面,Chen 等人[6]
提出以本體知識(ontology)為情境感知系 統之實質運作機制,其推論基礎包括:(1) 共同的本體知識可以讓不同的系統達成知 識分享;(2)具有清楚的語意定義的本體知 識可以讓系統對於情境資訊進行推理;(3) 明確表示的本體知識可以讓原先未設計一 起運作的系統與裝置有機會達成不預期的 合作。不同系統可能有個別的本體知識,
再由本體知識仲介者(ontology broker)的 協助,進行情境的轉換與傳遞。然而,不 論是本體知識的實際建構或是情境的轉換 依據,仍然必須依賴人工設計與建置。本 研究從文本中獲取情境資訊與關聯性,可 以做為情境本體知識之內容建置來源。
在語言文本與情緒面向之研究上,林 宇中[2]提出了針對文本內容之情緒分類 系統,其作法大致為先定義表達特定語意 的語意標籤,再以語意標籤為中心,擷取 文句中其他非語意標籤定義的詞。運用資 料探勘技術,自動產生出情緒規則,並以 SVM 分類技術訓練出一套文本內容之情 緒分類模組。Liu 等人[10]以文字與生活常 識(Open Mind Common Sense Corpus [15]) 為基礎,建立一個判斷文句情緒之機制,
並設計出一個電子郵件介面,根據郵件內 容中的每一句話,賦予一個對應的臉部情 緒圖案,藉以增進使用者之間訊息之趣味 性。Ma 等人[11]針對即時的對話訊息,以
情意詞(affective word)及其對應的情緒向 量 為 基 礎 , 提 出 進 階 的 關 鍵 字 查 找 (keyword spotting)技術,並採用文法進行 情緒意義之偵測,最後利用動畫人物顯示 情緒判斷結果。本研究同樣是關注於文本 中之情緒資訊,但以取得文本內容中所描 述的情緒與特定事物概念的關聯性資訊為 目的。
三、情緒與情境資訊之關聯建構 情緒是人對自身狀態的心理反應,對 週邊環境、事件、行為、物體的經驗及其 影響的一種自然而直接的感受,如快樂、
喜悅、憤怒、害怕、悲傷等。大部分人對 特定事物的情緒反應有相當程度的共通 性,例如對食物、音樂的反應是喜悅,對 戰爭的反應是害怕。長久以來,語言就是 用來表達人的經驗與感受的重要工具,許 多事物與人的情緒反應之間的因果關係存 在於大量的文本當中。因此,如果我們建 立有效獲取這些資訊的方法,就能以大量 文本為情境感知計算所需的人與週遭環境 的關連,提供可依賴的及完整的資訊來源。
過去計算語言學相關研究中,對於字 詞資訊的分析探討,曾經基於網路結構的 通用性與彈性,採取了不同類別的網路模 型,以表示文本中的字詞現象,例如共現 網 路 (co-occurrence network) 、 語 法 網 路 (syntactic network) 、 語 意 網 路 (semantic network)等。本研究的目的為掌握文本中 所呈現的情緒詞與各種事物概念詞之間的 聯結關係,所以我們採用共現網路模型,
以情緒詞及事物概念詞為節點,將設定文 本範圍內共同出現的詞語,以節點之間的 連結來表示其關連。我們將與人的情緒相 關之情境定義為:「與各種特定情緒具有較 強關連之事物概念集合。」因此,我們將 文本中與情緒相關的描述,表示成情緒與 事物概念之共現網路,再從此共現網路的 內容中,得到與特定情緒相關的情境資訊。
(一) 情緒情境共現網路
情緒情境共現網路的最主要特性為記 錄文本中哪些情緒字詞與哪些事物概念字 詞在設定範圍內一同出現過,而文本中其 他的無關字詞及較深入的語法語意關係則 予與忽略。情緒詞是一個表達具體情緒感 受的字詞集合,我們以高臺茜與倪珮晶研 究中[3]對二千多個中文情緒字詞的整理 為基礎,挑選其中較常見的 58 個為我們的 情緒字詞集合,分別屬於憤怒、害怕、悲 傷、愛與喜悅等四大類。在事物概念字詞 方面,我們以詞性為主要的篩選依據。中 研院詞庫小組將中文詞分為八種詞類:體 詞(N)、述詞(V)、副詞(D)、非謂形容詞 (A)、介詞(P)、連接詞(C)、語助詞(T)與感 嘆詞(I)。體詞包含了名詞(例如:物品、時 間、地點等)、定詞(例如:這個、其他、
一些等)、量詞(例如:一「本」書、三「根」
棍子等)、代名詞、方位詞等。述詞包含動 作詞(例如:走、使用、跑等)、狀態詞(例 如:高大、開心、擅長等)以及其他有明確 訊息卻無主體的詞。其他詞性的字詞大多 為修飾、連接、表達語氣或態度的功能,
和體詞與述詞相較之下,不具特別具體的 意義。因此,我們選擇以體詞與述詞兩種 詞性篩選出事物概念的字詞集合,希望能 夠代表某件事情、某物體或是行為動作 等。另外,我們以一個子句為情緒詞與事 物概念詞共同出現的觀察範圍。
我們定義情緒情境共現網路建構演算 法如下:
Step1. 將文本中含有情緒詞的文句取出。
Step2. 保留情緒詞與詞性為體詞與述詞 的字詞,刪除其他字詞。
Step3. 依照每一文句中的共現關係,以情 緒詞節點為中心,向前後的字詞節點進行 連結。網路中的連結關係不重覆建立。
假設經過斷詞與標註詞性後的文本中 有三句含有情緒詞的文句:a1(N) b1(V) C(e)
d
1(N),a2(N) p1(N) d1(N) C(e) y1(V) b2(N),p
1(N) E(e) a1(N),其中(N)、(V)、(e)代表體 詞、述詞、情緒詞。圖一顯示由這三個文 句所建構出的情緒情境初階共現網路,灰 底為情緒詞節點,白底為事物概念字詞節
點。在初階共現網路中,只要是不同的字 詞就會以一個節點來代表。因此,當文本 的量增加時,初階共現網路的大小也隨之 成長,而每個節點所代表的字詞在文本中 重複出現的次數也不高。為了解決這些問 題,我們依據中研院「中文一詞泛讀」[1]
中的語料資源,取得一般字詞之上的第一 層上位詞,將上位詞相同的同義詞合併為 單一節點,形成情緒情境概念共現網路。
在語料資源中無法取得上位詞的字詞如人 名、團體名等,則歸類為未知詞而不予納 入。
圖一:情緒情境初階共現網路
圖二:情緒情境概念共現網路 圖二顯示由圖一的情緒情境初階共現 網路進一步建置的情緒情境概念共現網 路,其中 a1、 a2 的上位詞為 A,b1、b2
的上位詞為 B,d1的上位詞為 D,p1的上 位詞為 P,y1的上位詞為 Y。
(二) 關聯性指標
情緒情境概念共現網路雖然表示了特 定情緒與特定事物概念之間的連結關係,
但是對於這些連結關係的差異則缺乏進一 步的區分。為了能有效的評估情緒詞與事 物概念之間的關聯強弱,我們使用三種指 標,分別為:距離強度、相互訊息、概念 變異,再將前三種指標合併為第四個綜合 指標。
1. 距離強度
在中文的使用方式中,通常兩個字詞 在文句中的距離越接近,則可被視為彼此 在意義連結上的關係越密切。距離強度指 標就是嘗試反應這樣的一般性認知。我們 不希望事物概念詞與情緒詞之間的距離受 到文句中一些較無具體意義的詞穿插影 響,所以,我們以詞性(體詞與述詞)及情 緒詞篩選簡化後的文句,計算事物概念詞 與情緒詞之間的平均距離。若以圖一所示 的三個文句為範例,事物概念 A 與情緒詞 C 的平均距離為(2+3)/2 = 2.5,而事物概念 A 與情緒詞 E 的平均距離則為 1。
eq. (1):
D(X, E) = Σ freq(xk, ek) / Σ | l(xk) – l(ek) | 距離強度做為關聯性指標之一是希望 反應文本中出現的字詞之間的密切程度,
指標數值的大小直接對應為關聯性的強 弱。因此,我們取平均距離的倒數為距離 強度。公式一表示事物概念詞 X 與情緒詞 E 之間的距離強度 D,其中Σ freq(xk, ek)為 文本中 X 與 E 共同出現的次數,l(xk)及 l(ek) 為個別事物字詞 xk及情緒詞 ek在某一個文 句中出現的位置。
2. 相互訊息
相 互 訊 息 為 計 算 語 言 學 文 獻 中 常 見 的 mutual information[7],其目的為評估兩個 字詞在設定範圍內被連同一起使用的情 形,其計算方式為比較兩個字詞在文本中 共同出現的機率相較於其個別單獨出現 的機率。在此,我們可以使用為事物概念 字詞與情緒詞一同出現在一個文句中的 情形,而推測此事物概念與特定情緒之間 E p1
C a1
d1
y1
b1
a2
b2
E P
C A
B D
Y
的關聯強弱。
eq. (2):
M(X, E) = log (P(X, E)/P(X)P(E))
= log [(Σ freq(xk, ek)/T) / (Σ freq(xk)/T) (Σ freq(ek)/T)]
其中,freq(xk)為事物字詞 xk在文本中 出現的次數,freq(ek)為情緒字詞 ek在文本 中出現的次數,freq(xk, ek)為 xk與 ek同時 在一個文句中出現的次數,Σ為對同屬一 個概念上位詞 X 的 xk加總及對同屬一個情 緒類別 E 的 ek加總,最後,T 為文本中所 有體詞、述詞與情緒詞出現之總次數。
3. 概念變異
由於我們將體詞、述詞與情緒詞之間 的關聯提升到其上位詞的概念層次進行 觀察,同一個概念中的不同字詞與特定情 緒的連結廣度可能也反應了該概念與特 定情緒之間的關聯強度。以圖三為例,{x1, x2, x3, x4, x5}為事物概念 X 的同義詞,並分 別與情緒概念 E1與 E2相關,其中,E1只 與 x1, x2共同出現,而 E2則分別與 x2, x3, x4, x5共同出現,這種差異可能代表 X 與 E2 的關係較密切。
圖三:概念關聯之差異
概念變異之目的為評估某一個事物概 念與特定情緒之間經由不同的同義詞的連 結情形,希望能反應連結廣度對關聯強弱 的影響。我們設計的概念變異計算公式為:
eq. (3) :
V(X, E) = | (xk and ek) | / | X | + Σ freq(xk, ek) / Σ freq(ek) + log | (xk and ek) |
其中,| (xk and ek) |為 X 概念中與特定 情緒 E 共同出現於文句中的不同同義字個 數,而| X |為 X 概念在文本中出現過的不 同同義字個數。公式中的第二個分項與第 三個分項為對同義字較多且連結較廣的事 物概念之強度補償。
4. 綜合指標
不論是距離強度、相互訊息或是概念 變異,對特定事物概念與特定情緒之間的 關聯情形,在觀察角度與評估效能上皆有 其侷限性,因此,我們也提出了一個將這 三個指標簡單加總的綜合指標,希望能兼 顧不同的連結觀察角度。為了因應各個指 標在數值變化範圍上的差異,我們先將各 指標的數值進行線性正規化,調整為介於 0 到 1 之間後,再行加總。綜合指標之計 算公式為:
eq.(4):
C(X, E) = N(D(X, E)) + N(M(X, E)) + N(V(X, E))
其中,N( )代表個別指標數值之線性 正規,調整方式為實際數值與最小數值之 差除以最大數值與最小數值之差。
(三) 關聯強弱之排序分群
透過這些關聯性指標,特定事物概念 與不同情緒之間或特定情緒與不同事物概 念之間的關聯強弱程度,可以得到數值化 的評量與區辨。然而關聯程度經過指標公 式所計算出的數值,尤其當差距不顯著 時,其線性排序之個別名次來反應關聯強 度上之差異,並不是特別的有意義。例如,
與快樂情緒有關的事物概念中,經由特定 指標的數值計算得到的大小排序中,第五 名與第七名的數值差異也許在 0.0001 以 內。因此,關聯程度之間的線性排序並不 是特別明確的反應我們對事物概念與情緒 之間關聯程度區辨的需求。大部分時候,
我們需要的是程度等級的區辨,例如,將 與快樂情緒有關的事物概念之關聯程度區 分為五種或三種的強弱程度等級,在相同 程度等級中個別事物概念的關聯強度大致 上是相似的。因此,我們需要的是分群的
E
1E
2x
1x
2x
3x
4x
5X
概念,而在分群的做法上,不論是以關聯 對象的數目或是以數值大小來平均區分,
都不是合適的方法,只有以指標數值的相 似度來區分較為恰當。如圖四所示,某一 個指標所計算得到的 15 個概念關聯程度 數值分布於 0 與 1 之間(圖四上),以數值 相似度分群的方式(圖四下)顯然較以平均 每五個為一群的方式(圖四中)為恰當。
圖四:關聯強度之等級分群 我們以統計學上常用的 K-means 為分 群的方法,其主要過程為把 n 個物件分為 k 個叢集(cluster),以使叢集內具有較高的 相似度,而叢集間的相似度較低。相似度 的評估是根據一個叢集中所有物件的平均 值(也可以稱之為叢集的重心)來計算。在 實際運算上,我們直接採用 Weka[17]提供 的 K-means 軟體工具。
四、實驗設計與結果分析 本研究之基本想法為從大量文本中取 得與情緒相關的事物概念關聯性,並以此 建構出特定情緒初略之情境資訊,做為後 續相關情境計算應用之依據。我們將情緒 與事物概念之關聯性以網路結構表示,並 提出四種關聯強度指標,評估情緒節點與 事物概念節點間之關聯強弱,以滿足情境 計算應用相關選項在情緒考量下之選擇與 區辨需求。因此,我們的實驗目的為:(1) 驗證從大量文本中取得情緒與事物概念關 聯性資訊之過程與可行性;(2)驗證關聯強 度指標之作用與效能。
(一) 實驗資料
我們採用中研院「現代漢語平衡語料
庫」3.1 版為大量文本的來源,該語料庫涵 蓋文學、生活、社會、科學、哲學、藝術 等不同主題之各類文章,共有約五百萬 詞,廣泛而且具代表性,因此,適合用來 探討情緒與情境之關聯資訊。我們以語料 庫中文章內容之文句結構與字詞切割及詞 性標註為後續處理之依據。
在情緒詞的部分,我們依據高臺茜與 倪珮晶[3]對網路言論之情緒詞研究,做為 情緒詞庫之來源。高與倪的研究將情緒詞 分類為憤怒、害怕、悲傷、同情、愛與喜 悅以及謾罵等六類,共收集 2378 個情緒字 詞。我們選用其中的憤怒、害怕、悲傷、
愛與喜悅等四類較為核心的情緒,同時將
「現代漢語平衡語料庫」中沒有出現或出 現次數很少的情緒字詞刪除,最後獲得採 用的情緒字詞共有 58 個,如表一。
表一:本研究採用之情緒類別與字詞
類別 情緒字詞
憤怒 憤怒、生氣、激憤、惱怒、氣沖沖、氣
惱、惱火、動怒、憤激、悻悻、憤憤然
害怕 害怕、恐怖、恐懼、畏懼、生怕、惶恐、
驚恐、惶惶、戒懼、疑懼、驚訝、驚異
悲傷 痛苦、難過、傷心、悲傷、痛心、悲哀、
難受、傷感、悲痛、悲苦、淒然、傷悲、
愴然、哀痛、悲愁 愛與
喜悅
喜歡、快樂、高興、愉快、歡樂、喜悅、
歡喜、快活、慶幸、興高采烈、愉悅、
歡欣、欣喜、興沖沖、歡愉、歡天喜地、
喜出望外、心花怒放、樂不可支、狂喜、
滿面春風、樂呵呵
由於本研究在以網路結構表示關聯資 訊的部分,區分為字詞階層與概念階層,
並且是以概念階層為關聯性之計算對象,
因此,除了文本資源之外,本研究也需要 一般字詞及其第一層上位詞之語料概念資 源,這一部分我們採用中研院「中文一詞 泛讀」[1]中的語料資源。
(二) 實驗過程與方法
我們首先從語料庫中剔除不含任何 58 個情緒字詞之一的文句,剩下的文句共
0 低 中 高 1
0 1低 中 高
0 1
有 7853 句。這些文句再經過詞類的篩選,
成為由體詞、述詞、情緒詞等字詞組成的 精簡文句,其中最短的長度為 2,即一個 情緒詞與一個事物概念字詞的組合,如「傷 心 哭」,最長的長度為 21,整體平均長 度為 4.13,代表平均一個精簡文句大致上 包含一個情緒詞與三個事物概念字詞。
我們接著以這些精簡文句中情緒詞與 事物概念字詞的共同出現關係,建構出情 緒情境初階共現網路,此網路共有 26269 個事物概念字詞節點與 58 個情緒字詞節 點互相連結。這個初階共現網路再被依照 一般字詞的上位詞及情緒詞的類別提升至 情緒情境概念共現網路,其中 1252 個一般 事物概念字詞(如專有名詞)節點沒有上位 詞的資訊,無法被提升至概念層而被歸類 為未知詞並與予捨棄。最後的情緒情境概 念共現網路共有 9192 個一般事物概念節 點及 4 個情緒類別節點。
經由這些實作過程,我們基本上驗證 了從大量文本中篩選出情緒與事物概念關 聯資訊之可行性,這些關聯資訊以共現網 路的方式表示,提供進一步探索與取用。
我們接下來針對共現網路中的關聯資訊經 過四種關聯強度指標的區分之後,是否與 一般人的情緒認知相符,進行觀察與驗 證。我們首先必須決定情緒反應評估方式。
情緒研究在心理學領域的發展相當長 久,評估情緒的方法通常有兩類,一類為 客觀評估,是以一些生理訊號指標,如心 跳、血壓、腦電波等,作為情緒辨識的依 據;另一類為主觀評估,通常也稱為「主 觀自我評估報告」,也就是由受測者本身 告知其經過某種刺激所引起的情緒為何。
Selye 的研究[14]發現,許多情緒的生理反 應是相似的,很難從生理訊號的細微差異 來辨別目前的情緒,同時,受測者的生理 訊號必須依靠一些昂貴的接觸式量測設備 取得,部分受測者在知道有儀器觀察的情 形下,也會產生心理層面的變化,而影響 了觀測的準確性。
主觀評估的情緒測量方式通常都以問 卷型態進行,然而情緒是一種相當主觀的
認知,受到個人過往歷史與經驗的影響,
因此,情緒主觀評估的準確性也受到質 疑。不過一些研究[9][16]發現,主觀自我 評估報告的方式仍然具有相當程度的準確 性,甚至過個幾年對不同人在進行同樣的 測試,其結果仍是相當類似,代表主觀評 估的穩定性也相當充分。心理學領域的專 家經過長時間的驗證比較之後,仍然信賴 主觀評估的方式,因此,本研究採用主觀 評估方式進行關聯強度指標的效能驗證。
情緒感知的主觀評估主要是以問卷調 查方式進行,而問卷內容則是以問題與選 項的方式,針對特定情緒與事物概念之關 聯性,取得受測者的主觀認知回應。本實 驗的主要目的是驗證經由關聯強度指標所 反應之情緒與事物概念關聯性與受測者認 知之符合程度,並比較分析四種指標之成 效差異。在問卷內容設計方面,我們選擇 害怕與高興兩種情緒,同時,將關聯性之 等級區分為高、中、低三個等級,分別以 一個問題針對特定情緒搭配一組某個關聯 等級之事物概念選項,由受測者依其認知 情形反應其主觀之選擇。因此,我們初步 的問卷內容包含二個情緒、四個指標、三 個等級共二十四種組合,亦即二十四個測 試題目。每一個題目針對一個情緒,經由 一個關聯指標,選定一個關聯等級的二十 個事物概念為選項,供受測者依其主觀認 知選擇哪些事物概念與該題之情緒有明顯 關聯。
我們將初步規劃的問卷內容,由約十 位研究生進行前測,其目的在於檢測問卷 內容的設計是否有矛盾與錯誤之處,受測 者在受測過程中,是否有任何疑惑與困 難,並據以修正問卷內容。前測受測者做 完問卷後的反應與建議及我們本身的評估 所綜合的問題包括:(1)題目數量過多;(2) 選項重複率過高;(3)應避免爭議性感受之 概念選項,如宗教信仰與政治。這些問題 的存在的確可能影響實驗的準確性,例 如:不同關聯指標可能選出同一個事物概 念字詞,使得受測者在不同的問題中遭遇 相同的選項,而被迫思考回憶是否在先前 的題目中曾經出現並選擇過。另外,不同
的宗教信仰與政治立場也會對相同的事物 概念產生非常不同的情緒感受。這些干擾 性的因素都必須排除,以提高測試結果的 可信度。
我們根據這些前測所發現的問題,修 正了問卷內容。最後的問卷共包含六個測 試題目,其中害怕與高興兩種情緒各三 題,分別提供三個關聯強度(高、中、低) 等級的事物概念選項群組,每一個選項群 組為經由四個關聯指標各自篩選出六個事 物概念字詞的聯集。也就是說,我們將原 來每個關聯指標各自篩選選定等級的事物 概念字詞,以聯集的方式,合併為在同一 題目的選項中,包含由不同指標所篩選出 的相同等級的事物概念字詞。這樣的處理 方式並不影響我們評估指標效能的目的,
因為我們仍然可以依照某一個選項是由哪 些指標提出及該選項是否被測試者選擇等 資訊,估算個別指標的關聯強度篩選成 效。圖五為實際問卷中的其中一題,選項 的代表字詞既為事物概念字詞(上位詞),
括弧中的字詞為屬於該上位詞並在文本中 出現的一般事物字詞。
圖五:部分問卷內容 (三) 結果呈現與分析討論
我們以大學校園內的人員為問卷實施 對象,實際參與實驗的受測者為年齡介於 18 歲至 50 歲之間的大學生、研究生及行 政人員,共 91 人,男女比率約為 2 比 1。
依照統計學的原理,受測人數 91 人乃屬於 抽樣調查的大樣本,較能代表真正的母體 現象。
我們使用假說檢定驗證關聯強度指標 的作用,虛無假說 H0(null hypothesis)為:
依據關聯強度指標選出不同等級之事物概
念群組之間,在一般人的情緒感受認知上 沒 有 差 異 ; 而 對 立 假 說 H1(alternative hypothesis)為:依據關聯強度指標選出不 同等級之事物概念群組之間,在一般人的 情緒感受認知上有所差異。也就是說,我 們將從問卷結果的統計上,觀測我們定義 的關聯強度指標是否能正確的區辨事物概 念與特定情緒的關連性,例如:高關聯度 的事物概念是普遍的受測者認為在某個特 定情緒下會發生的,或是受測者會因為這 些事物概念而引發出特定的情緒;而低關 聯度的事物概念是普遍的受測者認為在某 個特定情緒下可以排除的,或是受測者不 會因為這些事物概念而引發出特定的情 緒。我們期望調查結果能在統計上拒絕虛 無假說 H0,而接受對立假說 H1,以證實 我們提出的關聯強度指標能確實篩選出與 指定情緒符合的事物概念。
我們首先呈現害怕情緒的事物概念關 聯選擇統計結果,表二、表三、表四分別 為與害怕情緒有高、中、低三個關聯等級 之事物概念,在未告知受測者其關聯程度 之等級差異的情形下,由受測者依據個人 主觀經驗與認知所作之選擇結果。
表二:害怕情緒之高關聯概念測試
概念 勾選比 指標依據 概念 勾選比 指標依據 慌張 0.73 M, V, C 粗暴 0.45 C 危險 0.70 D,C 孤單 0.37 D
怯懦 0.65 C 仇人 0.30 M
動盪 0.60 D 彈藥 0.30 V
逃跑 0.59 M, V, C 革命 0.24 V
緊張 0.52 D 變化 0.14 V
被害人 0.49 M, V 助手 0.02 M
強盜 0.47 M 表示 0.01 D
擔心 0.45 D, C
表格中之勾選比皆為選擇該概念之人 數與總受測人數之比率,而指標依據則為 該概念是由哪一個關聯指標所篩選出的。
每一個指標皆選出六個指定關聯等級之事 物概念,由於部份概念同時由兩個或三個 指標選出,所以,三個等級的事物概念總 數皆不到 24 個,而分別是 17 個、22 個、
20 個。如果我們以 30%的勾選比率為與一
般人認知的符合程度之門檻,我們發現表 二 的 高 關 聯 強 度 群 組 中 , 有 13/17( 約 76.5%)的比率是符合的。但同時,表三的 中關聯強度與表四的低關聯強度的群組中 也各有 2/24 (約 8.3%)與 2/22 (約 9.1%) 的比率被選出為與害怕情緒有關。
表三:害怕情緒之中關聯概念測試
表四:害怕情緒之低關聯概念測試
概念 勾選比 指標依據 概念 勾選比 指標依據
槍 0.73 D 認為 0.03 C
異常 0.36 M 希望 0.02 M, V, C 勇敢 0.09 D 一生 0.02 M
車 0.07 V, C 房間 0.02 V 男人 0.06 M 和睦 0.02 C 時間 0.05 M 寶物 0.01 D 工廠 0.04 D 臉 0.00 D 發電站 0.04 D 母 0.00 M, C
話 0.04 V 方法 0.00 V
體制 0.03 V 通信器材 0.00 C
另外,反向來看,若我們以 5%以下 的勾選比為認定可排除與害怕相關的門 檻,表二的高關聯強度與表三的中關聯強 度的群組中,各有 2/17 (約 11.8%)與 14/24(約 58.3%)的比率是應該被排除的,
而 表 四 的 低 關 聯 強 度 的 群 組 中 則 有 17/22(約 77.3%)的比率可被選出為與害怕 情緒無關。由以上的數據分析可以推知,
高關聯強度與低關聯強度在害怕情緒方 面,大約有七成至八成左右的可信度,可 以用來挑選或排除害怕情緒的因素,但也 各有約一成左右的失敗率。另外,中關聯
強度的意義不大,也無明顯的區辨作用。
表五:四個指標之害怕情緒平均勾選比
關聯 等級
距離強度 (D)
相互訊息 (M)
概念變異 (V)
綜合指標 (C)
高 0.442 0.433 0.415 0.595
中 0.183 0.042 0.033 0.080
低 0.152 0.085 0.030 0.023
我們接著觀察四個指標對害怕情緒個 別的關連程度區辨效能,表五為在不同關 聯強度的群組中,個別指標選出的害怕情 緒事物概念的平均被勾選比。同樣的,若 以 30%的勾選比率為與一般人認知的符合 程度之門檻,在高關聯等級的群組中,四 個指標皆能達到目的,但綜合指標的成效 明顯領先;而以 5%以下的勾選比為認定 可排除的門檻,只有概念變異與綜合指標 能得到效果。整體而言,綜合指標對害怕 情緒所提供的區辨效能較佳。
表六:害怕情緒測試結果之 ANOVA 分析
Sum of
squares df Mean of
squares F Sig.
D BG WG Total
166.24 248.62 414.86
2 270 272
83.12
0.92 90.271 0.000 M BG
WG Total
305.06 289.65 594.71
2 270 272
152.53
1.07 142.184 0.000 V BG
WG Total
323.10 286.77 609.87
2 270 272
161.55
1.06 152.103 0.000 C BG
WG Total
648.67 293.89 942.56
2 270 272
324.44
1.09 297.969 0.000
最後,我們進一步的以變異數分析 (Analysis of Variance - ANOVA)來檢測四 個指標是否在受測者於不同群組之間的反 應差異具有顯著性,也就是說,我們將檢 測調查結果的數據,在彼此的差異上,是 否具備統計上的顯著性,以決定是否拒絕 虛無假說,而接受對立假說。表六為針對 害怕情緒事物概念被勾選次數的 ANOVA 分析結果,其中 Between Groups(BG)為組 間變異,Within Groups(WG)為組內變異。
以 距 離 強 度 指 標 來 看 , F(2, 270) = 90.271, p < 0.01,代表在 99%的信心水
概念 勾選比 指標依據 概念 勾選比 指標依據 闖禍 0.96 D 看 0.02 V
沖 0.39 C 使用 0.02 V
內 0.10 V 學生 0.02 D
相遇 0.10 M 生活 0.01 D 發生 0.10 M 中 0.01 M, V, C 領導 0.08 D 城市 0.01 V 對象 0.04 V 製造 0.01 C 事情 0.03 D 根據 0.01 C 想法 0.03 M 時期 0.01 M 生物 0.03 C 了解 0.00 D 內容 0.03 C 富翁 0.00 M
準之下,數據上的差異是具有統計上的意 義的,也就是說,觀測到的差異的確可以 代表實際現象的差異。其他三個指標的 F 值更高,代表其觀測到的群組之間差異更 顯著,也更強烈的証實其差異區辨效果。
因此,我們可以拒絕虛無假說,而接受對 立假說,驗證了四個指標的確能提供關聯 程度的區辨功能,而其中的綜合指標成效 最好,與之前的觀察分析結果吻合。
表七: 高興情緒之高關聯概念測試
表八: 高興情緒之中關聯概念測試
我們接著呈現高興情緒的事物概念關 聯選擇統計結果,表七、表八、表九分別 為與高興情緒有高、中、低三個關聯等級 之事物概念由受測者選擇的結果。若仍然 以 30%的勾選比率為與一般人認知的符合 程度之門檻,我們發現表七的高關聯強度 群組中,只有 12/21(約 57.1%)的比率是符
合的。同時,表八的中關聯強度與表九的 低 關 聯 強 度 的 群 組 中 也 各 有 9/23( 約 39.1%)與 2/19 (約 10.5%)的比率被選出為 與高興情緒有關。另外,若仍然以 5%以 下的勾選比為認定可排除與害怕相關的門 檻,表七的高關聯強度與表八的中關聯強 度的群組中,各有 2/21(約 9.5%)與 6/23 (約 26.1%)的比率是應該被排除的,而表 九的低關聯強度的群組中則有 12/19(約 63.2%)的比率可被選出為與高興情緒無 關。
表九: 高興情緒之低關聯概念測試
由以上的數據分析可以推知,高關聯 強度與低關聯強度在高興情緒方面,大約 有六成上下的可信度,可以用來挑選或排 除高興情緒的因素,但也各有約一成左右 的失敗率。另外,中關聯強度的意義不大,
也無明顯的區辨作用。
表十:四個指標之高興情緒平均勾選比
關聯 等級
距離強度 (D)
相互訊息 (M)
概念變異 (V)
綜合指標 (C)
高 0.377 0.488 0.237 0.285
中 0.105 0.098 0.310 0.375
低 0.080 0.030 0.090 0.043
我們接著觀察四個指標對高興情緒個 別的關連程度區辨效能,表十為在不同關 聯強度的群組中,個別指標選出的高興情 緒事物概念的平均被勾選比。同樣的,若 以 30%的勾選比率為與一般人認知的符合 程度之門檻,在高關聯等級的群組中,只 有二個指標能達到目的,其中相互訊息的
概念 勾選比 指標依據 概念 勾選比 指標依據 福氣 0.89 M 閱讀 0.34 D, C 和睦 0.75 D 遊戲 0.26 M 逍遙 0.71 M 合併 0.23 V, C 健康 0.58 M 空前 0.22 D 女人 0.49 V 球 0.17 V, C 情致 0.49 C 來源 0.15 D 和緩 0.45 M 事情 0.13 V 演奏 0.41 D 居住 0.13 C 值得 0.39 D 講話 0.05 V 商店 0.35 V 豐富 0.04 M
打球 0.35 C
概念 勾選比 指標依據 概念 勾選比 指標依據 行樂 0.69 C 比賽 0.12 M 充滿 0.63 V 父 0.11 D 眷屬 0.48 V 描寫 0.08 D 歌 0.39 C 鏡頭 0.07 V 團聚 0.37 C 意味 0.06 M, V 幻想 0.35 C 過程 0.05 D 感覺 0.34 V 尋找 0.04 D 顏色 0.33 M 教師 0.04 D 返回 0.31 D 訓練 0.04 M 波浪 0.28 V 意思 0.02 M 活 0.24 C 作戰 0.02 M
灘 0.21 C
概念 勾選比 指標依據 概念 勾選比 指標依據 景象 0.39 V 頁張 0.03 D 五穀 0.31 D 災禍 0.03 M, V 主持 0.12 D 動盪 0.02 M, C 謹慎 0.08 C 擔心 0.02 M 醫治 0.06 M 危險 0.02 M, C
決意 0.06 V 暗 0.01 D
革命 0.06 C 文件 0.01 D 避免 0.05 C 庸人 0.00 D 煩悶 0.03 M,V 江河 0.00 V 憂愁 0.03 V, C
成效較好;而以 5%以下的勾選比為認定 可排除的門檻,只有相互訊息與綜合指標 能得到效果。整體而言,相互指標對高興 情緒所提供的區辨效能較佳。
表十一:高興情緒測試結果 ANOVA 分析
Sum of
squares df Mean of
squares F Sig.
D BG WG Total
178.38 353.60 531.98
2 270 272
89.19
1.31 68.103 0.000 M BG
WG Total
755.36 349.50 1104.86
2 270 272
377.68
1.29 291.776 0.000 V BG
WG Total
83.23 362.31 445.54
2 270 272
41.62
1.34 31.013 0.000 C BG
WG Total
184.62 426.00 610.62
2 270 272
92.31
1.58 58.505 0.000
表十一為針對高興情緒事物概念被勾 選次數的 ANOVA 分析結果,其中 Between Groups(BG) 為組間變異, Within Groups (WG)為組內變異。四個指標的 p 值皆小於 0.01,代表在 99%的信心水準之下,數據 上的差異是具有統計上的意義的,也就是 說,觀測到的差異的確可以代表實際現象 的差異。其中,相互訊息的 F 值最高,代 表其觀測到的群組之間差異最顯著,支持 其較佳的差異區辨效果,與之前的觀察分 析結果吻合。
綜合以上的實驗結果,對於害怕情緒 的事物概念關聯程度辨別能力,四個指標 大約有七成至八成左右的可信度,但也約 一成左右的失敗率,其中表現最好的是綜 合指標,其次為相互訊息。在高興情緒方 面,四個指標約有六成上下的可信度及約 一成左右的失敗率,其中表現最好的是相 互訊息,其次是距離強度。四個指標在害 怕與高興兩種情緒上的事物概念關聯程度 區辨能力有所差異,可能是由於兩類情緒 詞的數量之不同所造成。本次實驗中所採 用的害怕類情緒詞共有 12 個,而高興類情 緒詞則有 22 個(見表一),因此,與高興情 緒關聯之事物概念可能產生較為發散的現 象,而影響了指標的表現,並使其可信度 降低。綜合兩類情緒的實驗結果,四個關 聯強度指標當中,以相互訊息的表現較穩 定,而概念變異的效果較差。
整體而言,我們認為這個實驗結果大 致上驗證了本研究目的與方法的可行性。
我們從情緒情境概念共現網路所取出的不 同關聯等級的概念群組中,以受測者主觀 判斷的方式認定其合理性的存在,證明了 從文本中取得情境資訊的可能性。
五、結論與未來研究
本研究以情緒為情境資訊之焦點,嘗 試從大量文本中建立人的情緒與事物概念 之關聯性,並以問卷調查驗證其關聯是否 符合一般之情緒感受認知。我們以情緒詞 與特定詞性之字詞為節點,將文本轉換為 網路結構,同時,提出四個節點關聯指標,
以評估特定情緒節點與相關事物概念節點 之關聯強弱。實驗結果顯示,本研究方法 能有效的從文本中取得影響人的情緒之事 物概念之相關資訊。
本研究以文本中情緒詞與事物概念詞 之共現關係為基礎而建構其關聯性,尚未 考慮彼此真實的語意關係,例如,可能的 否定關係或更深入的從屬關係。因此,本 研究得未來延伸將朝向語意關係的辨識,
以強化情境資訊之準確性。本研究之意義 為開創以語言文本與情境資訊來源之初步 探討,相關議題的研究發展,也將為情境 資訊的有效建立與應用帶來後續的進展。
誌謝
本研究獲得國科會計畫 NSC96-2422-H- 004-001 及 NSC95-2627-E-004-002 之部分 資助,特此誌謝。
六、參考文獻
[1] “中文一詞泛讀”,
http://elearning.ling.sinica.edu.tw/, accessed date: May 15, 2007.
[2] 林宇中,“基於語意內容分析之情緒分
類系統”,國立成功大學資訊工程研究 所,碩士論文,2003。
[3] 高臺茜、倪珮晶,“華語文網路言論負
向情緒用詞檢核軟體研發”,第三屆全 球華文網路教育研討會(ICICE2003) 論文集,第 393-402 頁,2003。
[4] N. Bradley and M. Dunlop, “Toward a multidisciplinary model of context to support context-aware computing”, Human Computer Interaction, Volume 20, pp. 403–446, 2005.
[5] G. Chen and D. Kotz, “A survey of context-aware mobile computing research”, Technical Report TR2000- 381, Dept. of Computer Science, Dartmouth College, U. S. A., 2000.
[6] H. Chen, T. Finin, A. Joshi, “An ontology for context-aware pervasive computing environments”, Knowledge Engineering Review, Vol. 18:3, pp.
197-207, 2004.
[7] K. Church and P. Hanks, “Word association norms, mutual information, and lexicography”, Computational Linguistics, Vol.16, No. 1, pp. 22-29, 1990.
[8] A. Dey, G. Abowd, and A. Wood,
“CyberDesk: a framework for providing self-integrating context-aware services”, Knowledge-Based Systems, 11, 3–13.
1999.
[9] C. Izard, D. Libero, P. Putnam, and O.
Haynes, “Stability of emotion
experiences and their relations to trait of personality”, Journal of Personality and Social Psychology, Vol. 64, pp.847-860, 1993.
[10] H. Liu, H. Lieberman, and T. Selker, “A
model of textual affect sensing using real-world knowledge”, Proceedings of the 8th International Conference on Intelligent User Interfaces, pp.125-132, New York: ACM Press.
[11] C. Ma, H. Prendinger, and M. Ishizuka,
“Emotion estimation and reasoning based on affective textual interaction”, Proceedings of the 1st International Conference on Affective Computing and Intelligent Interaction, Springer LNCS 3784, pp 622-628, 2005.
[12] T. Moran and P. Dourish, (Eds.)
“Introduction to context-aware computing”, Human Computer Interaction, Vo. 16, pp. 87–95, 2001.
[13] A. Schmidt, “Implicit human computer interaction through context”, Personal and Ubiquitous Computing, Vol. 4, No.
2-3, pp. 191-199, 2000.
[14] H. Seyle, “Stress without distress”, New York: Signet, 1974.
[15] P. Singh, “The public acquisition of commonsense knowledge”, Proceedings of AAAI Spring Symposium, pp.47-52, 2002.
[16] D. Watson and L. Walker, “The long-term stability and predictive validity of trait measures of affect”, Journal of Personality and Social
Psychology, Vol. 70, pp.567-577, 1996.
[17] H. Witten and E. Frank, “Data Mining:
practical machine learning tools and techniques”, 2nd edition, Morgan Kaufmann, San Francisco, 2005.